NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

“成本刺客”防不胜防,为何云成本如此难以驾驭?

  • 2023-03-31
    北京
  • 本文字数:4259 字

    阅读完需:约 14 分钟

“成本刺客”防不胜防,为何云成本如此难以驾驭?

达尔文曾说过“能够生存下来的生物, 既不是最强壮的, 也不是最聪明的, 而是最能够适应变化的物种。” 面对眼下经济的不确定性,很多企业在压力下,被动进入到“节衣缩食”的模式。推动企业减少支出,如何更好地“降本增效”更是上升为生存问题。


面对成本压力,企业不再一味地追逐前沿的技术,而是更加注重数字化投资的平衡成本与收益,以确保获得最大化的商业价值。然而,可怕的是,面对屡创新高的云支出,许多 IT 团队却找不到成本失控的源头。海外的部分企业由于上云后过高的 IT 成本,甚至一度掀起了“云回迁”的声浪。


如何能够在享受云计算这个巨大的创新引擎的同时又能够清晰度量云成本,不被“成本刺客”所伤?这一定是 2023 年管理者的数字化必答题。


为什么云成本如此难以驾驭?


事实上,云成本问题在近年来已经引起了很多企业管理者的重视,也有越来越多的企业通过优化资源使用来进行成本管控。可为什么“成本刺客”仍旧防不胜防呢?企业在云成本管理的过程中,主要面临四大痛点,可归纳为:投资看不清,成本不合理;大把资源闲置和资源浪费;难以动态响应市场创新业务需求和变化;业务 & 财务 &IT 对评估投资协作不佳 。由于本文面向的对象主要是技术管理者与开发者,因此,着重对大把资源闲置和资源浪费造成云成本失控的原因进行分析,主要有以下三点:


其一,是性能的浪费。由于缺乏明确的衡量指标和应对策略,很多企业难以评估其在云端的实际性能需求,往往会过度采购云资源或使用不必要的高性能服务。此外,在使用过程中,为了保证应用程序能够正常运行,工程师在配置云计算资源的时候也通常会选择过度配置。


其二,是闲置资源无法快速释放。由于企业需求的波动性,云资源的使用情况也会随之发生变化。但是,如果企业在使用云资源时没有采用自动化的管理策略,就会存在很多闲置的计算资源,导致企业付出了不必要的成本。


其三,是对数据存储缺少分级和分层管理。缺乏分级分层管理会导致数据存储在云环境中不受控制地增长,从而导致云成本的浪费。同时,由于没有对不同数据类型的访问频率和重要性进行分析,数据存储和备份的策略也无法有效地优化,从而增加了数据存储的成本和复杂度。


面对如此多“成本黑洞”,如果企业不谨慎管理其云计算资源,必然会付出惨痛的后果。去年,印度一家名为 Paytm 的电子商务公司就因未能有效管理云计算资源而导致云成本相比 2021 年急剧增长 400%。2022 年,美国航空公司 Delta Airlines 也因同样的原因而收到“天价”账单。对于一些初创公司而言,云成本管理不当造成的后果更为致命,海外初创公司 Milkie Way 曾因测试期间的疏忽,险些导致公司破产。


以上案例并非个案,云成本管理问题是普遍存在的。Gartner 的一份报告指出,云成本浪费是全球公有云市场的主要问题,估计云成本浪费率约占总支出的 30%。451 Research 的研究表示,80%的受访者认为与云成本相关的不良管理已对其业务产生负面影响。



“成本刺客”如何退!退!退!


当一种现象成为整个市场的痛点,必然会催生出一系列应对的方法和举措。FinOps 的理念正是以此诞生并得到快速发展的。


FinOps 是指管理和优化云计算成本的一种方法论和实践,旨在帮助组织更好地理解和控制其云计算支出。其核心理念是让所有涉及云计算成本的部门(开发、IT、财务等)更加紧密的协作,以便更好地进行成本控制,实现的手段包括建立透明度、监控和分析云资源的使用情况、采用自动化工具和流程等。


早在 2017 年 Joe Kinsella、J.R. Storment 等人就在亚马逊云科技的 re:Invent 大会上提出过该理念。当时他们认为,随着越来越多的企业将工作负载迁移到云上,云计算成本管理问题将会变得越来越复杂。因此他们创建了 FinOps Foundation 社区,致力于帮助企业更好地管理和控制云计算成本。随着时间的推移 FinOps 社区吸引了越来越多的人,其中包括亚马逊云科技、Microsoft、Google 等云服务提供商代表和其他企业的 FinOps 专家。


FinOps 说到底是一种概念,具体的实践与落地还是需要切实可行的工具和方案来推动。早期 FinOps 相关的产品主要是由多云管理的商业化公司推动,近两年云厂商也加入了推动 FinOps 向前发展的队伍。海外市场亚马逊云科技推出了 FinOps 工具,如 Amazon Cost Explorer、Amazon Budgets 等。国内市场头部云厂商也相继发力,阿里云推出 ACK FinOps 套件、腾讯云推出成本优化开源项目 Crane 等。


一般来说,由云厂商提供的 FinOps 产品更便于与其自身的云平台进行深度整合,便于快速访问和管理资源,可靠性和安全性更高且更具价格竞争力。唯一不足的是,由于不同云厂商间存在壁垒,因此,该类产品通常只适用于特定的云平台。



一个战略,七大路径,实现云上降本增效


近年来,云服务提供商致力于将 FinOps 相关的工具和产品整合,形成了完整的云财务管理(CFM)战略。其中以 FinOps 领军者亚马逊云科技的云财务管理(CFM)战略最具代表性。亚马逊云科技 云财务管理(CFM )战略经历了从基础设施成本管理到应用程序与业务成本管理,再到如今提供一站式成本管理几个阶段,已发展得十分完善。


整个战略有四大核心,分别是:成本可见性、成本优化、规划与预测和云财务运营。



在成本可见性方面亚马逊云科技 云财务管理(CFM)建立了查看、度量与评估的一整套体系,通过云价值成本可视化报告,提供更加细颗粒度的核算,精细化进行成本管理。在成本优化维度,该战略强调弹性优化和利用资源。通过拍卖机制,以低成本的竞价方式购买闲置资源从而降低采购成本,以分层管理的形式更有效地利用存储资源,此外,无服务器模型根据调用次数计费,避免闲置计算资源的浪费。


在规划与预测的策略上,该战略采用数据驱动的预测分析,从而清晰可见地预测短期 / 长期成本,并通过架构优化服务,使云支出预测的准确性提升 35%。在云财务运营上,亚马逊云科技主张借助云财务管理(CFM)搭建云商数字化联合团队,财务、技术、业务从高层的战略目标开始合作规划,优化技术支出,把成本聚焦在可以为业务带来竞争力的 IT 计划。


该战略具体是如何实践起来实现云上降本增效的呢?亚马逊云科技将其归纳为七条切实可行的方法,针对性的解决了因用量痛点导致的成本失控


避免性能的浪费


  • 选择符合应用需求和预算的实例类型


上云是否能带来更低的成本?答案必然是肯定的。但误区在于很多企业只是迁移到了云端,而没有进行后续的调整,那么,效果必然会受到影响。云厂商通常都提供有多种类型的实例,仅亚马逊云科技提供的实例类型就有 600 多种,选择最适合工作负载的实例配置,并根据需求变化不断调整实例的类型,能够有效消除未使用资源的间接成本。


  • 选择最适合预算的采购模式


不同的计费模式也会影响云计算资源的使用和费用。云服务提供商提供的最常见的计费模式有按需付费、预付费、混合计费模式等等。一般来说,按需付费适合于对资源使用量不确定的企业,但其成本相对较高。而预付费则适合有长期稳定的资源使用的企业,通过预先支付一定费用,获得更高的资源使用量或者折扣。混合计费模式则是将前两者进行结合,以更好地平衡成本和灵活性,企业需要合理评估不同计费模式的优缺点,选择最适合自己的模式。


  • 迁移到 Amazon Graviton,获得广泛应用的最佳性价比


相比计费模式需要企业合理的对自身情况进行评估,服务的选择则更具规律性。一般来说,新的计算与存储服务,往往会拥有更高的性能与更低的成本。绝大多数的云服务都遵循这样的优化方向。例如,亚马逊云科技新一代处理器 Amazon Graviton 就比同类的前一代基于 X86 的实力的性价比提高了 40% 以上。


  • 在亚马逊云科技上构建和运行您的应用程序


事实上,不仅仅 Amazon Graviton 有如此大规模性价比的提升,自成立以来,亚马逊云科技就将成本节约列为了首要任务之一,通过与处理器制造商合作、自研芯片等多样性的方式,亚马逊云科技在提升其服务性能、安全性、加速创新的同时已将价格降低了 115 次。


闲置资源快速释放


  • 利用无服务器计算优化成本并加速创新


云平台提供了强大、高性价比的计算和存储资源,以满足各种应用程序的需求。然而,许多应用程序在不同的时间段内需要不同程度的资源。采用无服务器技术可以将计算资源分配到需要的时间和地点,从而优化资源利用率,减少了成本。此外,无服务器计算高可用性、弹性、灵活等特点,也能够为企业提供更好的计算体验。


  • 优化你的资源能力以适应需求


除了采用最新的服务和技术,优化资源适应需求的能力也至关重要。过度配置资源会导致不必要的基础设施成本,而配置不足则会导致应用程序性能不佳。利用 Amazon Compute Optimizer 和 Amazon Auto Scaling 两项服务就能够精准进行配置,帮助用户应对需求的变化。


对数据存储缺少分级和分层管理


  • 利用亚马逊云科技存储,优化您的工作负载成本


针对数据存储缺少分级和分层管理导致资源浪费的问题,亚马逊云科技也给出了相应的优化方法。Amazon S3 Intelligent-Tiering 在 Amazon S3 的基础上可以自动将对象分层,实现更精细的数据分层和更高效的存储资源利用。而 Amazon EBS 和 Amazon EFS 则提供了多种不同性能和成本的存储类型,用户可以根据业务需求进行选择,以实现更加精细的资源分层和更低的成本。通过 Amazon EFS 智能分层技术,最高能将存储成本降低 92%。



综上可见,亚马逊云科技 云财务管理(CFM)是一套非常系统、灵活且完整的解决方案,能够帮助企业在不确定性中寻找确定方向,通过“ 云财务管理(CFM)”,真正认清云上业务价值,并持续演进。在 VUCA 时代更需敏捷转型,让“ 云财务管理(CFM)”快速匹配、指导业务发展,以抢得市场先机。


在过往的实践中,亚马逊云科技 云财务管理(CFM)的效果也得到了很好地验证。MicroStrategy 是全球最大的独立上市商业智能公司,提供领先的分析和移动软件平台。该公司通过采用亚马逊云科技 云财务管理(CFM)战略,将云计算的支出减少了 30%,每年节省 250,000 美元,提高了对云计算使用和支出的可见性,并用这部分省下来的费用将培训资源和平台增加了 50%。全球拥有数十亿游戏玩家的 Wildlife Studios 公司,应用亚马逊云科技提供的战略来优化云成本,了解云上使用情况,将每年的云成本支出减少了 45%。这样的案例在亚马逊云科技的客户中不胜枚举。


未来,随着越来越多企业上云进程的逐步加深,云成本管理的实践将会越来越普及。云财务管理(CFM)或许将成为许多企业必不可少的一项管理实践。当然,没有哪个战略或者方案是完美的。目前市面上的云成本管理解决方案仍面临缺乏统一行业标准的问题,使得企业难以进行比较和选择最适合他们的产品。随着新的技术的快速发展,云成本管理战略也需要持续发展和演变,以适应市场新的变化。



公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-03-31 14:284402
用户头像

发布了 56 篇内容, 共 26.3 次阅读, 收获喜欢 43 次。

关注

评论

发布
暂无评论
发现更多内容

再谈BOM和DOM(1):BOM与DOM概述

zhoulujun

JavaScript DOM BOM 对象模型 文档模型

再谈BOM和DOM(4):DOM0/DOM2事件处理分析

zhoulujun

DOM DOM事件 DOM0 DOM2

再谈BOM和DOM(6):dom对象及event对象位值计算—如offsetX/Top,clentX

zhoulujun

DOM event对象

实时个性化推荐(三十六)

数据与智能

算法 推荐系统

Vue进阶(幺叁捌):vue路由传参的几种基本方式

No Silver Bullet

Vue 路由 7月日更

7.24 杭州站 | 阿里云 Serverless Developer Meetup 开放报名!

Serverless Devs

云计算 阿里云 Serverless 云原生

5分钟速读之Rust权威指南(四十一)高级类型

wzx

rust

再谈BOM和DOM(7):HTML DOM Event 对象属性及DOM事件详细列表

zhoulujun

DOM DOM事件

算法大赛报名 | OMG!这些名企的真实数据竟用来battle

工赋开发者社区

算法 工业互联网

火爆 GitHub!这个图像分割神器开源了

百度大脑

百度 算法

字节取消“大小周”,管理者与员工的“灵魂争夺战"从未停歇

让区块链为“三张牌”赋能

CECBC

fil矿机怎么选择?用什么fil矿机比较好?

FIL矿机怎么买 fil挖矿

拥抱云原生,腾讯发布TCSS容器安全服务!

腾讯安全云鼎实验室

容器 云原生

保洁阿姨分享:腾讯架构师JDK源码笔记,13万字,带你飙向实战

Java架构师迁哥

再谈BOM和DOM(2):DOM节点层次/属性/选择器/节点关系/操作详解

zhoulujun

JavaScript DOM BOM 对象模型 文档模型

抖音打击刷量控评行为:数据造假是互联网行业的毒瘤

石头IT视角

GIS坐标系测绘原理:大地水准面/基准面/参考椭球体/EPSG/SRI/WKT

zhoulujun

GIS

物联网安全难题还需行业标杆来解

熵核科技

物联网安全

没想到我也可以入职阿里!二本毕业、两年crud经验,侥幸通过面试定级P6

Java架构师迁哥

架构实战营模块八作业

竹林七贤

再谈BOM和DOM(3):DOM节点操作-元素样式修改及DOM内容增删改查

zhoulujun

DOM BOM 文档对象 DOM结点操作 DOM增删改查

性能测试软启动初探

FunTester

性能测试 接口测试 测试框架 压力测试 测试开发

熵核科技,自主研发虚拟机赋能安全操作系统

熵核科技

支付安全 安全操作系统 物联网安全 eSIM安全

神来之笔,2021CTF内核漏洞精选解析

网络安全学海

网络安全 信息安全 CTF 安全漏洞 渗透测试·

JVM锁bug导致G1 GC挂起问题分析和解决

毕昇JDK社区

攒塑料袋,究竟是如何刻进中国人DNA的?

脑极体

Ta想做一粒智慧的种子

脑极体

医美行业哪个环节最赚钱?

石云升

行业分析 7月日更

三年开发经验,字节跳动抖音组离职后,一口气拿到15家公司Offer

Java架构师迁哥

再谈BOM和DOM(5):各个大流浪器DOM和BOM里面的那些坑—兼容性

zhoulujun

DOM事件兼容性

“成本刺客”防不胜防,为何云成本如此难以驾驭?_服务革新_张雅文_InfoQ精选文章