云计算 = “潘多拉”?
作者
王孝威:FinOps 认证从业者,热衷传播 FinOps 理论和实践知识,助力云上企业降本增效。
云计算时代已经到来
云计算时代真的到来了吗?
云计算(Cloud Computing),从 2006 年 AWS 第一次推出弹性计算云服务,已走过十五年风雨历程。早期被指责成“新瓶装旧酒” 的炒作,后来引发了人们对云上数据隐私的担忧,再到对公有云偶发事故的嘲笑,云计算的成长一直饱受骂名,但云计算市场现状究竟如何?
从中国市场主流软件来看
可能你已经注意到,在部分国民软件的启动页,会看到最下面有个标识:“某某云提供计算服务”。云计算已经渐渐融入了生活,例如想聊天了打开通信软件、无聊了想听歌看视频、饿了想点外卖、找不到方向想看地图,这些软件的启动页下面可能都有一行字:“某某云提供计算服务”,云计算已经给生活带来了无穷便利。
从全球云计算市场规模来看
公有云在每年超过 1000亿美元支出的基础上快速增长,2020 年全球共有云市场份额已经超过 1250 亿美元,云计算正在化茧成蝶。
图1:企业在公有云和数据中心的花费
图源: Synergy Research Group
为什么云计算市场“爆发”了?
云计算把所有的计算、存储、网络等资源都抽象成了资源池,如下图2所示。需要用这些资源时只需要在公有云的平台网站上用手指点点点,资源触手可及。这就像你住的家里接通了水、电、网络,只需要打开开关,就能享受现代生活的便利。云计算极大的方便了企业在发展过程中对资源的消耗,无需再提前购买资源、组建团队、专门运营,需要资源只需要在公有云平台上注册一个账号,就可以直接使用多样化的资源服务。
图2:云计算将企业需要的资源抽象成了随手可得的水电
潘多拉魔盒已经打开
云计算 = “银弹”?
如图3所示,现代家庭需要管理的一般都是小范围资源的开关,例如一个家庭一般只有几个水龙头、数十个开关和插头、以及一个网络入口,水和电一般都是随用随开、按量付费,网络则是包年包月。水龙头一般会记得关,但很多开关会时会常忘记,例如空调、电视等等,每次较电费时会“心痛不已”。同样的,如果使用个人电脑或者云上的资源做一个小的项目时(例如学校的软件作业),可以自己控制项目的启停。如果忘记关闭项目,因为项目本身会消耗资源,个人电脑就会变卡、如果项目在云端运行,则会持续产生费用。
如果从现代家庭上升到城市维度,城市管理需要管理的“开关”、“插头”和“网络”成千上万。同样的,如果运行的项目从传统的个人小项目上升到例如微信这样的国民应用,需要消耗的资源也是指数级增长的。如此庞大的资源管理量,用现代家庭(小项目)的资源管理方式可能无法应对,而且管理不当会造成较大浪费。
图3:现代城市的资源管理难题
从企业资源管理来看,以前一般都有自己的 IT 中心,企业看到到自己的设备、有清晰明确的设备购买流程、有折旧计算方法、有严格的资源审核逻辑、有完整的 IT 中心管理体系。云计算把 IT 中心虚拟化了,变成了纯线上的虚拟平台,让资源随时随地想用就用,这种可变的支出模型一旦没有好好利用,或者是忘记了关闭“开关”,浪费现象显著。如今的公有云,每家厂商都提供了数百种产品,每种产品下又有若干种不同的类型,客户对云资源的管理来产生了新的挑战。这个过程的转变,如果改变现有的管理手段?
要改变管理手段之前,可以先分析企业资源消费模型的变化,这里最主要的变化是:公司对 IT 资产的投入从传统的资本投资(Capital Expenses)变成了运营支出(Operating Expenses),这种变化主要表现为:
传统 IT 消费模型 | 云上可变消费模型 | |
---|---|---|
设备的购买流程 | 当项目团队的新项目需要硬件设备时,需要向财务部和采购部证明其项目是否有足够的商业化价值,通过了才能申请经费、订购设备 | 任何授权的项目团队成员可以随时随地购买云资源,财务部和采购部失去了管理的作用 |
角色关系 | 工程师是申请者; 财务部/采购部是审核批准者 | 工程师可以随时随地购买云资源 spend money with code; 财务部/采购部对花费没有清晰的可见性,失去了监管作用; 且不同角色之间缺少了沟通 |
消费 | 可预测(根据预测提前购买设备); 静态的(在下次采购之前都不会发生变化) | 不可预测的(随时购买设备); 动态的(随时随地可能有变化) |
购买周期 | 较长 | 即时 |
失败成本 | 大 | 小,但可能造成浪费 |
项目敏捷 | 低 | 高 |
支出模型 | 资本投资(Capital Expenses),像投资一样提前批量购买设备 | 运营支出(Operating Expenses),像运营一样随时按需购买设备 |
表1:公司对 IT 资产的消费模型变化
因此,如果管理方式没有进化,“上云”反而可能成为一种负担。Flexera 发布的《2021 云计算市场发展状态报告》指出,企业上云后平均浪费了 30% 的云支出,云成本优化是企业 2021 年最想做的事情。
图4:Flexera 调研企业在 2021 年最想做的关于云的事情
潘多拉魔盒(潘多拉盒子,pandora's box)是一则古希腊经典神话。众神赠予了潘多拉一个魔盒,盒子里面包含人世间所有邪恶——贪婪、虚伪、诽谤、嫉妒等等。云计算虽然让企业过上了资源随时随地即开即用的“现代生活”,但因为其余的配套系统(管理方式、人员培训、运营手段)没有及时跟进,云计算像一个潘多拉盒子一样,给企业也带来了很多难题。本文主要探讨企业上云后最大的问题:如何有效优化云的使用成本?
盖上潘多拉魔盒
魔盒如何关闭?
新的企业 IT 消费模型需要新的管理手段,该方案应该是能够覆盖人员、流程和技术的管理,是专门针对云上可变消费模型的治理方案,确保客户在云上花费的每一元获得最大价值。
如果该方案还可以结合客户自己的商业化指标给出决策性建议,(例如:公司在云上有十个项目,发现2个项目的云资源消耗金额远小于项目的收入,可以考虑是否应该为这两个项目投入更多的资源?发现有3个项目的投入产出比一直在扩大,考虑这三个项目是否该做些调整?)。这样就可以帮助企业如何利用云计算赚钱,而不是一味的追求省钱,充分发挥云计算的价值,将潘多拉魔盒关闭。
于是,基于企业对云上成本管理诉求的分析,总结如下:
- 看得见:让企业理解自己的用量和成本
- 项目维度:具体到每一个项目/服务的成本
- 人员维度:具体到每一个组织架构/团队/人员的成本
- 自定义维度:每一个自定义维度的成本(例如:某一具体云资源的用量;多个团队的成本聚合;不同时段的成本对比;成本趋势图等等)
- 用得省:提供建议优化成本
- 手段:云上资源的付费类型、机型推荐,识别并清理闲置资源,定义预算告警等
- 策略:简化配置优化动作和策略(例如:当机型不合适的时候提示用户手动更换推荐的机型)
- 评估:不同手段的优化收益&风险(例如:对比新旧机型的价格差异;清理闲置资源时可能对波峰流量无法承载的风险)
- 自动化:自动化执行优化策略和告警
- 持续运营:持续基于商业策略优化成本
- 预测:预测未来的成本,预测通过手段优化后的成本变化
- 衡量:如何将成本与项目的 KPIs 结合,衡量项目的投入产出比
- 架构:如何将成本对应公司不同等级的组织架构
- 决策:如何利用洞察的指标帮助项目/公司做更好的决策
企业云成本管理的问题已经抛出,是否有一种有效的手段可以完全的解决以上所有问题?
FinOps(Financial Operations)就是这样的一种最佳实践,帮助云上客户有效洞察云支出、提供手段优化用户成本、以及后续长时间的持续运营和优化。FinOps 涉及的领域:
- 理解云支出和成本(对应企业成本管理问题的“看得见”,帮助企业理解成本构成)
- 回答这样的一个问题:企业在云上花费了什么?
- 收集有关云使用和成本的所有必要信息,并将其分配到每一个人身上,理解团队中每一个项目/人关于云资源的使用情况
- 性能追踪和基准测试(对应企业成本管理问题的“持续运营”,帮助企业理解自己的成本是否用的对)
- 回答这样的一个问题:正在使用/支出的云资源是否使企业能够实现其战略和组织目标?
- 设置其使用情况和成本并将其映射到预算中,使用历史信息进行预测,并建立和衡量关键绩效指标和其他绩效指标。
- 实时制定决策(对应企业成本管理问题的“持续运营”,帮助企业做决策)
- 回答这样的一个问题:采取什么行动来更好地实现企业的目标?
- 当企业了解支出,并了解相对于预期和标准的表现时,企业可以在收到新的云支出信息时使用这些信息做出实时决策。
- 云上支出优化(对应企业成本管理问题的“用的省”,帮助企业选择更合适的云资源)
- 回答这样的一个问题:如何改变企业支付的费用模型(包年包月/按量付费/竞价实例),以及如何购买在云端使用的东西(应该选择什么机型),以实现更好的价格目标?
- 利用历史使用的数据调整定价模型,帮助企业选择更合适的费用模型和机型实例。
- 云使用的优化(对应企业成本管理问题的“用的省”,帮助企业更有效管理自己的业务)
- 回答这样的一个问题:如何更改企业使用的云资源方式,以优化成本?
- 管理业务工作负载、以及云资源实例的数量,在不使用时关闭资源。
- 团结公司组织(对应企业成本管理问题的“持续运营”,帮助调整企业组织架构,以实现降本增效的文化)
- 回答这样的一个问题:可以在企业的组织内进行哪些更改,来更有效地使用云?
- 将 FinOps 与现有组织流程、组织单位和技术集成。
为什么是 FinOps?
FinOps 提出了非常详细的云上成本管理手段,包含下图5中的理念、原则、涉及的人员的分工、成本优化的阶段、涉及领域等。
FinOps 理念
FinOps 致力于通过一整套系统、最佳实践、文化,帮助企业去理解云成本,以实现更好的决策。
FinOps 原则
- 团队需要合作(团队主要包含:财务团队、技术团队、业务团队)
- 云的价值驱动了决策(帮助执行层洞察云上消费的价值所在,辅助其做决策)
- 每个人都要为自己消耗的云成本负责(将云成本分摊到每一人身上)
- FinOps 的报告应该是便于访问的、且是实时的(报告应该及时、人人可访问)
- 一个中心化的团队驱动了 FinOps 的云上成本管理理念(必须有一个全局观的团队将不同人员团结起来,使用 FinOps 的理念优化云支出)
- 利用云的可变消费模型(云的消费模式有其特殊使用方法,好好利用才能充分发挥作用)
图5:什么是 FinOps?
FinOps 的影响力
FinOps 基金会做了一个问卷调查,共收到 804 个回复,参与回复的企业总的年云支出超过 300 亿美元。超过 78% 的回访者指出:FinOps Foundation 是云上成本优化管理信息的最佳来源。
图6:云上成本优化管理的渠道
FinOps 全景图
FinOps 基金会是Linux 基金会的一个项目,致力于通过最佳实践、培训、制定标准来推进 云的财务管理。 2019年2月成立 FinOps 基金会,2020年6月加入 Linux 基金会。目前 FinOps 基金会包括来自 1500+ 企业的 3500+ 个人成员,包括 10+ 服务和平台提供商。
图7: FinOps 全景图
写在最后
云计算的时代已经到来,云上成本管理迫在眉睫,FinOps 中文社区将持续经营和传播 FinOps 相关的理念和知识,期待您的加入,让企业上云的价值会到初心 —— 降本增效。
参考:
The Cost of Cloud, a Trillion Dollar Paradox
https://www.atlassian.com/blog/platform/what-is-finops
https://www.finops.org/introduction/what-is-finops/
https://saasoptics.com/blog/what-is-finops/
关于我们
更多关于云原生的案例和知识,可关注同名【腾讯云原生】公众号~
福利:
①公众号后台回复【手册】,可获得《腾讯云原生路线图手册》&《腾讯云原生最佳实践》~
②公众号后台回复【系列】,可获得《15个系列100+篇超实用云原生原创干货合集》,包含Kubernetes 降本增效、K8s 性能优化实践、最佳实践等系列。
③公众号后台回复【白皮书】,可获得《腾讯云容器安全白皮书》&《降本之源-云原生成本管理白皮书v1.0》
【腾讯云原生】云说新品、云研新术、云游新活、云赏资讯,扫码关注同名公众号,及时获取更多干货!!