写点什么

3 年不用云能节省 4 亿美元!想知道我们为什么敢不用 AWS 吗?

作者:Efim Mirochnik

  • 2023-04-20
    北京
  • 本文字数:3389 字

    阅读完需:约 11 分钟

3年不用云能节省4亿美元!想知道我们为什么敢不用AWS吗?

最近,用于 IT 基础设施的云非常流行,上云也已经成为一种趋势。基础设施即服务(IaaS)云提供了多种优势:灵活性、短部署时间、易扩展、可全球诸多地区即时存在……


云服务提供方通过提供方便且普遍易用的服务已经成为资深技术服务外包,凭借其出色的营销、大会、认证和精心挑选的的用例场景,轻易地让人们相信云才是现代企业技术的唯一合理目标。


但有时,这些外包云效益的成本却能高上天。如此之高的成本让我们开始忧虑,如果将基础设施百分比上云,我们的业务是否还能存在。由此引出了我们对此切实的比较,答案就在本文之中。


Ahrefs 自身硬件概览


Ahrefs 在新加坡租用了一个基础设施相当单一的主机托管数据中心。因此,我们选择汇总这个数据中心的所有费用,除以服务器的数量,并与可以被看作是世界领先的 IaaS 示例的亚马逊网络服务(AWS)云中等价安装模式的费用进行比较。



Ahrefs 的服务器


我们的硬件还算是比较新。2020 年中新冠封锁高峰期签订的代管合同,其他所有安装的设备都是在这之后购入的。数据中心的服务器上也有类似的配置,唯一的区别在于两代核心数量相同的 CPU。我们用的是高核心数的 CPU,2TB 内存,以及每台服务器的 2x 100 Gbps。平均下来,我们的服务器有大约 16x 15TB 的驱动。


对至于每月的成本,假设所有的硬件将只使用五年,超过五年的使用都视作是“免费”,那么,每月初始设备的成本是就是原始价格除以 (5 * 12 = 60 个月)。


目前,包括租金和电费在内的所有费用都是统计截止至 2022 年 10 月之前的,虽然我们也受到通货膨胀的影响,但把这点也考虑进去只会让计算更为复杂,因此我们暂时忽略了这一点。


我们的主机托管费用包括两个主要部分:租金和事实消耗的计量电力。自 2022 年初以来,电价已大幅上涨。我们这里计算使用的是最近、也最为高昂的电费,而非使用整体租凭期间的平均电费,因此,计算结果会相较实际略高。这对 AWS 来说算是优势。


此外,我们的费用还包括数据中心和我们的所在点之间的网间结算(IP Transit)以及裸光纤。


下表展示了我们平均每月每台服务器的支出情况。服务器硬件占据整月支出的三分之二,而数据中心租金与电力(DC)、互联网服务提供商(ISP)与网间结算、暗光纤(DF)和内部网络硬件(Network HW)则占剩余的三分之一。



我们自身的公司内硬件成本结构

AWS 的成本结构


我们这次分析的主机托管位于新加坡,因此我们会对比 AWS 在亚太(新加坡)地区的价格。


AWS 的成本结构与主机托管不同。可惜 AWS 没有与我们核心数量相同的 EC2 实例,因此我们选择两个具有一半数量的内核加上 1 TB 内存的 EC2 配置成本,对比一台 Ahrefs 服务器的成本。


此外,考虑到 EC2 的长期使用,我们会将保留三年的 EC2 实例最低价格与使用五年的内部服务器进行比较。


除了 EC2 实例外,我们还加上了弹性块存储(EBS)。相较我们在服务器中所用的大且快的 NVMe 驱动而言,并不算是直连存储的完美替换。为了简化计算,我们选择更为廉价但也更慢的 gp3 EBS,其成本由两部分组成:存储大小和 IOPS 费用。


在服务器上,每个数据块都留有两份副本,但我们在 EBS 上只购买了用于解决复制问题的可用空间。因此,我们要考虑的是 gp3 存储大小应是我们驱动器大小除以 2 的等价:(1*1TB+16*15TB)/2≈120TB 每服务器。


计算中没有算上更高 IOPS 的成本,同时也摒弃了 EBS gp3 的多种限制。举例来说,gp3 最大吞吐量每实例为 10GB/s,而每个 PCIe Gen 4 NVMe 驱动器的性能是 6-7GB/s,我们有 16 个后者这样的驱动器并行运作。这不是完美对称的比较,但会大幅降低 AWS 的存储成本,让其占据进一步的优势。


与主机托管的按带宽收费不同,AWS 是按下载的 GB 数收费。因此,我们会粗略估计每台服务器的平均下载量,并按照这个数字来计算 AWS 的网络。


将所有三个部分结合起来,我们得出 AWS 的成本分布如下:



AWS 成本结构

自有硬件对比 AWS


从上面的表格中我么可以看出,预想之中的 AWS 成本要高上许多。



自有硬件对比 AWS EC2 每月开销


将 EC2 实例用 AWS 中类似可用的 SSD 空间替换,花销基本等同于主机托管数据中心的 11.3 个服务器。这也就意味着,我们的 20 台服务器的机架将变成只有两台左右的服务器。



20 台 Ahref 服务器对比 AWS 的 2 台服务器


假设我们在数据中心实际使用的两年半时间中,运行这 850 台服务器,那么按完计算器后我们就能清楚看到其中巨大的差异:



30 个月内 850 台服务器使用 AWS 对比使用公司内情况


我们需要额外支付 AWS 高达 4 亿多美元的费用,才能确保我们在新加坡的基础设施能自 2020 年起持续运转。


你可能会问,“也许 Ahref 能承担得起这个费用?”


的确,Ahref 是一家盈利且持续发展的公司,那么让我们把 Ahref 的利润纳入计算的考量中看看。但即使如此,Ahref 作为私企没有义务公开我们的财政数据。不过,《海峡时报(Straits Times)》中刊登的 2022 和 2023 年新加坡发展最为迅速的公司文章中,也包含了 Ahref 在 2020 年和 2021 年的收入数据。


我们可以据此,线性计算 Ahref 在 2022 年的收入,虽然只是粗略估计,但也足以让我们得出部分结论。



Ahrefs 于 2020 年至 2022 年收入估算


从上表中我们可以看出,Ahrefs 在过去三年间的总收入约为 2.57 亿美元。但根据上文中的计算,转换至 AWS 数据中心将带来约 4.48 亿美元成本。由此可得,公司的收入甚至无法覆盖两年半的 AWS 使用成本。


真是惊人的结果!


那么 Ahref 的这么多利润都花在了哪里呢?


正如这篇 20 年前由 LJ Hart-Smith 为波音公司撰写的报告中所述:“如果主制造商或系统集成商无法通过输出工作机会而发财,那还有谁会赚钱?当然是分包商。”


别忘了,我们已经给了 AWS 不少计算中的优势。我们的主机托管数据中心的电费花销是高于平均值的,也只计算了 EBS 部分的存储,还忽略了 EBS 存储极其缓慢的速度。再加上这个新加坡的数据中心也不是我们唯一的成本中心,我们在其他数据中心、服务器、服务、人力、办公室、营销活动等等方面也都有开销。


因此,如果云计算是我们的主要基础设施目的地,Ahrefs 将很难生存。


其他考量


本文中没有纳入考量范围的其他方面只会让计算更为复杂,这些因素中包括人员技能、财务控制、现金流、取决于负载类型的能力规划等等。


结论


在过去的两年半间,Ahref 通过确保其基础设施百分百地不在 IaaS 云中,已经节省了约四亿美元,这个数字还将继续增长,因为我们正使用新硬件启动另一套大规模主机托管数据中心。


虽然 Ahref 在全球各地的前端托管会因使用 AWS 而受益,但 Ahref 基础设施的绝大部分都隐藏在自有硬件的主机托管中。如果将产品百分百上云,那么 Ahref 将不再有利润,甚至也不再会存在。


我们可以将百分百上云导致的十倍有余基础设施成本节省下来,用于实际的产品开发和优化。由此带来更快更好的结果会让我们的服务器比云计算在其局限内能提供的快上许多报告。


因此,我建议对可持续增长感兴趣的 CFO、CEO,以及企业主重新思考并定期评估云的优势与其实际的成本。虽说云计算是早期创业公司的首要选择,但随着公司及其基础设施的发展,百分百留在云上的基础设施可能会导致公司沦陷。


这就是困境所在了。


一旦上云,再想离开就会非常复杂。云虽然方便,但也是锁定性质的。此外,因为成本提高便抛弃云基础设施,这大概不会是工程团队所希望的,后者可能会偏见地认为云环境相比老式带有物理服务器的实体数据中心而言,是要更容易且更灵活。


对更为比较成熟的公司而言,从云端迁移到自己的基础设施并不轻松。如何在迁移过程中保持公司的活力也将会是个挑战。但这种痛苦的迁移可能就是拯救公司的关键,如此一来公司无需再向云服务提供商支付越来越多的收入分成。


FAANG(Facebook、Apple、Amazon、Netflix、Google)等大公司多年来在就业市场中吸收了大量工程师,用于管理他们庞大的数据中心和基础设施,只给小公司留下一点点肉汤。但随着近几月科技巨头的大规模裁员,这或许是一个重新评估云计算方法的机会,可以考虑从云计算反方向迁移,并雇佣数据中心领域经验丰富的专业人士。


而如果你要创建一个新公司,或许可以将购入的机架和服务器放在你的地下室里。这大概会从第一天起便改善了公司的可持续性。


原文链接:

https://tech.ahrefs.com/how-ahrefs-saved-us-400m-in-3-years-by-not-going-to-the-cloud-8939dd930af8

相关阅读:

如何将 AWS Lambda 与 Spinnaker 集成

AWS 发布 180 项新服务与功能

AWS 加速西门子智能家居系统的云上构建

AWS Graviton2 | 匠“芯”定制,性能为王

2023-04-20 18:587796

评论 2 条评论

发布
用户头像
规模大了可以不用云
2023-04-21 17:17 · 广东
回复
用户头像
什么换arm cpu、动态伸缩、serverless等降低云成本方法都弱爆了😂最牛逼的降低云成本方法一步到位: 不用云😂😂😂
2023-04-21 09:49 · 上海
回复
没有更多了
发现更多内容

应用开发中的存储架构进化史——从起步到起飞

Java 编程 架构 面试 后端

第5章-《Linux一学就会》- Linux基本操作和服务器硬件选购指南

学神来啦

Linux linux运维 linux学习 Linux教程

如何使用ESD二极管,设计运算放大器电压保护?

不脱发的程序猿

电路设计 ESD二极管 运算放大器 电压保护 嵌入式硬件

遇见乌镇 | VoneCredit洞见供应链金融新未来

旺链科技

世界互联网大会 供应链金融

AI专家一席谈:复用算法、模型、案例,AI Gallery带你快速上手应用开发

华为云开发者联盟

算法 模型 案例 AI Gallery 应用开发

智云盾捕获多个僵尸网络利用最新ConfluenceRCE漏洞的活动

百度开发者中心

安全 漏洞

2021金九银十,啃完这35个Java技术栈,冲刺百万年薪不是梦

Java 架构 面试 程序人生 编程语言

智能汽车的定义是什么?

SOA开发者

车载高速CAN(HighSpeed CAN)通信基本原理讲解

SOA开发者

等保测评一次多少钱,收费标准是怎样的?

行云管家

网络安全 等保 等保测评 等保2.0

金九银十面试如何得到面试官青睐?2021最新大厂Java面试真题合集(附权威答案)

Java 架构 面试 程序人生 编程语言

一文带你掌握工作流引擎flowable所有业务概念

小鲍侃java

后端 引航计划

阿里内部最新“SpringCloudAlibaba学习笔记”(全彩第三版)限时开源

Java 架构 面试 微服务 Alibaba

垂直CRM,能否走到终局?

ToB行业头条

ThingMap一键城市2.0重新出发:快速生成三维城市

ThingJS数字孪生引擎

地图 物联网 可视化 数字孪生

【大咖直播】Elastic 企业搜索实战工作坊(第一期)

腾讯云大数据

elasticsearch

PerfDog携手Imagination,助力开发者获取GPU关键数据

WeTest

国庆临近,字节后端开发3+4面,终于拿到秋招第一个offer

Java 架构 面试 后端 计算机

如何撬动企业数字化转型?智能客服是关键支点

ToB行业头条

🏆【SpringBoot技术专题】「FtpServer文件服务」教你如何基于Springboot开发一个”可移植“的轻量级文件服务项目系统!

码界西柚

Apache springboot ftp服务 9月日更 FtpServer

刷爆Leetcode!字节算法大佬进阶专属算法笔记:GitHub标星97k+

Java 架构 面试 程序人生 LeetCode

如何管理职场新人?

石云升

团队管理 管理 引航计划 内容合集 9月日更

云原生时代,如何构建数字化转型架构?

博文视点Broadview

让数据库无惧灾难,华为云GaussDB同城双集群高可用方案正式发布

华为云开发者联盟

数据库 高可用 集群 华为云GaussDB 同城双集群

我国智能汽车产业环境与政策导向

SOA开发者

论文阅读丨神经清洁: 神经网络中的后门攻击识别与缓解

华为云开发者联盟

神经网络 深度学习 论文阅读

解密秒杀系统架构,不是所有的系统都能做秒杀!

华为云开发者联盟

架构 秒杀 电商系统

GK架构营模4作业

Ping

三款Linux文件传输工具简单介绍-行云管家

行云管家

Linux 文件传输 IT运维

音视频编解码 --X264码率控制初探

Fenngton

音视频 ffmpeg 编码 码率控制 引航计划

vivo全球商城-营销价格监控方案的探索

vivo互联网技术

后端 服务器 监控系统 营销数字化 亿级架构设计

3年不用云能节省4亿美元!想知道我们为什么敢不用AWS吗?_服务革新_InfoQ精选文章