写点什么

3 年不用云能节省 4 亿美元!想知道我们为什么敢不用 AWS 吗?

作者:Efim Mirochnik

  • 2023-04-20
    北京
  • 本文字数:3389 字

    阅读完需:约 11 分钟

3年不用云能节省4亿美元!想知道我们为什么敢不用AWS吗?

最近,用于 IT 基础设施的云非常流行,上云也已经成为一种趋势。基础设施即服务(IaaS)云提供了多种优势:灵活性、短部署时间、易扩展、可全球诸多地区即时存在……


云服务提供方通过提供方便且普遍易用的服务已经成为资深技术服务外包,凭借其出色的营销、大会、认证和精心挑选的的用例场景,轻易地让人们相信云才是现代企业技术的唯一合理目标。


但有时,这些外包云效益的成本却能高上天。如此之高的成本让我们开始忧虑,如果将基础设施百分比上云,我们的业务是否还能存在。由此引出了我们对此切实的比较,答案就在本文之中。


Ahrefs 自身硬件概览


Ahrefs 在新加坡租用了一个基础设施相当单一的主机托管数据中心。因此,我们选择汇总这个数据中心的所有费用,除以服务器的数量,并与可以被看作是世界领先的 IaaS 示例的亚马逊网络服务(AWS)云中等价安装模式的费用进行比较。



Ahrefs 的服务器


我们的硬件还算是比较新。2020 年中新冠封锁高峰期签订的代管合同,其他所有安装的设备都是在这之后购入的。数据中心的服务器上也有类似的配置,唯一的区别在于两代核心数量相同的 CPU。我们用的是高核心数的 CPU,2TB 内存,以及每台服务器的 2x 100 Gbps。平均下来,我们的服务器有大约 16x 15TB 的驱动。


对至于每月的成本,假设所有的硬件将只使用五年,超过五年的使用都视作是“免费”,那么,每月初始设备的成本是就是原始价格除以 (5 * 12 = 60 个月)。


目前,包括租金和电费在内的所有费用都是统计截止至 2022 年 10 月之前的,虽然我们也受到通货膨胀的影响,但把这点也考虑进去只会让计算更为复杂,因此我们暂时忽略了这一点。


我们的主机托管费用包括两个主要部分:租金和事实消耗的计量电力。自 2022 年初以来,电价已大幅上涨。我们这里计算使用的是最近、也最为高昂的电费,而非使用整体租凭期间的平均电费,因此,计算结果会相较实际略高。这对 AWS 来说算是优势。


此外,我们的费用还包括数据中心和我们的所在点之间的网间结算(IP Transit)以及裸光纤。


下表展示了我们平均每月每台服务器的支出情况。服务器硬件占据整月支出的三分之二,而数据中心租金与电力(DC)、互联网服务提供商(ISP)与网间结算、暗光纤(DF)和内部网络硬件(Network HW)则占剩余的三分之一。



我们自身的公司内硬件成本结构

AWS 的成本结构


我们这次分析的主机托管位于新加坡,因此我们会对比 AWS 在亚太(新加坡)地区的价格。


AWS 的成本结构与主机托管不同。可惜 AWS 没有与我们核心数量相同的 EC2 实例,因此我们选择两个具有一半数量的内核加上 1 TB 内存的 EC2 配置成本,对比一台 Ahrefs 服务器的成本。


此外,考虑到 EC2 的长期使用,我们会将保留三年的 EC2 实例最低价格与使用五年的内部服务器进行比较。


除了 EC2 实例外,我们还加上了弹性块存储(EBS)。相较我们在服务器中所用的大且快的 NVMe 驱动而言,并不算是直连存储的完美替换。为了简化计算,我们选择更为廉价但也更慢的 gp3 EBS,其成本由两部分组成:存储大小和 IOPS 费用。


在服务器上,每个数据块都留有两份副本,但我们在 EBS 上只购买了用于解决复制问题的可用空间。因此,我们要考虑的是 gp3 存储大小应是我们驱动器大小除以 2 的等价:(1*1TB+16*15TB)/2≈120TB 每服务器。


计算中没有算上更高 IOPS 的成本,同时也摒弃了 EBS gp3 的多种限制。举例来说,gp3 最大吞吐量每实例为 10GB/s,而每个 PCIe Gen 4 NVMe 驱动器的性能是 6-7GB/s,我们有 16 个后者这样的驱动器并行运作。这不是完美对称的比较,但会大幅降低 AWS 的存储成本,让其占据进一步的优势。


与主机托管的按带宽收费不同,AWS 是按下载的 GB 数收费。因此,我们会粗略估计每台服务器的平均下载量,并按照这个数字来计算 AWS 的网络。


将所有三个部分结合起来,我们得出 AWS 的成本分布如下:



AWS 成本结构

自有硬件对比 AWS


从上面的表格中我么可以看出,预想之中的 AWS 成本要高上许多。



自有硬件对比 AWS EC2 每月开销


将 EC2 实例用 AWS 中类似可用的 SSD 空间替换,花销基本等同于主机托管数据中心的 11.3 个服务器。这也就意味着,我们的 20 台服务器的机架将变成只有两台左右的服务器。



20 台 Ahref 服务器对比 AWS 的 2 台服务器


假设我们在数据中心实际使用的两年半时间中,运行这 850 台服务器,那么按完计算器后我们就能清楚看到其中巨大的差异:



30 个月内 850 台服务器使用 AWS 对比使用公司内情况


我们需要额外支付 AWS 高达 4 亿多美元的费用,才能确保我们在新加坡的基础设施能自 2020 年起持续运转。


你可能会问,“也许 Ahref 能承担得起这个费用?”


的确,Ahref 是一家盈利且持续发展的公司,那么让我们把 Ahref 的利润纳入计算的考量中看看。但即使如此,Ahref 作为私企没有义务公开我们的财政数据。不过,《海峡时报(Straits Times)》中刊登的 2022 和 2023 年新加坡发展最为迅速的公司文章中,也包含了 Ahref 在 2020 年和 2021 年的收入数据。


我们可以据此,线性计算 Ahref 在 2022 年的收入,虽然只是粗略估计,但也足以让我们得出部分结论。



Ahrefs 于 2020 年至 2022 年收入估算


从上表中我们可以看出,Ahrefs 在过去三年间的总收入约为 2.57 亿美元。但根据上文中的计算,转换至 AWS 数据中心将带来约 4.48 亿美元成本。由此可得,公司的收入甚至无法覆盖两年半的 AWS 使用成本。


真是惊人的结果!


那么 Ahref 的这么多利润都花在了哪里呢?


正如这篇 20 年前由 LJ Hart-Smith 为波音公司撰写的报告中所述:“如果主制造商或系统集成商无法通过输出工作机会而发财,那还有谁会赚钱?当然是分包商。”


别忘了,我们已经给了 AWS 不少计算中的优势。我们的主机托管数据中心的电费花销是高于平均值的,也只计算了 EBS 部分的存储,还忽略了 EBS 存储极其缓慢的速度。再加上这个新加坡的数据中心也不是我们唯一的成本中心,我们在其他数据中心、服务器、服务、人力、办公室、营销活动等等方面也都有开销。


因此,如果云计算是我们的主要基础设施目的地,Ahrefs 将很难生存。


其他考量


本文中没有纳入考量范围的其他方面只会让计算更为复杂,这些因素中包括人员技能、财务控制、现金流、取决于负载类型的能力规划等等。


结论


在过去的两年半间,Ahref 通过确保其基础设施百分百地不在 IaaS 云中,已经节省了约四亿美元,这个数字还将继续增长,因为我们正使用新硬件启动另一套大规模主机托管数据中心。


虽然 Ahref 在全球各地的前端托管会因使用 AWS 而受益,但 Ahref 基础设施的绝大部分都隐藏在自有硬件的主机托管中。如果将产品百分百上云,那么 Ahref 将不再有利润,甚至也不再会存在。


我们可以将百分百上云导致的十倍有余基础设施成本节省下来,用于实际的产品开发和优化。由此带来更快更好的结果会让我们的服务器比云计算在其局限内能提供的快上许多报告。


因此,我建议对可持续增长感兴趣的 CFO、CEO,以及企业主重新思考并定期评估云的优势与其实际的成本。虽说云计算是早期创业公司的首要选择,但随着公司及其基础设施的发展,百分百留在云上的基础设施可能会导致公司沦陷。


这就是困境所在了。


一旦上云,再想离开就会非常复杂。云虽然方便,但也是锁定性质的。此外,因为成本提高便抛弃云基础设施,这大概不会是工程团队所希望的,后者可能会偏见地认为云环境相比老式带有物理服务器的实体数据中心而言,是要更容易且更灵活。


对更为比较成熟的公司而言,从云端迁移到自己的基础设施并不轻松。如何在迁移过程中保持公司的活力也将会是个挑战。但这种痛苦的迁移可能就是拯救公司的关键,如此一来公司无需再向云服务提供商支付越来越多的收入分成。


FAANG(Facebook、Apple、Amazon、Netflix、Google)等大公司多年来在就业市场中吸收了大量工程师,用于管理他们庞大的数据中心和基础设施,只给小公司留下一点点肉汤。但随着近几月科技巨头的大规模裁员,这或许是一个重新评估云计算方法的机会,可以考虑从云计算反方向迁移,并雇佣数据中心领域经验丰富的专业人士。


而如果你要创建一个新公司,或许可以将购入的机架和服务器放在你的地下室里。这大概会从第一天起便改善了公司的可持续性。


原文链接:

https://tech.ahrefs.com/how-ahrefs-saved-us-400m-in-3-years-by-not-going-to-the-cloud-8939dd930af8

相关阅读:

如何将 AWS Lambda 与 Spinnaker 集成

AWS 发布 180 项新服务与功能

AWS 加速西门子智能家居系统的云上构建

AWS Graviton2 | 匠“芯”定制,性能为王

2023-04-20 18:587819

评论 2 条评论

发布
用户头像
规模大了可以不用云
2023-04-21 17:17 · 广东
回复
用户头像
什么换arm cpu、动态伸缩、serverless等降低云成本方法都弱爆了😂最牛逼的降低云成本方法一步到位: 不用云😂😂😂
2023-04-21 09:49 · 上海
回复
没有更多了
发现更多内容

leetcode 304. Range Sum Query 2D - Immutable 二维区域和检索 - 矩阵不可变(中等)

okokabcd

LeetCode 数据结构与算法

RocketMQ高可用设计之同步刷盘

急需上岸的小谢

8月月更

spark实战之:分析维基百科网站统计数据(java版)

程序员欣宸

Java spark 8月月更

计算机网络(三、数据链路层)

计算机网络 8月月更

深度解读 | 关于SBOM最基础元素,你需要知道的(Part II)

安势信息

#开源 #SBOM 软件供应链安全 SBOM最基础元素 开源安全与治理

【LeetCode】爱吃香蕉的珂珂Java题解

Albert

LeetCode 8月月更

云原生(二十一) | Kubernetes篇之深入了解Ingress

Lansonli

云原生 8月月更

《键值型数据库系统技术及节能要求》团体标准发布,腾讯、京东、北邮等联合发起

科技热闻

flstudio21版本有什么新功能?

茶色酒

FL Studio

[极致用户体验] 我做的《联机五子棋》是如何追求极致用户体验的?(下)

HullQin

CSS JavaScript html 前端 8月月更

基于keil5新建STM32F10x寄存器版本工程

DS小龙哥

8月月更

手摸手告诉 UI 妹子数据可视化 20 条优化细则【切图仔直接收藏】

掘金安东尼

前端 UI 8月月更

那些你不知道的 CSS 自定义形状网格布局

南城FE

CSS 前端 布局

SAFe Day 2022 中国规模化敏捷大会即将开启

爱吃鱼的小雨

敏捷 safe 规模化敏捷 大规模敏捷 SAFeDay

你以为的推荐系统,其实只是推荐模型

OneFlow

机器学习 推荐系统 推荐模型

一套优秀的直播系统源码是什么样的?起码要有这五个模块

开源直播系统源码

软件开发 直播系统 直播系统源码 钠斯直播系统

阿里云携手卫宁健康发布WinCloud智慧医疗云联合解决方案,打造新一代智慧医疗系统

阿里云弹性计算

云服务器 分布式云 云盒 本地化部署

压力测试-JMeter常用插件、服务器硬件监控

程序知音

Java 程序员 后端 后端技术

​DTSE Tech Talk丨第3期:解密数据隔离方案,让SaaS应用开发更轻松

华为云开发者联盟

SaaS 企业 华为云

使用 Presto 和 Alluxio 在 AWS 上搭建高性能平台来支持实时游戏服务

Alluxio

游戏 AWS presto Alluxio 8月月更

博睿数据入选《2022爱分析· 银行数字化厂商全景报告》

博睿数据

银行 智能运维 博睿数据

flstudio21水果软件更新内容V21版本

茶色酒

FL Studio

三个线程交替打印ABC100次问题思考

越长大越悲伤

面试 线程 后端 JUC

一文搞懂EMAS Serverless小程序开发|电子书免费下载

hum建应用专家

Serverless emas

快速搞懂Mysql中BufferPool底层原理

知识浅谈

Buffer Pool 8月月更

从 Angular Component 和 Directive 的实例化,谈谈 Angular forRoot 方法的命令由来

汪子熙

typescript 前端开发 angular web开发 8月月更

如何快速开发一个健康助手,实时守护用户健康

HarmonyOS SDK

SpringMvc如何同时支持Jsp和Json接口?

xiaoxi666

为什么程序员都不喜欢使用 switch ,而是大量的 if……else if ?

TimeFriends

8月月更

Spring进阶(五):Spring事务管理(详解+实例)

No Silver Bullet

spring 事务管理 8月月更

龙蜥开发者说:我眼里的龙蜥社区:一个包容的大家庭 | 第 10 期

OpenAnolis小助手

Linux 开源 操作系统 龙蜥开发者说 参与贡献

3年不用云能节省4亿美元!想知道我们为什么敢不用AWS吗?_服务革新_InfoQ精选文章