2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

3 年不用云能节省 4 亿美元!想知道我们为什么敢不用 AWS 吗?

作者:Efim Mirochnik

  • 2023-04-20
    北京
  • 本文字数:3389 字

    阅读完需:约 11 分钟

3年不用云能节省4亿美元!想知道我们为什么敢不用AWS吗?

最近,用于 IT 基础设施的云非常流行,上云也已经成为一种趋势。基础设施即服务(IaaS)云提供了多种优势:灵活性、短部署时间、易扩展、可全球诸多地区即时存在……


云服务提供方通过提供方便且普遍易用的服务已经成为资深技术服务外包,凭借其出色的营销、大会、认证和精心挑选的的用例场景,轻易地让人们相信云才是现代企业技术的唯一合理目标。


但有时,这些外包云效益的成本却能高上天。如此之高的成本让我们开始忧虑,如果将基础设施百分比上云,我们的业务是否还能存在。由此引出了我们对此切实的比较,答案就在本文之中。


Ahrefs 自身硬件概览


Ahrefs 在新加坡租用了一个基础设施相当单一的主机托管数据中心。因此,我们选择汇总这个数据中心的所有费用,除以服务器的数量,并与可以被看作是世界领先的 IaaS 示例的亚马逊网络服务(AWS)云中等价安装模式的费用进行比较。



Ahrefs 的服务器


我们的硬件还算是比较新。2020 年中新冠封锁高峰期签订的代管合同,其他所有安装的设备都是在这之后购入的。数据中心的服务器上也有类似的配置,唯一的区别在于两代核心数量相同的 CPU。我们用的是高核心数的 CPU,2TB 内存,以及每台服务器的 2x 100 Gbps。平均下来,我们的服务器有大约 16x 15TB 的驱动。


对至于每月的成本,假设所有的硬件将只使用五年,超过五年的使用都视作是“免费”,那么,每月初始设备的成本是就是原始价格除以 (5 * 12 = 60 个月)。


目前,包括租金和电费在内的所有费用都是统计截止至 2022 年 10 月之前的,虽然我们也受到通货膨胀的影响,但把这点也考虑进去只会让计算更为复杂,因此我们暂时忽略了这一点。


我们的主机托管费用包括两个主要部分:租金和事实消耗的计量电力。自 2022 年初以来,电价已大幅上涨。我们这里计算使用的是最近、也最为高昂的电费,而非使用整体租凭期间的平均电费,因此,计算结果会相较实际略高。这对 AWS 来说算是优势。


此外,我们的费用还包括数据中心和我们的所在点之间的网间结算(IP Transit)以及裸光纤。


下表展示了我们平均每月每台服务器的支出情况。服务器硬件占据整月支出的三分之二,而数据中心租金与电力(DC)、互联网服务提供商(ISP)与网间结算、暗光纤(DF)和内部网络硬件(Network HW)则占剩余的三分之一。



我们自身的公司内硬件成本结构

AWS 的成本结构


我们这次分析的主机托管位于新加坡,因此我们会对比 AWS 在亚太(新加坡)地区的价格。


AWS 的成本结构与主机托管不同。可惜 AWS 没有与我们核心数量相同的 EC2 实例,因此我们选择两个具有一半数量的内核加上 1 TB 内存的 EC2 配置成本,对比一台 Ahrefs 服务器的成本。


此外,考虑到 EC2 的长期使用,我们会将保留三年的 EC2 实例最低价格与使用五年的内部服务器进行比较。


除了 EC2 实例外,我们还加上了弹性块存储(EBS)。相较我们在服务器中所用的大且快的 NVMe 驱动而言,并不算是直连存储的完美替换。为了简化计算,我们选择更为廉价但也更慢的 gp3 EBS,其成本由两部分组成:存储大小和 IOPS 费用。


在服务器上,每个数据块都留有两份副本,但我们在 EBS 上只购买了用于解决复制问题的可用空间。因此,我们要考虑的是 gp3 存储大小应是我们驱动器大小除以 2 的等价:(1*1TB+16*15TB)/2≈120TB 每服务器。


计算中没有算上更高 IOPS 的成本,同时也摒弃了 EBS gp3 的多种限制。举例来说,gp3 最大吞吐量每实例为 10GB/s,而每个 PCIe Gen 4 NVMe 驱动器的性能是 6-7GB/s,我们有 16 个后者这样的驱动器并行运作。这不是完美对称的比较,但会大幅降低 AWS 的存储成本,让其占据进一步的优势。


与主机托管的按带宽收费不同,AWS 是按下载的 GB 数收费。因此,我们会粗略估计每台服务器的平均下载量,并按照这个数字来计算 AWS 的网络。


将所有三个部分结合起来,我们得出 AWS 的成本分布如下:



AWS 成本结构

自有硬件对比 AWS


从上面的表格中我么可以看出,预想之中的 AWS 成本要高上许多。



自有硬件对比 AWS EC2 每月开销


将 EC2 实例用 AWS 中类似可用的 SSD 空间替换,花销基本等同于主机托管数据中心的 11.3 个服务器。这也就意味着,我们的 20 台服务器的机架将变成只有两台左右的服务器。



20 台 Ahref 服务器对比 AWS 的 2 台服务器


假设我们在数据中心实际使用的两年半时间中,运行这 850 台服务器,那么按完计算器后我们就能清楚看到其中巨大的差异:



30 个月内 850 台服务器使用 AWS 对比使用公司内情况


我们需要额外支付 AWS 高达 4 亿多美元的费用,才能确保我们在新加坡的基础设施能自 2020 年起持续运转。


你可能会问,“也许 Ahref 能承担得起这个费用?”


的确,Ahref 是一家盈利且持续发展的公司,那么让我们把 Ahref 的利润纳入计算的考量中看看。但即使如此,Ahref 作为私企没有义务公开我们的财政数据。不过,《海峡时报(Straits Times)》中刊登的 2022 和 2023 年新加坡发展最为迅速的公司文章中,也包含了 Ahref 在 2020 年和 2021 年的收入数据。


我们可以据此,线性计算 Ahref 在 2022 年的收入,虽然只是粗略估计,但也足以让我们得出部分结论。



Ahrefs 于 2020 年至 2022 年收入估算


从上表中我们可以看出,Ahrefs 在过去三年间的总收入约为 2.57 亿美元。但根据上文中的计算,转换至 AWS 数据中心将带来约 4.48 亿美元成本。由此可得,公司的收入甚至无法覆盖两年半的 AWS 使用成本。


真是惊人的结果!


那么 Ahref 的这么多利润都花在了哪里呢?


正如这篇 20 年前由 LJ Hart-Smith 为波音公司撰写的报告中所述:“如果主制造商或系统集成商无法通过输出工作机会而发财,那还有谁会赚钱?当然是分包商。”


别忘了,我们已经给了 AWS 不少计算中的优势。我们的主机托管数据中心的电费花销是高于平均值的,也只计算了 EBS 部分的存储,还忽略了 EBS 存储极其缓慢的速度。再加上这个新加坡的数据中心也不是我们唯一的成本中心,我们在其他数据中心、服务器、服务、人力、办公室、营销活动等等方面也都有开销。


因此,如果云计算是我们的主要基础设施目的地,Ahrefs 将很难生存。


其他考量


本文中没有纳入考量范围的其他方面只会让计算更为复杂,这些因素中包括人员技能、财务控制、现金流、取决于负载类型的能力规划等等。


结论


在过去的两年半间,Ahref 通过确保其基础设施百分百地不在 IaaS 云中,已经节省了约四亿美元,这个数字还将继续增长,因为我们正使用新硬件启动另一套大规模主机托管数据中心。


虽然 Ahref 在全球各地的前端托管会因使用 AWS 而受益,但 Ahref 基础设施的绝大部分都隐藏在自有硬件的主机托管中。如果将产品百分百上云,那么 Ahref 将不再有利润,甚至也不再会存在。


我们可以将百分百上云导致的十倍有余基础设施成本节省下来,用于实际的产品开发和优化。由此带来更快更好的结果会让我们的服务器比云计算在其局限内能提供的快上许多报告。


因此,我建议对可持续增长感兴趣的 CFO、CEO,以及企业主重新思考并定期评估云的优势与其实际的成本。虽说云计算是早期创业公司的首要选择,但随着公司及其基础设施的发展,百分百留在云上的基础设施可能会导致公司沦陷。


这就是困境所在了。


一旦上云,再想离开就会非常复杂。云虽然方便,但也是锁定性质的。此外,因为成本提高便抛弃云基础设施,这大概不会是工程团队所希望的,后者可能会偏见地认为云环境相比老式带有物理服务器的实体数据中心而言,是要更容易且更灵活。


对更为比较成熟的公司而言,从云端迁移到自己的基础设施并不轻松。如何在迁移过程中保持公司的活力也将会是个挑战。但这种痛苦的迁移可能就是拯救公司的关键,如此一来公司无需再向云服务提供商支付越来越多的收入分成。


FAANG(Facebook、Apple、Amazon、Netflix、Google)等大公司多年来在就业市场中吸收了大量工程师,用于管理他们庞大的数据中心和基础设施,只给小公司留下一点点肉汤。但随着近几月科技巨头的大规模裁员,这或许是一个重新评估云计算方法的机会,可以考虑从云计算反方向迁移,并雇佣数据中心领域经验丰富的专业人士。


而如果你要创建一个新公司,或许可以将购入的机架和服务器放在你的地下室里。这大概会从第一天起便改善了公司的可持续性。


原文链接:

https://tech.ahrefs.com/how-ahrefs-saved-us-400m-in-3-years-by-not-going-to-the-cloud-8939dd930af8

相关阅读:

如何将 AWS Lambda 与 Spinnaker 集成

AWS 发布 180 项新服务与功能

AWS 加速西门子智能家居系统的云上构建

AWS Graviton2 | 匠“芯”定制,性能为王

2023-04-20 18:588053

评论 2 条评论

发布
用户头像
规模大了可以不用云
2023-04-21 17:17 · 广东
回复
用户头像
什么换arm cpu、动态伸缩、serverless等降低云成本方法都弱爆了😂最牛逼的降低云成本方法一步到位: 不用云😂😂😂
2023-04-21 09:49 · 上海
回复
没有更多了
发现更多内容

【薪火计划】03 - 从错误中认识到管理

码上生长

管理

CSS 排版与正常流 —— 重学CSS

三钻

CSS 排版

注册中心原理剖析

石刻掌纹

面经手册 · 第18篇《AQS 共享锁,Semaphore、CountDownLatch,听说数据库连接池可以用到!》

小傅哥

Java 并发编程 共享锁 Semaphore 信号量

MySQL从库维护经验分享

Simon

MySQL 主从复制

Glide.with(view)挂在了谁的生命周期上

mengxn

生命周期 Glide Activity Fragment

国网浙江建设公司推进“信用基建+区块链”建设

CECBC

区块链 国网 基建

智变的八个瞬间,京东智联云化“?”为“!”

脑极体

我真的尽力了,最经典Redis面试14题,没时间复习就看这个吧

小Q

redis 学习 编程 架构 面试

MySQL中的锁机制

AI乔治

Java MySQL 架构 线程 锁机制

新工业化如何实现?今年的信息化百人会中藏着“懂行”密码

脑极体

《网络是怎样连接的》PDF下载

计算机与AI

网络

Springboot过滤器和拦截器详解及使用场景

AI乔治

Java spring 架构 Spring Boot

【活动回顾】WebRTC服务端工程实践和优化探索

ZEGO即构

WebRTC 服务端工程

【MySQL】如何最大程度防止人为误操作MySQL数据库?这次我懂了!!

冰河

MySQL 数据库 性能优化 数据安全 分布式数据储存

阿里P8以hashmap讲解如何学习jdk源码,还不学习

小Q

Java 学习 源码 jdk mybatis

vue项目实战经验汇总

徐小夕

Java 面试 Vue 大前端 Vue3

读谱对吉他手来说重要吗?试试它提升你的读谱效率

奈奈的杂社

学习 编曲 打谱

高承实:区块链的工业革命带来了什么?

CECBC

区块链 分布式

Redis 持久化之 RDB 与 AOF 详解

AI乔治

Java 架构 redis持久化 redia

Nginx-技术专题-技术介绍

码界西柚

数字货币引发的金融变革

CECBC

数字化时代

甲方日常53

句子

工作 随笔杂谈 日常

SQL数据库:窗口函数

正向成长

窗口函数

什么是云服务?

anyRTC开发者

音视频 WebRTC 云服务 RTC

前嗅教你大数据——什么是代理IP?

前嗅大数据

爬虫 数据采集 静态IP 代理IP 动态IP

什么是低代码(Low-Code)?

移动研发平台EMAS

工具 研发效能 低代码 开发 代码

会装虚拟机,删库不用跑

MySQL从删库到跑路

虚拟机 virtualbox

11.11 应对海量访问的网络基石 京东智联云自研交换机发展之路

京东科技开发者

运维 网络 交换机

Dubbo 接口,导出 Markdown ,这些功能 DocView 现在都有了!

程序员小航

markdown idea插件 IntelliJ IDEA 文档生成 Doc View

3年不用云能节省4亿美元!想知道我们为什么敢不用AWS吗?_服务革新_InfoQ精选文章