2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

AWS 正式把 KVM 投入使用 你需要知道些什么?

  • 2017-11-09
  • 本文字数:2946 字

    阅读完需:约 10 分钟

如之前 InfoQ 中文站所报道, AWS 在 11 月 6 日推出新的实例类型 C5 ,其中采用了新的虚拟化引擎——一款 AWS 自家定制的 KVM。这可能意味着 AWS 从 2006 年启动时就开始使用并持续优化至今的 Xen 技术栈,将逐渐淡出这一体量庞大的云计算平台。

关于 Xen 与 KVM

Xen 最早是剑桥大学的一个研究项目。该项目在 2003 年以开源协议发布后,先后经历了 XenSource 公司、Citrix 公司、Linux 基金会等组织的领导,其技术阵营包含了 Citrix、IBM、Intel、HP、Novel、红帽、Sun、Oracle、Amazon、AMD、Bromium、CA Technologies、Calxeda、Cisco、Google、三星、以及 Verizon 等业界巨头。

KVM(Kernel-based Virtual Machine,直译为“基于内核的虚拟机”),最早是以色列初创企业 Qumranet 发布的开源项目。该项目在 2007 年被合并入 Linux 内核代码——这对 KVM 而言是非常重要的一个节点,该公司则在 2008 年被红帽收购。KVM 技术差不多到 2010 年之后进入成熟阶段,该技术阵营目前包括红帽、SUSE、Linaro(ARM)、IBM、Intel、Google、Oracle 等业界巨头,国内的华为、阿里巴巴、腾讯等也均有参与。

在 AWS 启动的 2006 年,Xen 还是当时最成熟的虚拟化引擎技术(对于 Linux 操作系统而言),而 KVM 项目还没有出现在大家的视野中。因此,AWS 在早期技术选型当中采用了 Xen,成为其弹性计算的底层基础。(此外,2009 年启动的阿里云也因为当时 KVM 还不成熟的原因采用了 Xen,不过两家一直未停止过对 KVM 的关注与投入,阿里云更是在数年前就已经推出了基于 KVM 的主机。另外,2011 年启动的 Google Cloud 从一开始就采用了 KVM 引擎。)

AWS 的用户需要知道什么?

首先,AWS 的用户现在已经可以将自己跑在 C4 实例上的主机切换到 C5,前提是:

  • 现在已经推出 C5 的区域有 US East (Northern Virginia)、US West (Oregon)、EU (Ireland) Regions,目前要用 C5 的话只能在这三个区,其他区还得等等。
  • AMI 镜像的操作系统必须包含 ENA 和 NVMe 的驱动,因为 C5 的网络和存储功能是在硬件层面实施的。AWS 平台上提供的最新版 AMI 镜像,包括 Amazon Linux、Microsoft Windows (Windows Server 2012 R2 以及 Windows Server 2016)、Ubuntu、RHEL、CentOS、SLES、Debian、FreeBSD,现在都支持。同理,如果你制作自己的 AMI,也是一样的要求。

Reddit 网站上已经有用户在分享自己的切换过程,感兴趣的读者可以前往查看或提问。Jeff Barr 也会在那里回复一些问题。

C5 实例可以选择的实例尺寸见下表:

Instance Name vCPUs RAM EBS Bandwidth Network Bandwidth c5.large 2 4 GiB Up to 2.25 Gbps Up to 10 Gbps c5.xlarge 4 8 GiB Up to 2.25 Gbps Up to 10 Gbps c5.2xlarge 8 16 GiB Up to 2.25 Gbps Up to 10 Gbps c5.4xlarge 16 32 GiB 2.25 Gbps Up to 10 Gbps c5.9xlarge 36 72 GiB 4.5 Gbps 10 Gbps c5.18xlarge 72 144 GiB 9 Gbps 25 Gbps 其次,如果你已经用上了 C5,想用它跑一些机器学习的推断(inferencing)任务或者类似的计算任务,可以看一下这个 Intel Math Kernel Library 。C5 的处理器用的是 3.0 GHz Intel Xeon Platinum 8000 系列,这款专为 EC2 做过优化的处理器配合上面那个数学库可能会有很好的性能。

此外,C5 还增加了每个 vCPU 的内存。对于兼容 AVX-512 指令集的代码而言,矢量操作和浮点操作的性能甚至可以翻倍。

切换到 C5 之后,由于运行在新虚拟化引擎上的实例是通过 NVMe 接口从 EBS 卷上启动的,而运行在 Xen 上的实例是从一个模拟 IDE 硬盘上启动、再切换到 Xen 的半虚拟块存储驱动上的,所以虽然操作系统(OS)能够识别自己正运行在哪个虚拟化引擎上,但如果软件本身假设底层的虚拟化引擎是 Xen 并依赖于该假设,则可能会引发一些问题。

但总体来说,AWS 表示只要 OS 层面能够支持 ENA 网络和 NVMe 存储,则大部分软件都能正常工作。AWS 还表示,其他的 EC2 功能并不会受到影响。

如果你是 AWS EC2 API 的重度用户,担心这次虚拟化引擎的变更会对 API 造成什么变化,则不用担心了: AWS 在其 FAQs 页面中表示其对外公开的 API 完全不会因为引入新的虚拟化引擎而有任何改变。

KVM 在 EC2 上的正式启用对 AWS 意味着什么?

作为计算资源服务的提供方,提升性能、降低成本是永恒的话题。

Xen 最初设计时,x86 架构尚未引入虚拟化扩展功能,所以 Xen 为了实现 Linux 系统的虚拟化,就把 Linux 内核给改了——这就相当于在之后的十几年里,Xen 一直维护着一套自己的 Linux 内核版本,所以上游 Linux 内核社区的很多新的好东西,它要费一番功夫才能移植进来,这就造成了很大的维护成本。

而另一方面,因为 KVM 项目是合并在 Linux 内核代码中的,维护起来就非常容易。Linux 内核上游社区的研发势能是非常大的,在这种情况下,KVM 的发展速度迅猛,在稳定性、性能方面的提升很快赶超了 Xen,受到很多技术人与企业的青睐。

EC2 是 AWS 的基石,虚拟化引擎又是 EC2 的基石。由于 AWS 是一套构建多年的、庞大而复杂的系统,很多功能会对 Xen 有所依赖,要让这套系统同时稳定的支持 Xen 与 KVM,是一项非常复杂的工作。所以 C5 的推出,意味着 AWS 这套系统已经脱离了对 Xen 的完全依赖。

对 AWS 而言,基于 KVM 的系统要比基于 Xen 的系统的维护成本更低,这是一方面。

另一方面,可能也与性能有关。按 AWS 首席布道师 Jeff Barr在博客中所说,C5 在性价比方面相比C4 提升了25%,针对有些任务甚至可以达到50%——这是针对用户而言。要知道对于AWS 今天这样的体量,哪怕是1% 的节省都是巨大的;如果有25% 这样比例的性价比提升,则绝对是势在必行,无论花费多大代价也要上。当然这其中的性能提升有多少是来自新的硬件,有多少是来自KVM,这就不一定了。

此外,AWS 首先在“计算密集型实例”(compute-intensive)上正式采用KVM,而不是从通用型、内存密集型等其他类型上开始,可能是因为考虑到计算密集型业务的I/O 操作较少,比较独立,耦合性比较小,因此更容易替换的原因。

这次改变对于业界有什么影响?

从市场占有率的角度来看,就是Xen 的最后一个大体量的用户对Xen 说,以后我不再需要你了。

如果说以前还有业界传言说AWS 在Xen 上投入太过巨大、依赖太重,所以AWS 将一直支持Xen 的话,那么现在这个传言已经宣告终结。毕竟,如果连AWS 都以实际行动表示切换到KVM 的收益大于成本了,那么那些体量更小的Xen 用户还能对Xen 有什么更多的期待呢?

所以对于未来的市场而言,这次改变也许象征着Xen 的使命已经结束了。对于过去的市场而言,Xen 的使命就是让那些仍然跑在Xen 上的业务们能够继续平稳运行。不过这里面还有一个变数就是 Unikernel ,那就是另一个话题了。

从上游社区的角度,影响可能不大,因为 Amazon 一直不是个活跃的开源社区参与者。即使作为最大的 Xen 用户那么多年,Amazon 对 Xen 上游社区的代码贡献数量却是屈指可数。所以对于 KVM 项目,可能我们未来也不大会看到很多来自 Amazon 的代码贡献。

从技术发展的角度,这是个大趋势下技术更新换代的必然——也许从 KVM 被合并到 Linux 内核代码的那时起就已经种下了种子吧。

总结

关于 AWS 此次拥抱 KVM 的 C5 发布,目前公开的信息就总结到此。11 月 27 日到 12 月 1 日期间的 AWS re:Invent 2017,InfoQ 中文站记者会在前线报道,敬请期待!

感谢吴峰光对本文的贡献。

2017-11-09 18:014056

评论

发布
暂无评论
发现更多内容

被忽视的问题:测试环境配置管理

老张

软件测试 测试环境治理

NBA赛事直播超清画质背后:阿里云视频云「窄带高清2.0」技术深度解读

阿里云CloudImagine

音视频 直播 视频编码

英特尔集成光电研究最新进展推动共封装光学和光互连技术进步

科技之家

一文掌握数仓中auto analyze的使用

华为云开发者联盟

数据库 sql 后端 analyze

在线SQL转Excel(xls/xlsx)工具

入门小站

工具

上线首月,这家露营地游客好评率高达99.9%!他是怎么做到的?

天天预约

小程序 SaaS 线上预约 预约工具 露营

华为nova 10系列支持应用安全检测功能 筑牢手机安全防火墙

科技汇

uni-app与uviewUI实现仿小米商城app(附源码)

优秀的李

小程序 uniapp 7月月更 uviewui

LeaRun.Java快速开发平台 高效代码自动化生成

力软低代码开发平台

能源行业的数字化“新”运维

博睿数据

AIOPS 智能运维 博睿数据 能源行业

激进技术派 vs 项目保守派的微服务架构之争

BoCloud博云

微服务 微服务架构 云原生 istio 服务网格

字节跳动Dev Better技术沙龙成功举办,携手华泰分享Web研发效能提升经验

字节跳动终端技术

字节跳动 前端

“只跑一趟”,小区装维任务主动推荐探索

鲸品堂

运维

解密函数计算异步任务能力之「任务的状态及生命周期管理」

阿里巴巴云原生

阿里云 Serverless 云原生 函数计算

实战模拟│JWT 登录认证

经验分享 JWT 开发语言 7月月更 跨域认证

Numpy 的仿制 2

祖维

c slice Numpy

整理混乱的头文件,我用include what you use

华为云开发者联盟

c++ 开发 C语言 技能

应用实践 | 蜀海供应链基于 Apache Doris 的数据中台建设

SelectDB

数据库 数据中台 Apaache Doris

你可能不知道,我是如何将一个老系统的kafka消费者服务的性能提升近百倍的

Java全栈架构师

Java kafka 程序员 面试 架构设计

CANN算子:利用迭代器高效实现Tensor数据切割分块处理

华为云开发者联盟

人工智能 算子 迭代器

Nebula Importer 数据导入实践

NebulaGraph

图数据库 数据导入 Nebula Graph

linux实战清理挖矿病毒kthreaddi

入门小站

Linux

联想首次详解绿色智城数字孪生平台 破解城市双碳升级难点

科技大数据

同事悄悄告诉我,飞书通知还能这样玩

Jianmu

自动化 建木CI 飞书通知 定时

DeFi生态NFT流动性挖矿系统开发搭建

薇電13242772558

NFT DeFi流动性挖矿

在线文本行固定长度填充工具

入门小站

工具

使用 MyBatis 操作 Nebula Graph 的实践

NebulaGraph

mybatis 图数据库 Nebula Graph

输入的查询SQL语句,是如何执行的?

华为云开发者联盟

MySQL sql 开发 语句

Python 入门指南之使用 Python 解释器

海拥(haiyong.site)

7月月更

python小知识-python泛函数

AIWeker

Python python小知识 7月月更

TCP两次挥手,你见过吗?那四次握手呢?

C++后台开发

网络编程 网络协议 TCP/IP 后端开发 C++开发

AWS正式把KVM投入使用 你需要知道些什么?_亚马逊云科技_sai_InfoQ精选文章