写点什么

阿里云智能总裁张建锋:阿里云形成“飞天 +CIPU”支撑的云计算技术体系

  • 2022-06-13
  • 本文字数:1783 字

    阅读完需:约 6 分钟

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系

6 月 13 日,阿里云智能总裁张建锋在峰会上发布了云基础设施处理器 CIPU,推动云计算从以 CPU 为中心的体系架构进入以“飞天操作系统+CIPU”为中心的体系架构。

 

张建锋表示,过去十多年,云计算技术经历了两个发展阶段:第一阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求;第二阶段出现了资源池化技术,通过把计算和存储进行分离,而后规模化编排和调度,形成了超大规模的计算和存储资源池。

 

近年来,云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系结构去满足。上述虽然两个阶段的演进推动云计算发展,但都是通过软件定义的方法,基于传统的以 CPU 为中心的体系架构去做优化,已经触及瓶颈。

 

张建锋表示,云计算进入了一个新的发展阶段。“我们越来越接近于下一个时代。新一代的云计算要从数据中心的内部做体系化创新,从以往的以 CPU 为中心的体系架构,进入以 CIPU 为中心的体系架构。

 

根据官方介绍,CIPU 向下接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上接入飞天云操作系统,管控阿里云全球上百万台服务器,让算力虚拟化损耗降到 0,并通过规模化应用 RDMA 网络技术,让访问云端比访问本地硬盘更快。

 

“这是一个全新的架构体系,从最底层的数据中心核心部件到最上层云原生软件,建立了完整的自研技术体系。”张建锋说道,“阿里云做到了软硬件完美结合,形成了‘飞天+CIPU’支撑的云计算技术体系。”

 

过去 13 年,阿里云自研出飞天云操作系统,并构建出自研芯片、服务器、计算、存储、网络等软硬一体的新型计算体系架构。

 

飞天是阿里自研的云操作系统,将遍布全球的上百万台服务器连接成一台超级计算机,单集群可达 10 万台规模,千亿级文件数,EB 级别存储空间。在 2021 云峰会上,阿里云宣布,飞天操作系统正在全面兼容 X86、ARM、RISC-V 等多种芯片架构,实现“一云多芯”。

 

阿里云智能总裁张建锋表示,传统 IT 时代围绕芯片建立 IT 生态,但云计算从根本上改变了这一模式,云操作系统可以将服务器芯片、专用芯片等硬件封装成标准算力,无论底层芯片是 X86、ARM、RISC-V 还是硬件加速,给客户提供的都是标准的、高质量的云计算服务。

 

芯片方面,2021 年 9 月,阿里云在云栖大会上发布了首款通用芯片倚天 710。作为一款为云而生的芯片,倚天 710 针对云计算特点做了大量优化,性能超过业界标杆 20%,能效比提升 50%以上。

 

架构层面,倚天 710 采用 ARMv9 架构,多达 128 核,主频最高 3.2GHz,可同时兼顾性能和功耗。同时,集成了业界最领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。目前,倚天 710 已在阿里云数据中心内部规模化部署,并支撑了 2021 年双 11 等多个核心业务。

 

在服务器、操作系统方面,阿里云在去年 9 月发布了自研的磐久服务器和龙蜥操作系统。磐久服务器采用了最新型的模块化设计,可实现计算存储分离,包括了高性能计算系列、大容量存储系列、高性能存储系列等,拥有风冷、液冷等不同散热模式,服务器交付效率提升 50%。磐久系列采用软硬件融合方式实现性能提升,结合自研的 MOC、FIC、AliFPGA、神盾卡等,来满足云原生的创新开发对性能和稳定性的机制要求。

 

龙蜥定位于服务器端操作系统,支持 X86、ARM、龙芯(LoongArch)等多种芯片架构和计算场景,性能和稳定性经受住了历年双 11 的严苛考验,为云上典型场景带来 40%的综合性能提升,故障率降低 50%,兼容 CentOS 生态,支持一键迁移,并提供全栈国密能力。

 

在计算层,阿里云自主研发了神龙架构。神龙与 CIPU 结合可将虚拟化转移到专用硬件中进行加速,将物理机的高性能与虚拟机的灵活性融为一体,虚拟化损耗几乎为零,并支持随时扩容。

 

在存储层,阿里云自研的分布式存储系统盘古,是阿里云底层的统一存储架构。盘古采用了分布式系统的容错架构和柔性平台设计,具备弹性伸缩、自动负载均衡等能力,支持块存储、对象存储、表格存储、文件存储、离线大数据处理等多种存储模式。基于盘古系统,阿里云建起丰富的云存储产品,包括公共云存储到混合云存储,从数据迁移到云上丰富的数据管理服务,全球部署规模超 100EB。

 

在网络层,阿里云飞天云操作系统的核心技术平台洛神云网络已经推出了 3.0 新平台架构,支持中心云到本地云和边缘云一致性的云网络体验,通过全新的物联网云连接器和智能接入网关让万物都能上阿里云。

 

2022-06-13 11:334298

评论

发布
暂无评论
发现更多内容

用户研究系列之“心流”解析

养心进行时

用户研究 心流 用户画像分析 用户特征分析 福流

海外云手机解决海外社交媒体运营难题

Ogcloud

云手机 海外云手机 云手机海外版 美国云手机 海外云手机推荐

通义灵码企业版正式发布,满足企业私域知识检索、数据合规、统一管理等需求

阿里巴巴云原生

阿里云 云原生 通义灵码

playwright使用:启动浏览器与多种运行方式

霍格沃兹测试开发学社

IM是什么意思?

BeeWorks

6个步骤解析“用户运营”

养心进行时

运营 产品运营 用户分析 用户运营

XTransfer5月产研岗位热招

XTransfer技术

深入探究 Playwright:Frame 操作技巧

霍格沃兹测试开发学社

云效 Pipeline as Code 来了!这些场景,用好它效率翻倍!

阿里云云效

阿里云 云原生 云效

软件测试学习笔记丨黑盒测试-边界值

测试人

软件测试

通义灵码企业版正式发布,满足企业私域知识检索、数据合规、统一管理等需求

阿里云云效

阿里云 云原生 云效 通义灵码

神器!使用Python 轻松识别验证码

霍格沃兹测试开发学社

3分钟讲透服装行业数字化转型新方案!附服装数字化成功案例

优秀

数字化转型 服装产业

数智制造:机器学习与人工智能的全方位渗透

不在线第一只蜗牛

人工智能 机器学习 数智制造

WorkPlus im(即时通讯)集成平台助力政企数字化转型升级

BeeWorks

IM 是什么?

BeeWorks

使用 Playwright 控制浏览器的启动、停止和等待

霍格沃兹测试开发学社

掌握 Playwright:元素操作技巧大揭秘

霍格沃兹测试开发学社

拿捏这12个Java开发框架,轻松拿到30K+

伤感汤姆布利柏

云效 Pipeline as Code 来了!这些场景,用好它效率翻倍!

阿里巴巴云原生

阿里云 云原生 云效

Polygon市值机器人

开发丨飞机丨 @aivenli

如何打破数据管理僵局,释放数据资产价值?[AMT企源案例]

AMT企源

数据库 数据资产 数据管理 主数据

ETLCloud中如何执行Java Bean脚本

RestCloud

Java 脚本 ETL JavaBean

Playwright安装与Python集成:探索跨浏览器测试的奇妙世界

霍格沃兹测试开发学社

使用Lambda表达式和接口的简单Java 8 Predicate示例

码语者

以太ETH链市值机器人

开发丨飞机丨 @aivenli

使用 Playwright 进行元素定位

霍格沃兹测试开发学社

im(即时通讯)是什么?

BeeWorks

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系_云原生_褚杏娟_InfoQ精选文章