最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

阿里云智能总裁张建锋:阿里云形成“飞天 +CIPU”支撑的云计算技术体系

  • 2022-06-13
  • 本文字数:1783 字

    阅读完需:约 6 分钟

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系

6 月 13 日,阿里云智能总裁张建锋在峰会上发布了云基础设施处理器 CIPU,推动云计算从以 CPU 为中心的体系架构进入以“飞天操作系统+CIPU”为中心的体系架构。

 

张建锋表示,过去十多年,云计算技术经历了两个发展阶段:第一阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求;第二阶段出现了资源池化技术,通过把计算和存储进行分离,而后规模化编排和调度,形成了超大规模的计算和存储资源池。

 

近年来,云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系结构去满足。上述虽然两个阶段的演进推动云计算发展,但都是通过软件定义的方法,基于传统的以 CPU 为中心的体系架构去做优化,已经触及瓶颈。

 

张建锋表示,云计算进入了一个新的发展阶段。“我们越来越接近于下一个时代。新一代的云计算要从数据中心的内部做体系化创新,从以往的以 CPU 为中心的体系架构,进入以 CIPU 为中心的体系架构。

 

根据官方介绍,CIPU 向下接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上接入飞天云操作系统,管控阿里云全球上百万台服务器,让算力虚拟化损耗降到 0,并通过规模化应用 RDMA 网络技术,让访问云端比访问本地硬盘更快。

 

“这是一个全新的架构体系,从最底层的数据中心核心部件到最上层云原生软件,建立了完整的自研技术体系。”张建锋说道,“阿里云做到了软硬件完美结合,形成了‘飞天+CIPU’支撑的云计算技术体系。”

 

过去 13 年,阿里云自研出飞天云操作系统,并构建出自研芯片、服务器、计算、存储、网络等软硬一体的新型计算体系架构。

 

飞天是阿里自研的云操作系统,将遍布全球的上百万台服务器连接成一台超级计算机,单集群可达 10 万台规模,千亿级文件数,EB 级别存储空间。在 2021 云峰会上,阿里云宣布,飞天操作系统正在全面兼容 X86、ARM、RISC-V 等多种芯片架构,实现“一云多芯”。

 

阿里云智能总裁张建锋表示,传统 IT 时代围绕芯片建立 IT 生态,但云计算从根本上改变了这一模式,云操作系统可以将服务器芯片、专用芯片等硬件封装成标准算力,无论底层芯片是 X86、ARM、RISC-V 还是硬件加速,给客户提供的都是标准的、高质量的云计算服务。

 

芯片方面,2021 年 9 月,阿里云在云栖大会上发布了首款通用芯片倚天 710。作为一款为云而生的芯片,倚天 710 针对云计算特点做了大量优化,性能超过业界标杆 20%,能效比提升 50%以上。

 

架构层面,倚天 710 采用 ARMv9 架构,多达 128 核,主频最高 3.2GHz,可同时兼顾性能和功耗。同时,集成了业界最领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。目前,倚天 710 已在阿里云数据中心内部规模化部署,并支撑了 2021 年双 11 等多个核心业务。

 

在服务器、操作系统方面,阿里云在去年 9 月发布了自研的磐久服务器和龙蜥操作系统。磐久服务器采用了最新型的模块化设计,可实现计算存储分离,包括了高性能计算系列、大容量存储系列、高性能存储系列等,拥有风冷、液冷等不同散热模式,服务器交付效率提升 50%。磐久系列采用软硬件融合方式实现性能提升,结合自研的 MOC、FIC、AliFPGA、神盾卡等,来满足云原生的创新开发对性能和稳定性的机制要求。

 

龙蜥定位于服务器端操作系统,支持 X86、ARM、龙芯(LoongArch)等多种芯片架构和计算场景,性能和稳定性经受住了历年双 11 的严苛考验,为云上典型场景带来 40%的综合性能提升,故障率降低 50%,兼容 CentOS 生态,支持一键迁移,并提供全栈国密能力。

 

在计算层,阿里云自主研发了神龙架构。神龙与 CIPU 结合可将虚拟化转移到专用硬件中进行加速,将物理机的高性能与虚拟机的灵活性融为一体,虚拟化损耗几乎为零,并支持随时扩容。

 

在存储层,阿里云自研的分布式存储系统盘古,是阿里云底层的统一存储架构。盘古采用了分布式系统的容错架构和柔性平台设计,具备弹性伸缩、自动负载均衡等能力,支持块存储、对象存储、表格存储、文件存储、离线大数据处理等多种存储模式。基于盘古系统,阿里云建起丰富的云存储产品,包括公共云存储到混合云存储,从数据迁移到云上丰富的数据管理服务,全球部署规模超 100EB。

 

在网络层,阿里云飞天云操作系统的核心技术平台洛神云网络已经推出了 3.0 新平台架构,支持中心云到本地云和边缘云一致性的云网络体验,通过全新的物联网云连接器和智能接入网关让万物都能上阿里云。

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-06-13 11:333462

评论

发布
暂无评论
发现更多内容

NLP随笔(三)

毛显新

人工智能 自然语言处理 神经网络 深度学习

架构实战营 模块四作业

孫影

架构实战营 #架构实战营

王者并发课-钻石2:分而治之-如何从原理深入理解ForkJoinPool的快与慢

MetaThoughts

Java 多线程 并发

SpringBoot 中的事务处理

xcbeyond

事务 springboot 8月日更

体验设计落地的四个原则和十个步骤

石云升

用户体验 关键时刻 体验设计 8月日更

奥运“哮喘”运动员为什么越来越多?

脑极体

第一次凡尔赛,字节跳动3面+腾讯6面一次过,谈谈我的大厂面经

编程菌

Java 编程 程序员 面试 计算机

12年高级工程师的“飞升之路”

Geek_f90455

Java 程序员 后端

Elasticsearch VS ClickHouse

Se7en

JDK 从8升级到11,使用 G1 GC,HBase 性能下降近20%。JDK 到底干了什么?

毕昇JDK社区

在线网页快捷方式创建工具

入门小站

工具

架构实战营 毕业设计

竹林七贤

从未如此简单:基于Serverless架构的博客

刘宇

Serverless Hexo 博客

再见 Jenkins!几行脚本搞定自动化部署,这款神器有点厉害

编程菌

Java 编程 程序员 计算机 技术宅

缓存数据历险记(一)--被缓存警察上课一天

卢卡多多

redis 缓存 8月日更

DDD领域驱动设计·学习应用·一

小诚信驿站

领域驱动设计 领域驱动模型DDD 中台架构 领域驱动

Windows10下JDK8下载及java环境配置

Bob

8月日更

我测了啊,我真测了!

QualityFocus

测试 质量保障 线上问题 缺陷

Hbase 入门详解

Se7en

【最不佳实践】函数计算的函数是什么意思

刘宇

Serverless

弱口令到底是什么牛马?

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞挖掘

趁着课余时间学点python(二)缩进 标识符 保留字 注释 输入输出的理解

ベ布小禅

8月日更

黄金圈法则解读数据中台(1):为什么需要数据中台

水滴

数据中台 黄金圈法则 8月日更

为什么需要数据库连接池

赖猫

MySQL 数据库 后端 连接池

Linux之watch命令

入门小站

Linux

Vue3异步数据加载组件:suspense

devpoint

Vue 3 8月日更

「SQL数据分析系列」15. 元数据

数据与智能

sql 脚本 元数据

一个好的产品需要一个好的产品

刘宇

产品经理

【最不佳实践】文件上传并不简单

刘宇

Python Serverless 文件上传

各种消息队列设计要点与对比

海明菌

消息队列 消息队列对比 消息队列系统设计

网络攻防学习笔记 Day94

穿过生命散发芬芳

网络攻防 8月日更

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系_云原生_褚杏娟_InfoQ精选文章