AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

阿里云智能总裁张建锋:阿里云形成“飞天 +CIPU”支撑的云计算技术体系

  • 2022-06-13
  • 本文字数:1783 字

    阅读完需:约 6 分钟

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系

6 月 13 日,阿里云智能总裁张建锋在峰会上发布了云基础设施处理器 CIPU,推动云计算从以 CPU 为中心的体系架构进入以“飞天操作系统+CIPU”为中心的体系架构。

 

张建锋表示,过去十多年,云计算技术经历了两个发展阶段:第一阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求;第二阶段出现了资源池化技术,通过把计算和存储进行分离,而后规模化编排和调度,形成了超大规模的计算和存储资源池。

 

近年来,云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系结构去满足。上述虽然两个阶段的演进推动云计算发展,但都是通过软件定义的方法,基于传统的以 CPU 为中心的体系架构去做优化,已经触及瓶颈。

 

张建锋表示,云计算进入了一个新的发展阶段。“我们越来越接近于下一个时代。新一代的云计算要从数据中心的内部做体系化创新,从以往的以 CPU 为中心的体系架构,进入以 CIPU 为中心的体系架构。

 

根据官方介绍,CIPU 向下接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上接入飞天云操作系统,管控阿里云全球上百万台服务器,让算力虚拟化损耗降到 0,并通过规模化应用 RDMA 网络技术,让访问云端比访问本地硬盘更快。

 

“这是一个全新的架构体系,从最底层的数据中心核心部件到最上层云原生软件,建立了完整的自研技术体系。”张建锋说道,“阿里云做到了软硬件完美结合,形成了‘飞天+CIPU’支撑的云计算技术体系。”

 

过去 13 年,阿里云自研出飞天云操作系统,并构建出自研芯片、服务器、计算、存储、网络等软硬一体的新型计算体系架构。

 

飞天是阿里自研的云操作系统,将遍布全球的上百万台服务器连接成一台超级计算机,单集群可达 10 万台规模,千亿级文件数,EB 级别存储空间。在 2021 云峰会上,阿里云宣布,飞天操作系统正在全面兼容 X86、ARM、RISC-V 等多种芯片架构,实现“一云多芯”。

 

阿里云智能总裁张建锋表示,传统 IT 时代围绕芯片建立 IT 生态,但云计算从根本上改变了这一模式,云操作系统可以将服务器芯片、专用芯片等硬件封装成标准算力,无论底层芯片是 X86、ARM、RISC-V 还是硬件加速,给客户提供的都是标准的、高质量的云计算服务。

 

芯片方面,2021 年 9 月,阿里云在云栖大会上发布了首款通用芯片倚天 710。作为一款为云而生的芯片,倚天 710 针对云计算特点做了大量优化,性能超过业界标杆 20%,能效比提升 50%以上。

 

架构层面,倚天 710 采用 ARMv9 架构,多达 128 核,主频最高 3.2GHz,可同时兼顾性能和功耗。同时,集成了业界最领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。目前,倚天 710 已在阿里云数据中心内部规模化部署,并支撑了 2021 年双 11 等多个核心业务。

 

在服务器、操作系统方面,阿里云在去年 9 月发布了自研的磐久服务器和龙蜥操作系统。磐久服务器采用了最新型的模块化设计,可实现计算存储分离,包括了高性能计算系列、大容量存储系列、高性能存储系列等,拥有风冷、液冷等不同散热模式,服务器交付效率提升 50%。磐久系列采用软硬件融合方式实现性能提升,结合自研的 MOC、FIC、AliFPGA、神盾卡等,来满足云原生的创新开发对性能和稳定性的机制要求。

 

龙蜥定位于服务器端操作系统,支持 X86、ARM、龙芯(LoongArch)等多种芯片架构和计算场景,性能和稳定性经受住了历年双 11 的严苛考验,为云上典型场景带来 40%的综合性能提升,故障率降低 50%,兼容 CentOS 生态,支持一键迁移,并提供全栈国密能力。

 

在计算层,阿里云自主研发了神龙架构。神龙与 CIPU 结合可将虚拟化转移到专用硬件中进行加速,将物理机的高性能与虚拟机的灵活性融为一体,虚拟化损耗几乎为零,并支持随时扩容。

 

在存储层,阿里云自研的分布式存储系统盘古,是阿里云底层的统一存储架构。盘古采用了分布式系统的容错架构和柔性平台设计,具备弹性伸缩、自动负载均衡等能力,支持块存储、对象存储、表格存储、文件存储、离线大数据处理等多种存储模式。基于盘古系统,阿里云建起丰富的云存储产品,包括公共云存储到混合云存储,从数据迁移到云上丰富的数据管理服务,全球部署规模超 100EB。

 

在网络层,阿里云飞天云操作系统的核心技术平台洛神云网络已经推出了 3.0 新平台架构,支持中心云到本地云和边缘云一致性的云网络体验,通过全新的物联网云连接器和智能接入网关让万物都能上阿里云。

 

2022-06-13 11:334468

评论

发布
暂无评论
发现更多内容

公众号运营推广方式

源字节1号

软件开发

Nacos 源码简析之 Nacos Client 自动注册原理

道嗔

源码 nacos

LeetCode 242:有效的字母异位词

武师叔

5月月更

Centos7升级Python2到Python3

入门小站

Linux

某年某周每一天的时间是多少

入门小站

工具

读《Software Engineering at Google》(20)

术子米德

架构师成长笔记

极简Java数据结构-环形队列突破上限

芝士味的椒盐

Java 数据结构 5月月更

阿里巴巴Java性能调优实战

Joseph295

[Day33-03]-[二叉树] 二叉树展开为链表

方勇(gopher)

LeetCode 二叉树 数据结构和算法

TypeScript 概述

Emperor_LawD

typescript 5月月更

在线Excel转YAML工具

入门小站

工具

读《Software Engineering at Google》(17)

术子米德

架构师成长笔记

读《Software Engineering at Google》(22)

术子米德

架构师成长笔记

如何在 WordPress 中创建登录页面

海拥(haiyong.site)

WordPress 5月月更

【愚公系列】2022年05月 二十三种设计模式(二)-抽象工厂模式(Abstract Factory Pattern)

愚公搬代码

5月月更

读《Software Engineering at Google》(24)

术子米德

架构师成长笔记

洞见科技李博:科技向实,隐私计算规模化应用吹响号角

洞见科技

金融科技 隐私计算

ubuntu 18及以上版本配置IP的方法,你get了吗

伍工

Linux 网络

Apache Calcite整体架构及处理流程

不穿格子衬衫的程序员

大数据 Apache Calcite database SQL解析

《Linux是怎么样工作的》读书笔记

懒时小窝

Linux Linux Kenel

读《Software Engineering at Google》(21)

术子米德

架构师成长笔记

抽象类——加油站加油

程序员猪小哼

安装Maven到Idea配置Maven竟如此简单

芝士味的椒盐

Java maven 5月月更

[Day33-02]-[二叉树] 恢复二叉搜索树

方勇(gopher)

LeetCode 二叉树 数据结构和算法

二、应用高可用设计要点

穿过生命散发芬芳

5月月更 高可用设计

读《Software Engineering at Google》(16)

术子米德

架构师成长笔记

读《Software Engineering at Google》(23)

术子米德

架构师成长笔记

全链路压测(十):测试要做的准备工作

老张

性能测试 全链路压测 稳定性保障

Netty篇之内存管理器

邱学喆

内存管理器 netty内存管理 jemalloc管理器

读《Software Engineering at Google》(19)

术子米德

架构师成长笔记

读《Software Engineering at Google》(18)

术子米德

架构师成长笔记

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系_云原生_褚杏娟_InfoQ精选文章