QCon 全球软件开发大会倒计时2个月!讲师已确认60%+ >>> 了解详情
写点什么

阿里云智能总裁张建锋:阿里云形成“飞天 +CIPU”支撑的云计算技术体系

  • 2022-06-13
  • 本文字数:1783 字

    阅读完需:约 6 分钟

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系

6 月 13 日,阿里云智能总裁张建锋在峰会上发布了云基础设施处理器 CIPU,推动云计算从以 CPU 为中心的体系架构进入以“飞天操作系统+CIPU”为中心的体系架构。

 

张建锋表示,过去十多年,云计算技术经历了两个发展阶段:第一阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求;第二阶段出现了资源池化技术,通过把计算和存储进行分离,而后规模化编排和调度,形成了超大规模的计算和存储资源池。

 

近年来,云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系结构去满足。上述虽然两个阶段的演进推动云计算发展,但都是通过软件定义的方法,基于传统的以 CPU 为中心的体系架构去做优化,已经触及瓶颈。

 

张建锋表示,云计算进入了一个新的发展阶段。“我们越来越接近于下一个时代。新一代的云计算要从数据中心的内部做体系化创新,从以往的以 CPU 为中心的体系架构,进入以 CIPU 为中心的体系架构。

 

根据官方介绍,CIPU 向下接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上接入飞天云操作系统,管控阿里云全球上百万台服务器,让算力虚拟化损耗降到 0,并通过规模化应用 RDMA 网络技术,让访问云端比访问本地硬盘更快。

 

“这是一个全新的架构体系,从最底层的数据中心核心部件到最上层云原生软件,建立了完整的自研技术体系。”张建锋说道,“阿里云做到了软硬件完美结合,形成了‘飞天+CIPU’支撑的云计算技术体系。”

 

过去 13 年,阿里云自研出飞天云操作系统,并构建出自研芯片、服务器、计算、存储、网络等软硬一体的新型计算体系架构。

 

飞天是阿里自研的云操作系统,将遍布全球的上百万台服务器连接成一台超级计算机,单集群可达 10 万台规模,千亿级文件数,EB 级别存储空间。在 2021 云峰会上,阿里云宣布,飞天操作系统正在全面兼容 X86、ARM、RISC-V 等多种芯片架构,实现“一云多芯”。

 

阿里云智能总裁张建锋表示,传统 IT 时代围绕芯片建立 IT 生态,但云计算从根本上改变了这一模式,云操作系统可以将服务器芯片、专用芯片等硬件封装成标准算力,无论底层芯片是 X86、ARM、RISC-V 还是硬件加速,给客户提供的都是标准的、高质量的云计算服务。

 

芯片方面,2021 年 9 月,阿里云在云栖大会上发布了首款通用芯片倚天 710。作为一款为云而生的芯片,倚天 710 针对云计算特点做了大量优化,性能超过业界标杆 20%,能效比提升 50%以上。

 

架构层面,倚天 710 采用 ARMv9 架构,多达 128 核,主频最高 3.2GHz,可同时兼顾性能和功耗。同时,集成了业界最领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。目前,倚天 710 已在阿里云数据中心内部规模化部署,并支撑了 2021 年双 11 等多个核心业务。

 

在服务器、操作系统方面,阿里云在去年 9 月发布了自研的磐久服务器和龙蜥操作系统。磐久服务器采用了最新型的模块化设计,可实现计算存储分离,包括了高性能计算系列、大容量存储系列、高性能存储系列等,拥有风冷、液冷等不同散热模式,服务器交付效率提升 50%。磐久系列采用软硬件融合方式实现性能提升,结合自研的 MOC、FIC、AliFPGA、神盾卡等,来满足云原生的创新开发对性能和稳定性的机制要求。

 

龙蜥定位于服务器端操作系统,支持 X86、ARM、龙芯(LoongArch)等多种芯片架构和计算场景,性能和稳定性经受住了历年双 11 的严苛考验,为云上典型场景带来 40%的综合性能提升,故障率降低 50%,兼容 CentOS 生态,支持一键迁移,并提供全栈国密能力。

 

在计算层,阿里云自主研发了神龙架构。神龙与 CIPU 结合可将虚拟化转移到专用硬件中进行加速,将物理机的高性能与虚拟机的灵活性融为一体,虚拟化损耗几乎为零,并支持随时扩容。

 

在存储层,阿里云自研的分布式存储系统盘古,是阿里云底层的统一存储架构。盘古采用了分布式系统的容错架构和柔性平台设计,具备弹性伸缩、自动负载均衡等能力,支持块存储、对象存储、表格存储、文件存储、离线大数据处理等多种存储模式。基于盘古系统,阿里云建起丰富的云存储产品,包括公共云存储到混合云存储,从数据迁移到云上丰富的数据管理服务,全球部署规模超 100EB。

 

在网络层,阿里云飞天云操作系统的核心技术平台洛神云网络已经推出了 3.0 新平台架构,支持中心云到本地云和边缘云一致性的云网络体验,通过全新的物联网云连接器和智能接入网关让万物都能上阿里云。

 

2022-06-13 11:333439

评论

发布
暂无评论
发现更多内容

既不是研发顶尖高手,也不是销售大牛,为何偏偏获得 2 万 RMB 的首个涛思文化奖?

TDengine

数据库 tdengine 时序数据库

AutoK3s v0.5.0 发布 延续简约和友好

Rancher

Kubernetes k8s rancher

招募令|数据可视化开发平台“FlyFish”「超级体验官」招募啦!

云智慧AIOps社区

前端 前端开发 低代码 数据可视化 可视化开发

Apache ShardingSphere 5.1.2 发布|全新驱动 API + 云原生部署,打造高性能数据网关

SphereEx

云原生 ShardingSphere 版本更新

容器云是什么意思?与堡垒机有什么区别?

行云管家

云计算 运维 容器云 堡垒机 IT运维

3M互助智能合约系统开发搭建技术

薇電13242772558

智能合约

MAUI与Blazor共享一套UI,媲美Flutter,实现Windows、macOS、Android、iOS、Web通用UI

沙漠尽头的狼

C# MAUI Blazor Blazor Server Blazor WebAssembly 跨平台UI

云堡垒机分布式集群部署优缺点简单说明-行云管家

行云管家

云计算 网络安全 堡垒机 云堡垒机

进击的程序员,如何提升研发效能?|直播预告

万事ONES

依靠可信AI的鲁棒性有效识别深度伪造,帮助银行对抗身份欺诈

易观分析

AI

浅谈德州扑克AI核心算法:CFR

行者AI

人工智能 AI 强化学习

2022年中国手机银行年度专题分析

易观分析

手机银行

融云 x DiDO:中东热土上的语音社交「萌狮」

融云 RongCloud

云原生监控系统·夜莺近期新功能一览,解决多个生产痛点

龙渊秦五

云原生 Prometheus Nightingale 运维监控

大数据培训flink之电商用户行为项目整体介绍

@零度

flink 大数据开发

百度交易中台之钱包系统架构浅析

百度Geek说

系统架构 百度app

《网络是怎么样连接的》读书笔记 - ADSL

懒时小窝

网络编程

Linux下玩转nginx系列(六)---nginx实现cache(缓存)服务

anyRTC开发者

nginx Linux 缓存 音视频 服务器

智能制造的下一站:云原生+边缘计算双轮驱动

York

云原生 边缘计算 工业互联网 云边端协同

Ares阿瑞斯i质押LP挖矿众筹模式dapp智能合约定制

开发微hkkf5566

GraalVM 与 Spring Native 项目实现链路可观测

观测云

撰写有效帮助文档的7大秘诀

小炮

不容错过的2大直播!Linux应用运行抖动的背后&身临其境体验Anolis OS|第25-26期

OpenAnolis小助手

Linux 开源 操作系统 直播 龙蜥大讲堂

中国游戏的“外卷”大时代,中小厂商如何破解出海难题?

Geek_2d6073

集成底座方案演示说明

agileai

集成底座 企业服务总线 统一身份管理平台 主数据管理平台 方案演示

Vue-16-表单绑定

Python研究所

6月月更

为什么要做茶叶商城小程序app开发?

开源直播系统源码

软件开发 一对一源码 小程序商城

高效远程办公手册| 社区征文

程序员-小江

初夏征文

更新视图——基于函数的视图 Django

海拥(haiyong.site)

Python django 6月月更

《网络是怎么样连接的》读书笔记 - FTTH

懒时小窝

网络编程

2022年Q1手机银行用户规模达6.5亿,加强ESG个人金融产品创新

易观分析

手机银行

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系_云原生_褚杏娟_InfoQ精选文章