【FCon上海】与行业领袖共话AI大模型、数字化风控等前沿技术。 了解详情
写点什么

阿里云智能总裁张建锋:阿里云形成“飞天 +CIPU”支撑的云计算技术体系

  • 2022-06-13
  • 本文字数:1783 字

    阅读完需:约 6 分钟

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

6 月 13 日,阿里云智能总裁张建锋在峰会上发布了云基础设施处理器 CIPU,推动云计算从以 CPU 为中心的体系架构进入以“飞天操作系统+CIPU”为中心的体系架构。

 

张建锋表示,过去十多年,云计算技术经历了两个发展阶段:第一阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求;第二阶段出现了资源池化技术,通过把计算和存储进行分离,而后规模化编排和调度,形成了超大规模的计算和存储资源池。

 

近年来,云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系结构去满足。上述虽然两个阶段的演进推动云计算发展,但都是通过软件定义的方法,基于传统的以 CPU 为中心的体系架构去做优化,已经触及瓶颈。

 

张建锋表示,云计算进入了一个新的发展阶段。“我们越来越接近于下一个时代。新一代的云计算要从数据中心的内部做体系化创新,从以往的以 CPU 为中心的体系架构,进入以 CIPU 为中心的体系架构。

 

根据官方介绍,CIPU 向下接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上接入飞天云操作系统,管控阿里云全球上百万台服务器,让算力虚拟化损耗降到 0,并通过规模化应用 RDMA 网络技术,让访问云端比访问本地硬盘更快。

 

“这是一个全新的架构体系,从最底层的数据中心核心部件到最上层云原生软件,建立了完整的自研技术体系。”张建锋说道,“阿里云做到了软硬件完美结合,形成了‘飞天+CIPU’支撑的云计算技术体系。”

 

过去 13 年,阿里云自研出飞天云操作系统,并构建出自研芯片、服务器、计算、存储、网络等软硬一体的新型计算体系架构。

 

飞天是阿里自研的云操作系统,将遍布全球的上百万台服务器连接成一台超级计算机,单集群可达 10 万台规模,千亿级文件数,EB 级别存储空间。在 2021 云峰会上,阿里云宣布,飞天操作系统正在全面兼容 X86、ARM、RISC-V 等多种芯片架构,实现“一云多芯”。

 

阿里云智能总裁张建锋表示,传统 IT 时代围绕芯片建立 IT 生态,但云计算从根本上改变了这一模式,云操作系统可以将服务器芯片、专用芯片等硬件封装成标准算力,无论底层芯片是 X86、ARM、RISC-V 还是硬件加速,给客户提供的都是标准的、高质量的云计算服务。

 

芯片方面,2021 年 9 月,阿里云在云栖大会上发布了首款通用芯片倚天 710。作为一款为云而生的芯片,倚天 710 针对云计算特点做了大量优化,性能超过业界标杆 20%,能效比提升 50%以上。

 

架构层面,倚天 710 采用 ARMv9 架构,多达 128 核,主频最高 3.2GHz,可同时兼顾性能和功耗。同时,集成了业界最领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。目前,倚天 710 已在阿里云数据中心内部规模化部署,并支撑了 2021 年双 11 等多个核心业务。

 

在服务器、操作系统方面,阿里云在去年 9 月发布了自研的磐久服务器和龙蜥操作系统。磐久服务器采用了最新型的模块化设计,可实现计算存储分离,包括了高性能计算系列、大容量存储系列、高性能存储系列等,拥有风冷、液冷等不同散热模式,服务器交付效率提升 50%。磐久系列采用软硬件融合方式实现性能提升,结合自研的 MOC、FIC、AliFPGA、神盾卡等,来满足云原生的创新开发对性能和稳定性的机制要求。

 

龙蜥定位于服务器端操作系统,支持 X86、ARM、龙芯(LoongArch)等多种芯片架构和计算场景,性能和稳定性经受住了历年双 11 的严苛考验,为云上典型场景带来 40%的综合性能提升,故障率降低 50%,兼容 CentOS 生态,支持一键迁移,并提供全栈国密能力。

 

在计算层,阿里云自主研发了神龙架构。神龙与 CIPU 结合可将虚拟化转移到专用硬件中进行加速,将物理机的高性能与虚拟机的灵活性融为一体,虚拟化损耗几乎为零,并支持随时扩容。

 

在存储层,阿里云自研的分布式存储系统盘古,是阿里云底层的统一存储架构。盘古采用了分布式系统的容错架构和柔性平台设计,具备弹性伸缩、自动负载均衡等能力,支持块存储、对象存储、表格存储、文件存储、离线大数据处理等多种存储模式。基于盘古系统,阿里云建起丰富的云存储产品,包括公共云存储到混合云存储,从数据迁移到云上丰富的数据管理服务,全球部署规模超 100EB。

 

在网络层,阿里云飞天云操作系统的核心技术平台洛神云网络已经推出了 3.0 新平台架构,支持中心云到本地云和边缘云一致性的云网络体验,通过全新的物联网云连接器和智能接入网关让万物都能上阿里云。

 

公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2022-06-13 11:333517

评论

发布
暂无评论
发现更多内容

画饼,是领导者的基本技能

搬砖的周狮傅

管理 管理经

常回家看看

Tiger

28天写作

PassJava 开源 (八) :Spring Cloud 整合 Nacos配置中心

悟空聊架构

nacos 28天写作 passjava 悟空聊架构 12月日更

Dubbo 框架学习笔记十三

风翱

dubbo 12月日更

如何命名指标和标签

耳东@Erdong

Prometheus label Metric Naming

数据编织趋势探秘

Kafka中文社区

技术职场主题线上沙龙|程序员百万年薪进阶指南

智联卓聘

职场成长 Java技术提升 技术职场 百万年薪

电子书网站推荐

坚果

28天写作 12月日更

更快的Maven来了,我的天,速度提升了8倍!

王磊

分析内部运行机制,教你解决Redis性能问题

华为云开发者联盟

数据库 redis 缓存 GaussDB(for Redis) 结构化存储

架构实战训练营-模块4-作业

温安适

「架构实战营」

前端开发:基于移动端的Vue项目的Loading使用

三掌柜

28t 28天写作 12月日更

php项目使用xdebug远程调试

try catch

php 调试 Xdebug

SpringBoot2 API接口签名实现

编程江湖

springboot

如何强化应用安全能力,全面拦截 Log4j 漏洞攻击

阿里巴巴云原生

阿里云 云原生 安全 log4j

某俄罗斯小哥,竟靠一个服务器软件直接封神?

沉默王二

nginx

“积木拼装”,HarmonyOS弹性部署大揭秘!|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

25《重学JAVA》--多线程(二)

杨鹏Geek

Java25周年 28天写作 12月日更

架构训练营 - 模块八

Geek_9de3de

架构实战营

读写锁ReentranReadWriteLock源码分析

Ayue、

读写锁 lock

结束了(26/28)

赵新龙

28天写作

书单 | 这6本书,带你轻松学习自动化办公

博文视点Broadview

给弟弟的信第25封|这个世界有上帝吗?

大菠萝

28天写作

云图说|ModelArts Pro:让AI开发更简单

华为云开发者联盟

AI 华为云 ModelArts Pro 云图说

我在《Effective STL》中的找到的知识点

SkyFire

c++ stl

架构实战营模块七作业

spark99

架构实战营

前端开发:自定义时间轴的使用

三掌柜

28t 28天写作 12月日更

Vue学习的4个实用的Javascript技巧

编程江湖

VUE 3.0 源码

聊聊 Kafka: Consumer 源码解析之 Rebalance 机制

老周聊架构

签约计划第二季

开源 Serverless 里程碑:Knative 1.0 来了

阿里巴巴云原生

阿里云 开源 Serverless 云原生 Knative

架构实战营模块七作业

孙志强

架构实战营

阿里云智能总裁张建锋:阿里云形成“飞天+CIPU”支撑的云计算技术体系_云原生_褚杏娟_InfoQ精选文章