【ArchSummit架构师峰会】基于大模型的基础框架、中台、应用层等专题全覆盖 >>> 了解详情
写点什么

核心产品全面 Serverless 化、开源 300 多个 AI 模型加速软件 AI 化,阿里云如何抓住技术“定义权”?

  • 2022-11-04
    北京
  • 本文字数:4241 字

    阅读完需:约 14 分钟

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?

“阿里云将坚持技术长征,抓住未来技术的定义权。”阿里云智能总裁张建锋在 2022 云栖大会上表示。


张建锋表示,随着新一轮的科技变革深入发展,一个全新的计算体系正在到来。过去十多年,云的创新主要集中在软件领域,首先出现了分布式虚拟化,而后实现了资源池化,形成了广泛的应用规模。现在,云计算已经从软件创新,走向软硬件协同创新,用云来定义整个 IT 硬件体系。


张建锋认为,云计算给软件研发范式带来的变革有三个层次:第一,新兴软件开发方式崛起,软件架构全面 Serverless 化;第二,软件开发不再是程序员的专利,低代码让未来 80% 应用能够由业务人员直接开发;第三,未来所有软件都是 AI 化的,大模型开源将加速 AI 真正普及。其中,Serverless 是软件研发范式变革中最重要的趋势之一。


在本届云栖大会上,阿里云向外界展示了自己最新的研发成果和技术趋势分析。继飞天为阿里云打下扎实技术基础后,自研 CPU 芯片倚天 710、下一代云计算体系架构 CIPU 等将为阿里云构建第二技术曲线,成为云面向下一代技术构建的核心竞争力。



“倚天 + 飞天 +CIPU”组合,提升 20% 以上性能


为进一步优化数据处理和传输效率,阿里云构建了以数据为中心的新型云计算架构体系,提供近网络计算和近存储计算的加速技术支撑。


飞天操作系统在 2013 年首次全球范围内突破单一集群 5000 台服务器规模(飞天 5K),并率先对外提供这一能力。此后,飞天操作系统成功支撑了十多年双 11 和 12306 春运购票等极限并发场景。


而在今年的大会上,阿里云发布了一款云数据中心专用处理器 CIPU,替代 CPU 来管理和加速计算、存储和网络资源。CIPU 是一种全新的架构方式,实现了全面专用硬件加速的高性能,包括高带宽、高吞吐和弹性 RDMA 的能力。


在飞天 +CIPU 加持下,Redis/Tair 数据库的缓存 QPS 性能可提升 80%,数据库的主从复制延迟降低 50%、全局一致性读性能提升 5~10 倍,大数据 Spark 性能提升 30%,AI 深度学习图形分类训练性能提升 30%,OLAP 实时数仓查询性能提升 2 倍以上,冷热分层四种存储类型,一份数据支持多种计算引擎……另外,阿里自研的 CPU 倚天 710 已经在数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超 30%、单位算力功耗降低 60%,成为中国首个云上大规模应用的自研 CPU。据悉,在 2021 年双 11 期间,天猫双 11 核心交易系统平滑迁移至倚天 710 实例。未来 2 年,阿里云 20% 的新增算力将使用自研 CPU。


在这个体系下,“倚天 + 飞天 +CIPU”的组合表现也非常亮眼,在数据库、大数据和 AI 及高性能计算、视频编解码等场景下普遍优于业内同类产品,性能可提升 20% 以上。


据悉,搭载倚天芯片的阿里云弹性计算实例 G8M 将于 11 月 15 日正式上线,同时 CIPU 也被首次引入到专有云形态,为政企客户提供存算分离的“一云多芯、一云多 region”架构能力。



阿里云核心产品全面 Serverless 化


Serverless 让云计算从一种资源真正变成了一种能力。张建锋表示,过去云计算用云服务器替代了物理服务器,但客户依旧按“几核几 G 服务器”的模式来购买云资源,未来云计算将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。


这意味着软件开发方式将发生深刻变化,软件架构从原来的主机架构迁移到 Serverless 架构,客户只需要开发业务逻辑,不再需要关心运维问题。此外,Serverless 架构可以降低软件开发门槛,提供更多的预制模块,大幅提高软件生产效率。


目前,阿里云已经拥有超过 20 款 Serverless 产品,包括函数计算 FC、Serverless 应用引擎 SAE、Serverless 容器服务 ASK、PolarDB 数据库、AnalyticDB 数仓等。其中函数计算日调用次数超过 200 亿次,有效支撑历年双 11 百万 QPS 洪峰,业务年均增速超 300%,整体规模位居国内首位。


同时,相关产品也不同领域有广泛应用。比如,零售商超世纪联华将会员系统、交易系统等放在了阿里云函数计算上处理,告别了靠扩展机器支撑大体量业务,促销准备时间从周级缩短到小时级,成本下降 40%。南瓜电影在遇到大量用户涌入时,可在短时间内切换到阿里云 Serverless 应用引擎 SAE,峰值时秒级自动扩容,峰谷时按需自动缩容,总成本下降 40%。


“我们希望让用户做得更少而收获更多,通过 Serverless 化,用云就像用电一样简单。”张建锋表示,未来云将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。



阿里云 Serverless 布局


阿里云数据库 All in Serverless


在 2022 云栖大会上,阿里云还宣布 PolarDB、AnalyticDB(简称 ADB)、RDS、Lindorm 等核心数据库产品已与自研 CPU、CIPU、飞天操作系统进行深度融合创新,并全面 Serverless 化,对外更好地提供一站式数据管理与服务。测试数据如下:


  • RDS 数据库基于自研 CPU 的软硬协同优化,整体性价比提升 25%;

  • PolarDB 通过融合自研 Smart-SSD 智能固态硬盘技术,实现性能零损耗,数据存储成本最高下降 60%。


PolarDB 是业内首创支持跨机 Serverless 服务的云数据库,突破了无感秒切和高性能全局一致性两大技术难点,与按照峰值负载配置容量的成本相比,最多可节省 95% 的数据库成本。同时,PolarDB 数据库最新商业化的云原生 HTAP 功能,在列存索引 IMCI 技术加持之下,TPC-C、TPC-H 性能实现行业大幅领先。


以 PolarDB 和 ADB 为代表的阿里云核心数据库产品也在 HTAP、离在线一体化等前沿技术上发力,进一步提升数据库产品的易用性,并进一步提升性能。其中,ADB 提供离在线一体化数据处理分析能力,基于一份数据融合两种计算模型 (MPP+BSP) 同时支持离线处理和在线分析,解决因数据同步产生的数据一致性和时效性问题,资源成本降低 30% 以上。


据悉,面向未来,阿里云数据库将整体向“四化”方向发展:


  • 云原生化:资源解耦、Serverless 化;

  • 平台化:基于云构建数据平台能力、OpenAPI 标准化;

  • 一体化:处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化;

  • 智能化:AI for DB 简化运维、In-DB ML 挖掘数据价值。


ODPS 可同时调度超 10 万台以上服务器规模


另外,为满足用户多元化数据计算需求,阿里云 ODPS 升级为一体化开放大数据平台。升级后的 ODPS 支持大规模批量计算、实时分析等服务,提供实时流式计算、机器学习等多种计算能力,可同时调度超 10 万台以上服务器规模进行并行计算。


ODPS 实现了存储、调度、元数据管理上的一体化架构融合,支撑智慧交通、生命科学、风险精算等各领域数据的高效处理,并通过 DataWorks 提供一致的数据开发和治理服务。


在刚刚公布的 TPC-H 30000GB 基准测试中,ODPS-Hologres 刷新世界纪录,分数超过 2786 万分,领先第二名 23%。ODPS-MaxCompute 则在 TPCx-BB 100TB 标准测试中,连续 6 年保持性能和性价比第一。


软件 AI 化,大模型开源推动 AI 普及

磐久超高性能网络,时延显著降低 90%


为了突破计算性能、内存资源对 AI 模型训练效率的限制,阿里云打造了一套“磐久超高性能网络”,采用自研的 Solar-RDMA 高速网络协议,使处理器可访问其他任意服务器的内存,非常适合深度学习模型内神经网络的交互形态,相比传统模式可降低长尾时延 90% 以上,最低可至 2 微秒。


基于这套超高性能网络技术及软硬一体化能力,今年 6 月阿里云推出了新一代智能计算产品——灵骏,可最小化所有非计算开销,实现 5 倍的通信性能提升,千卡并行计算效率高达 90%,大规模 AI 场景下性能可提升 2-5 倍。

开源 300 多个 AI 模型,推出 AI 模型社区魔搭


张建锋表示,开源是软件进步的核心推动力量,过去开源推动了软件架构的进步,未来开源还将推动 AI 应用的进步和普及。


为了降低 AI 的使用门槛,充分发挥 AI 的潜能,阿里达摩院联手中国科大、CCF 开源发展委员会、澜舟科技、智谱 AI、深势科技、鹏城实验室云计算研究所、哈工大讯飞联合实验室等多家科研机构共同推出 AI 模型社区“魔搭”ModelScope。


魔搭社区践行“模型即服务(Model as a Service)”的理念,在代码开源的基础上更进一步,将 AI 的代码变成模型,将模型变成服务。社区实现了零门槛 AI 模型体验,一行代码模型推理,十行代码模型调优。


达摩院等率先向社区贡献 300 多个经过验证的优质 AI 模型,超过三分之一为中文模型。利用这些基础模型,开发者只需针对具体场景再稍作调优,就能快速投入使用。

云和端加速融合

无影强化云网端一体安全


张建锋认为,云端加速融合,算力正在不断从终端转移上云,这让终端突破了物理限制,不仅手机、电脑、汽车、音箱会变成计算机,未来万物皆是计算机。


例如,Rokid 在推出的 AR 眼镜中接入阿里云无影架构,利用云上算力,用户打开仅有 85 克重量的眼镜就能在眼前的虚拟现实画面中,与人聊天、办公,并且还能做 3D 渲染、大数据编程等复杂工作。


在 PC 电脑端,未来阿里云继续将 RISC-V 芯片和无影架构结合,让创新终端具有更高性能、更低能耗,并实现全栈自研。目前,阿里巴巴已经成为全球 RISC-V 技术与生态发展的引领者,并且已经完成了和云操作系统的适配,迈出了端边云一体的重要一步。


无影近期在多个场景推出生产力解决方案,包括研发、分支机构、RPA、教育等,往往都属于数据敏感领域。在为终端研发厂商提供更好的云流协议之外,无影进一步集成了安全能力。


无论用户使用既有应用、桌面实例池还是进行其他调度,都能够在敏感数据检测、行为日志处理、高危操作拦截、安全态势感知、外接设备权限、网络与应用安全监控等多个方面,设定符合自己场景的权限与策略。

玄铁 C908 实现 RISC-V 架构高能效突破


另外,阿里云最新发布的玄铁 C908 处理器实现了 RISC-V 架构的高能效突破,较业界同性能处理器能效提升超 30%。


为进一步提升 AI 算力及能效,玄铁 C908 采用最新 RISC-V Vector 1.0 标准,并基于标准新增 DOT 指令,全面优化 AI 算子及算法库,仅典型神经网络计算的性能就提升 50% 以上。在国际权威 MLPerf Tiny V0.7 推理性能测试中,玄铁 C908 超越此前夺冠的玄铁 C906,在图像分类任务中性能再提升 3.5 倍。玄铁 C908 可应用于视觉 AI、智能交互、AR/VR、5G 等场景。

结束语


“科技是阿里巴巴从过去走到现在,并且更好走向未来的基石。”如阿里巴巴董事会主席兼首席执行官张勇在云栖大会上所说,阿里希望用计算为社会提供一种数字化的基础能力。


根据行业权威研究机构 Gartner 发布 2021 年全球云计算 IaaS 市场份额数据,阿里云排名全球第三,市场份额为 9.55%,连续六年实现份额增长;同时,阿里云排名亚太市场第一,市场份额为 25.53%。而面对未来云计算市场日益激烈的竞争,阿里云能否凭借找出的第二技术曲线稳固如今地位甚至更进一步,让我们拭目以待。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-11-04 14:274279

评论

发布
暂无评论
发现更多内容

Java中String类的前世今生

卢卡多多

Java string 6月日更

轮胎行业遇上AI,百度智能云携手固铂轮胎智能化转型

百度大脑

智能云 轮胎

新手模拟实现bind

前端树洞

面试 大前端 js this

C语言从入门到精通(四)

代码情缘

编程 C语言 变量 编程之路 6月日更

工厂里三个质检车间缩减为一个,飞桨企业版EasyDL助力降本增效

百度大脑

飞桨

a.docker

xujiangniao

Docker

深入讲解RxJava响应式编程框架,背压问题的几种应对模式

小Q

Java 学习 编程 架构 面试

手滑党福音,意外删除重要文件怎么办?

淋雨

数据恢复 EasyRecovery 文件恢复

备战金九银十,2021年最全999道Java岗高频面试题分享

Java架构师迁哥

架构解析|网易自研新一代大规模分布式传输网

网易云信

分布式 音视频

iOS APP 架构漫谈

iOSer

ios ios开发 iOS架构

Java--JVM内存结构

是老郭啊

Java JVM简介 JVM内存结构 JVM运行时数据区

C语言从入门到精通(二)

代码情缘

开发 C语言 编程、

C语言从入门到精通(三)

代码情缘

编程 开发 C语言 编程之路 硬件开发

2021上半年1000道大厂高频面试题汇总(Java岗)

Java架构师迁哥

用了这么多年 Gitlab,可能还不了解这些知识

郭旭东

DevOps gitlab 极狐GitLabs

外包3年凭借一手“秒杀架构”成功上岸阿里

Java架构师迁哥

从事开发5年以上的Java程序员,面试会被问到哪些?

Java架构师迁哥

IDEA使用

xujiangniao

Java IDEA

阿里架构师手肛6个月,总结出17W字操作系统、网络教程(导图+笔记)

Java架构师迁哥

阿里开源三天就被狂转50w次的《Java面试突击》限时下载!

Java架构师迁哥

新思科技连续五年获Gartner魔力象限应用安全测试领导者殊荣

InfoQ_434670063458

新思科技 Gartner 魔力象限

Python——注释和字符串的拼接

在即

6月日更

质量基础设施(NQI)“一站式”服务平台开发搭建

源中瑞-龙先生

NQI 质量基础设施“一站式”

去阿里/腾讯/字节面试P7Java岗时,需要掌握哪些技术栈?

Java架构师迁哥

深入浅出负载均衡

vivo互联网技术

负载均衡 高可用 服务器 hash

EBean ORM 框架介绍-2.字段加密、更新日志和历史记录

Barry的异想世界

jpa Ebean 字段加密 更新日志 历史记录

C语言从入门到精通(一)

代码情缘

c++ 编程 开发 C语言 硬件开发

程序员必知的硬核基础知识

Java架构师迁哥

【Redis】概览

awen

redis

2021全球人工智能技术大会开幕 百度王海峰:跨语言沟通正在成为现实

百度大脑

人工智能 沟通 跨语言

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?_语言 & 开发_褚杏娟_InfoQ精选文章