最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

核心产品全面 Serverless 化、开源 300 多个 AI 模型加速软件 AI 化,阿里云如何抓住技术“定义权”?

  • 2022-11-04
    北京
  • 本文字数:4241 字

    阅读完需:约 14 分钟

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?

“阿里云将坚持技术长征,抓住未来技术的定义权。”阿里云智能总裁张建锋在 2022 云栖大会上表示。


张建锋表示,随着新一轮的科技变革深入发展,一个全新的计算体系正在到来。过去十多年,云的创新主要集中在软件领域,首先出现了分布式虚拟化,而后实现了资源池化,形成了广泛的应用规模。现在,云计算已经从软件创新,走向软硬件协同创新,用云来定义整个 IT 硬件体系。


张建锋认为,云计算给软件研发范式带来的变革有三个层次:第一,新兴软件开发方式崛起,软件架构全面 Serverless 化;第二,软件开发不再是程序员的专利,低代码让未来 80% 应用能够由业务人员直接开发;第三,未来所有软件都是 AI 化的,大模型开源将加速 AI 真正普及。其中,Serverless 是软件研发范式变革中最重要的趋势之一。


在本届云栖大会上,阿里云向外界展示了自己最新的研发成果和技术趋势分析。继飞天为阿里云打下扎实技术基础后,自研 CPU 芯片倚天 710、下一代云计算体系架构 CIPU 等将为阿里云构建第二技术曲线,成为云面向下一代技术构建的核心竞争力。



“倚天 + 飞天 +CIPU”组合,提升 20% 以上性能


为进一步优化数据处理和传输效率,阿里云构建了以数据为中心的新型云计算架构体系,提供近网络计算和近存储计算的加速技术支撑。


飞天操作系统在 2013 年首次全球范围内突破单一集群 5000 台服务器规模(飞天 5K),并率先对外提供这一能力。此后,飞天操作系统成功支撑了十多年双 11 和 12306 春运购票等极限并发场景。


而在今年的大会上,阿里云发布了一款云数据中心专用处理器 CIPU,替代 CPU 来管理和加速计算、存储和网络资源。CIPU 是一种全新的架构方式,实现了全面专用硬件加速的高性能,包括高带宽、高吞吐和弹性 RDMA 的能力。


在飞天 +CIPU 加持下,Redis/Tair 数据库的缓存 QPS 性能可提升 80%,数据库的主从复制延迟降低 50%、全局一致性读性能提升 5~10 倍,大数据 Spark 性能提升 30%,AI 深度学习图形分类训练性能提升 30%,OLAP 实时数仓查询性能提升 2 倍以上,冷热分层四种存储类型,一份数据支持多种计算引擎……另外,阿里自研的 CPU 倚天 710 已经在数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超 30%、单位算力功耗降低 60%,成为中国首个云上大规模应用的自研 CPU。据悉,在 2021 年双 11 期间,天猫双 11 核心交易系统平滑迁移至倚天 710 实例。未来 2 年,阿里云 20% 的新增算力将使用自研 CPU。


在这个体系下,“倚天 + 飞天 +CIPU”的组合表现也非常亮眼,在数据库、大数据和 AI 及高性能计算、视频编解码等场景下普遍优于业内同类产品,性能可提升 20% 以上。


据悉,搭载倚天芯片的阿里云弹性计算实例 G8M 将于 11 月 15 日正式上线,同时 CIPU 也被首次引入到专有云形态,为政企客户提供存算分离的“一云多芯、一云多 region”架构能力。



阿里云核心产品全面 Serverless 化


Serverless 让云计算从一种资源真正变成了一种能力。张建锋表示,过去云计算用云服务器替代了物理服务器,但客户依旧按“几核几 G 服务器”的模式来购买云资源,未来云计算将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。


这意味着软件开发方式将发生深刻变化,软件架构从原来的主机架构迁移到 Serverless 架构,客户只需要开发业务逻辑,不再需要关心运维问题。此外,Serverless 架构可以降低软件开发门槛,提供更多的预制模块,大幅提高软件生产效率。


目前,阿里云已经拥有超过 20 款 Serverless 产品,包括函数计算 FC、Serverless 应用引擎 SAE、Serverless 容器服务 ASK、PolarDB 数据库、AnalyticDB 数仓等。其中函数计算日调用次数超过 200 亿次,有效支撑历年双 11 百万 QPS 洪峰,业务年均增速超 300%,整体规模位居国内首位。


同时,相关产品也不同领域有广泛应用。比如,零售商超世纪联华将会员系统、交易系统等放在了阿里云函数计算上处理,告别了靠扩展机器支撑大体量业务,促销准备时间从周级缩短到小时级,成本下降 40%。南瓜电影在遇到大量用户涌入时,可在短时间内切换到阿里云 Serverless 应用引擎 SAE,峰值时秒级自动扩容,峰谷时按需自动缩容,总成本下降 40%。


“我们希望让用户做得更少而收获更多,通过 Serverless 化,用云就像用电一样简单。”张建锋表示,未来云将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。



阿里云 Serverless 布局


阿里云数据库 All in Serverless


在 2022 云栖大会上,阿里云还宣布 PolarDB、AnalyticDB(简称 ADB)、RDS、Lindorm 等核心数据库产品已与自研 CPU、CIPU、飞天操作系统进行深度融合创新,并全面 Serverless 化,对外更好地提供一站式数据管理与服务。测试数据如下:


  • RDS 数据库基于自研 CPU 的软硬协同优化,整体性价比提升 25%;

  • PolarDB 通过融合自研 Smart-SSD 智能固态硬盘技术,实现性能零损耗,数据存储成本最高下降 60%。


PolarDB 是业内首创支持跨机 Serverless 服务的云数据库,突破了无感秒切和高性能全局一致性两大技术难点,与按照峰值负载配置容量的成本相比,最多可节省 95% 的数据库成本。同时,PolarDB 数据库最新商业化的云原生 HTAP 功能,在列存索引 IMCI 技术加持之下,TPC-C、TPC-H 性能实现行业大幅领先。


以 PolarDB 和 ADB 为代表的阿里云核心数据库产品也在 HTAP、离在线一体化等前沿技术上发力,进一步提升数据库产品的易用性,并进一步提升性能。其中,ADB 提供离在线一体化数据处理分析能力,基于一份数据融合两种计算模型 (MPP+BSP) 同时支持离线处理和在线分析,解决因数据同步产生的数据一致性和时效性问题,资源成本降低 30% 以上。


据悉,面向未来,阿里云数据库将整体向“四化”方向发展:


  • 云原生化:资源解耦、Serverless 化;

  • 平台化:基于云构建数据平台能力、OpenAPI 标准化;

  • 一体化:处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化;

  • 智能化:AI for DB 简化运维、In-DB ML 挖掘数据价值。


ODPS 可同时调度超 10 万台以上服务器规模


另外,为满足用户多元化数据计算需求,阿里云 ODPS 升级为一体化开放大数据平台。升级后的 ODPS 支持大规模批量计算、实时分析等服务,提供实时流式计算、机器学习等多种计算能力,可同时调度超 10 万台以上服务器规模进行并行计算。


ODPS 实现了存储、调度、元数据管理上的一体化架构融合,支撑智慧交通、生命科学、风险精算等各领域数据的高效处理,并通过 DataWorks 提供一致的数据开发和治理服务。


在刚刚公布的 TPC-H 30000GB 基准测试中,ODPS-Hologres 刷新世界纪录,分数超过 2786 万分,领先第二名 23%。ODPS-MaxCompute 则在 TPCx-BB 100TB 标准测试中,连续 6 年保持性能和性价比第一。


软件 AI 化,大模型开源推动 AI 普及

磐久超高性能网络,时延显著降低 90%


为了突破计算性能、内存资源对 AI 模型训练效率的限制,阿里云打造了一套“磐久超高性能网络”,采用自研的 Solar-RDMA 高速网络协议,使处理器可访问其他任意服务器的内存,非常适合深度学习模型内神经网络的交互形态,相比传统模式可降低长尾时延 90% 以上,最低可至 2 微秒。


基于这套超高性能网络技术及软硬一体化能力,今年 6 月阿里云推出了新一代智能计算产品——灵骏,可最小化所有非计算开销,实现 5 倍的通信性能提升,千卡并行计算效率高达 90%,大规模 AI 场景下性能可提升 2-5 倍。

开源 300 多个 AI 模型,推出 AI 模型社区魔搭


张建锋表示,开源是软件进步的核心推动力量,过去开源推动了软件架构的进步,未来开源还将推动 AI 应用的进步和普及。


为了降低 AI 的使用门槛,充分发挥 AI 的潜能,阿里达摩院联手中国科大、CCF 开源发展委员会、澜舟科技、智谱 AI、深势科技、鹏城实验室云计算研究所、哈工大讯飞联合实验室等多家科研机构共同推出 AI 模型社区“魔搭”ModelScope。


魔搭社区践行“模型即服务(Model as a Service)”的理念,在代码开源的基础上更进一步,将 AI 的代码变成模型,将模型变成服务。社区实现了零门槛 AI 模型体验,一行代码模型推理,十行代码模型调优。


达摩院等率先向社区贡献 300 多个经过验证的优质 AI 模型,超过三分之一为中文模型。利用这些基础模型,开发者只需针对具体场景再稍作调优,就能快速投入使用。

云和端加速融合

无影强化云网端一体安全


张建锋认为,云端加速融合,算力正在不断从终端转移上云,这让终端突破了物理限制,不仅手机、电脑、汽车、音箱会变成计算机,未来万物皆是计算机。


例如,Rokid 在推出的 AR 眼镜中接入阿里云无影架构,利用云上算力,用户打开仅有 85 克重量的眼镜就能在眼前的虚拟现实画面中,与人聊天、办公,并且还能做 3D 渲染、大数据编程等复杂工作。


在 PC 电脑端,未来阿里云继续将 RISC-V 芯片和无影架构结合,让创新终端具有更高性能、更低能耗,并实现全栈自研。目前,阿里巴巴已经成为全球 RISC-V 技术与生态发展的引领者,并且已经完成了和云操作系统的适配,迈出了端边云一体的重要一步。


无影近期在多个场景推出生产力解决方案,包括研发、分支机构、RPA、教育等,往往都属于数据敏感领域。在为终端研发厂商提供更好的云流协议之外,无影进一步集成了安全能力。


无论用户使用既有应用、桌面实例池还是进行其他调度,都能够在敏感数据检测、行为日志处理、高危操作拦截、安全态势感知、外接设备权限、网络与应用安全监控等多个方面,设定符合自己场景的权限与策略。

玄铁 C908 实现 RISC-V 架构高能效突破


另外,阿里云最新发布的玄铁 C908 处理器实现了 RISC-V 架构的高能效突破,较业界同性能处理器能效提升超 30%。


为进一步提升 AI 算力及能效,玄铁 C908 采用最新 RISC-V Vector 1.0 标准,并基于标准新增 DOT 指令,全面优化 AI 算子及算法库,仅典型神经网络计算的性能就提升 50% 以上。在国际权威 MLPerf Tiny V0.7 推理性能测试中,玄铁 C908 超越此前夺冠的玄铁 C906,在图像分类任务中性能再提升 3.5 倍。玄铁 C908 可应用于视觉 AI、智能交互、AR/VR、5G 等场景。

结束语


“科技是阿里巴巴从过去走到现在,并且更好走向未来的基石。”如阿里巴巴董事会主席兼首席执行官张勇在云栖大会上所说,阿里希望用计算为社会提供一种数字化的基础能力。


根据行业权威研究机构 Gartner 发布 2021 年全球云计算 IaaS 市场份额数据,阿里云排名全球第三,市场份额为 9.55%,连续六年实现份额增长;同时,阿里云排名亚太市场第一,市场份额为 25.53%。而面对未来云计算市场日益激烈的竞争,阿里云能否凭借找出的第二技术曲线稳固如今地位甚至更进一步,让我们拭目以待。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-11-04 14:274253

评论

发布
暂无评论
发现更多内容

支持适配国产化平台的云管理软件你给推荐哪家?

行云管家

云计算 云服务 国产化 云管理

香港站群服务器构建多站点网络的利器,将业务推向新高度

一只扑棱蛾子

站群服务器

ReentrantLock源码解析

Khirye

源码解析 Java源码 ReentrantLock

一文了解亚马逊云科技适用于 Amazon Lightsail 的托管数据库

亚马逊云科技 (Amazon Web Services)

杀死Node.js!全新JS运行时“快到飞起”!

高端章鱼哥

node.js js Bun

如何使用Vcluster实现Kubernetes中的多租户

互联网工科生

Kubernetes 集群

多地同频|2023年国家网络安全宣传周 海泰方圆全面参与共建网络强国

电子信息发烧客

什么是高刷LED屏?

Dylan

刷新 LED显示屏 led显示屏厂家

SmartNews 基于 Flink 的 Iceberg 实时数据湖实践

Apache Flink

大数据 flink 实时计算

幸福里基于 Flink & Paimon 的流式数仓实践

Apache Flink

大数据 flink

研发效能|DevOps 是运维还是开发?

laofo

DevOps cicd 研发效能 持续交付 效能度量

基于Falcon-7B模型的QLoRA微调实操:构建面向心理健康领域的Chatbot

Baihai IDP

AI LLM 白海科技 大模型微调实践 QLoRA实践

SDK或低代码运行时,提示找不到某些库文件

矩视智能

深度学习 机器视觉

卡奥斯第二届1024程序员节重磅预告!

Openlab_cosmoplat

开源 低代码

从理解到实现:一种强大的AI技术

百度开发者中心

深度学习 #人工智能 生成式AI

文心一言 VS 讯飞星火 VS chatgpt (95)-- 算法导论9.2 4题

福大大架构师每日一题

福大大架构师每日一题

未来社交媒体的变革者

百度开发者中心

媒体服务 #人工智能 生成式AI

大模型开发:从数据挖掘到智能应用

百度开发者中心

AIGC #人工智能 大模型微调

Xojo 2023 Release for mac(跨平台编程开发工具) v23.2.0.3.60612中文激活版

mac

windows 苹果mac Xojo 软件开发工具

小米华为,化干戈为玉帛!

这我可不懂

华为 小米

大咖云集腾讯DevSecOps实践研讨会,共话落地实践经验

Geek_2d6073

应用场域的深度融合与创新构想

百度开发者中心

#人工智能 ChatGPT 大模型微调

创新性与自主性的融合

百度开发者中心

AIGC #人工智能 生成式AI

从过去5年CWE TOP 25的数据看软件缺陷的防护

华为云PaaS服务小智

云计算 软件开发 代码

国密算法是什么意思?支持国密算法的云管平台哪家好?

行云管家

云计算 云管平台 云管理 国密 国密浏览器

晋级揭晓!华秋第九届中国硬件创新创客大赛-华东分赛区决赛成功举办!

华秋电子

创业

流动性质押挖矿系统开发技术说明

V\TG【ch3nguang】

Wappalyzer浏览器插件:揭开网站的技术秘密

凌览

前端 后端 网站 Wappalyzer

OP链丨ARB链代币合约质押挖矿系统开发

l8l259l3365

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?_语言 & 开发_褚杏娟_InfoQ精选文章