写点什么

核心产品全面 Serverless 化、开源 300 多个 AI 模型加速软件 AI 化,阿里云如何抓住技术“定义权”?

  • 2022-11-04
    北京
  • 本文字数:4241 字

    阅读完需:约 14 分钟

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?

“阿里云将坚持技术长征,抓住未来技术的定义权。”阿里云智能总裁张建锋在 2022 云栖大会上表示。


张建锋表示,随着新一轮的科技变革深入发展,一个全新的计算体系正在到来。过去十多年,云的创新主要集中在软件领域,首先出现了分布式虚拟化,而后实现了资源池化,形成了广泛的应用规模。现在,云计算已经从软件创新,走向软硬件协同创新,用云来定义整个 IT 硬件体系。


张建锋认为,云计算给软件研发范式带来的变革有三个层次:第一,新兴软件开发方式崛起,软件架构全面 Serverless 化;第二,软件开发不再是程序员的专利,低代码让未来 80% 应用能够由业务人员直接开发;第三,未来所有软件都是 AI 化的,大模型开源将加速 AI 真正普及。其中,Serverless 是软件研发范式变革中最重要的趋势之一。


在本届云栖大会上,阿里云向外界展示了自己最新的研发成果和技术趋势分析。继飞天为阿里云打下扎实技术基础后,自研 CPU 芯片倚天 710、下一代云计算体系架构 CIPU 等将为阿里云构建第二技术曲线,成为云面向下一代技术构建的核心竞争力。



“倚天 + 飞天 +CIPU”组合,提升 20% 以上性能


为进一步优化数据处理和传输效率,阿里云构建了以数据为中心的新型云计算架构体系,提供近网络计算和近存储计算的加速技术支撑。


飞天操作系统在 2013 年首次全球范围内突破单一集群 5000 台服务器规模(飞天 5K),并率先对外提供这一能力。此后,飞天操作系统成功支撑了十多年双 11 和 12306 春运购票等极限并发场景。


而在今年的大会上,阿里云发布了一款云数据中心专用处理器 CIPU,替代 CPU 来管理和加速计算、存储和网络资源。CIPU 是一种全新的架构方式,实现了全面专用硬件加速的高性能,包括高带宽、高吞吐和弹性 RDMA 的能力。


在飞天 +CIPU 加持下,Redis/Tair 数据库的缓存 QPS 性能可提升 80%,数据库的主从复制延迟降低 50%、全局一致性读性能提升 5~10 倍,大数据 Spark 性能提升 30%,AI 深度学习图形分类训练性能提升 30%,OLAP 实时数仓查询性能提升 2 倍以上,冷热分层四种存储类型,一份数据支持多种计算引擎……另外,阿里自研的 CPU 倚天 710 已经在数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,算力性价比提升超 30%、单位算力功耗降低 60%,成为中国首个云上大规模应用的自研 CPU。据悉,在 2021 年双 11 期间,天猫双 11 核心交易系统平滑迁移至倚天 710 实例。未来 2 年,阿里云 20% 的新增算力将使用自研 CPU。


在这个体系下,“倚天 + 飞天 +CIPU”的组合表现也非常亮眼,在数据库、大数据和 AI 及高性能计算、视频编解码等场景下普遍优于业内同类产品,性能可提升 20% 以上。


据悉,搭载倚天芯片的阿里云弹性计算实例 G8M 将于 11 月 15 日正式上线,同时 CIPU 也被首次引入到专有云形态,为政企客户提供存算分离的“一云多芯、一云多 region”架构能力。



阿里云核心产品全面 Serverless 化


Serverless 让云计算从一种资源真正变成了一种能力。张建锋表示,过去云计算用云服务器替代了物理服务器,但客户依旧按“几核几 G 服务器”的模式来购买云资源,未来云计算将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。


这意味着软件开发方式将发生深刻变化,软件架构从原来的主机架构迁移到 Serverless 架构,客户只需要开发业务逻辑,不再需要关心运维问题。此外,Serverless 架构可以降低软件开发门槛,提供更多的预制模块,大幅提高软件生产效率。


目前,阿里云已经拥有超过 20 款 Serverless 产品,包括函数计算 FC、Serverless 应用引擎 SAE、Serverless 容器服务 ASK、PolarDB 数据库、AnalyticDB 数仓等。其中函数计算日调用次数超过 200 亿次,有效支撑历年双 11 百万 QPS 洪峰,业务年均增速超 300%,整体规模位居国内首位。


同时,相关产品也不同领域有广泛应用。比如,零售商超世纪联华将会员系统、交易系统等放在了阿里云函数计算上处理,告别了靠扩展机器支撑大体量业务,促销准备时间从周级缩短到小时级,成本下降 40%。南瓜电影在遇到大量用户涌入时,可在短时间内切换到阿里云 Serverless 应用引擎 SAE,峰值时秒级自动扩容,峰谷时按需自动缩容,总成本下降 40%。


“我们希望让用户做得更少而收获更多,通过 Serverless 化,用云就像用电一样简单。”张建锋表示,未来云将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。



阿里云 Serverless 布局


阿里云数据库 All in Serverless


在 2022 云栖大会上,阿里云还宣布 PolarDB、AnalyticDB(简称 ADB)、RDS、Lindorm 等核心数据库产品已与自研 CPU、CIPU、飞天操作系统进行深度融合创新,并全面 Serverless 化,对外更好地提供一站式数据管理与服务。测试数据如下:


  • RDS 数据库基于自研 CPU 的软硬协同优化,整体性价比提升 25%;

  • PolarDB 通过融合自研 Smart-SSD 智能固态硬盘技术,实现性能零损耗,数据存储成本最高下降 60%。


PolarDB 是业内首创支持跨机 Serverless 服务的云数据库,突破了无感秒切和高性能全局一致性两大技术难点,与按照峰值负载配置容量的成本相比,最多可节省 95% 的数据库成本。同时,PolarDB 数据库最新商业化的云原生 HTAP 功能,在列存索引 IMCI 技术加持之下,TPC-C、TPC-H 性能实现行业大幅领先。


以 PolarDB 和 ADB 为代表的阿里云核心数据库产品也在 HTAP、离在线一体化等前沿技术上发力,进一步提升数据库产品的易用性,并进一步提升性能。其中,ADB 提供离在线一体化数据处理分析能力,基于一份数据融合两种计算模型 (MPP+BSP) 同时支持离线处理和在线分析,解决因数据同步产生的数据一致性和时效性问题,资源成本降低 30% 以上。


据悉,面向未来,阿里云数据库将整体向“四化”方向发展:


  • 云原生化:资源解耦、Serverless 化;

  • 平台化:基于云构建数据平台能力、OpenAPI 标准化;

  • 一体化:处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化;

  • 智能化:AI for DB 简化运维、In-DB ML 挖掘数据价值。


ODPS 可同时调度超 10 万台以上服务器规模


另外,为满足用户多元化数据计算需求,阿里云 ODPS 升级为一体化开放大数据平台。升级后的 ODPS 支持大规模批量计算、实时分析等服务,提供实时流式计算、机器学习等多种计算能力,可同时调度超 10 万台以上服务器规模进行并行计算。


ODPS 实现了存储、调度、元数据管理上的一体化架构融合,支撑智慧交通、生命科学、风险精算等各领域数据的高效处理,并通过 DataWorks 提供一致的数据开发和治理服务。


在刚刚公布的 TPC-H 30000GB 基准测试中,ODPS-Hologres 刷新世界纪录,分数超过 2786 万分,领先第二名 23%。ODPS-MaxCompute 则在 TPCx-BB 100TB 标准测试中,连续 6 年保持性能和性价比第一。


软件 AI 化,大模型开源推动 AI 普及

磐久超高性能网络,时延显著降低 90%


为了突破计算性能、内存资源对 AI 模型训练效率的限制,阿里云打造了一套“磐久超高性能网络”,采用自研的 Solar-RDMA 高速网络协议,使处理器可访问其他任意服务器的内存,非常适合深度学习模型内神经网络的交互形态,相比传统模式可降低长尾时延 90% 以上,最低可至 2 微秒。


基于这套超高性能网络技术及软硬一体化能力,今年 6 月阿里云推出了新一代智能计算产品——灵骏,可最小化所有非计算开销,实现 5 倍的通信性能提升,千卡并行计算效率高达 90%,大规模 AI 场景下性能可提升 2-5 倍。

开源 300 多个 AI 模型,推出 AI 模型社区魔搭


张建锋表示,开源是软件进步的核心推动力量,过去开源推动了软件架构的进步,未来开源还将推动 AI 应用的进步和普及。


为了降低 AI 的使用门槛,充分发挥 AI 的潜能,阿里达摩院联手中国科大、CCF 开源发展委员会、澜舟科技、智谱 AI、深势科技、鹏城实验室云计算研究所、哈工大讯飞联合实验室等多家科研机构共同推出 AI 模型社区“魔搭”ModelScope。


魔搭社区践行“模型即服务(Model as a Service)”的理念,在代码开源的基础上更进一步,将 AI 的代码变成模型,将模型变成服务。社区实现了零门槛 AI 模型体验,一行代码模型推理,十行代码模型调优。


达摩院等率先向社区贡献 300 多个经过验证的优质 AI 模型,超过三分之一为中文模型。利用这些基础模型,开发者只需针对具体场景再稍作调优,就能快速投入使用。

云和端加速融合

无影强化云网端一体安全


张建锋认为,云端加速融合,算力正在不断从终端转移上云,这让终端突破了物理限制,不仅手机、电脑、汽车、音箱会变成计算机,未来万物皆是计算机。


例如,Rokid 在推出的 AR 眼镜中接入阿里云无影架构,利用云上算力,用户打开仅有 85 克重量的眼镜就能在眼前的虚拟现实画面中,与人聊天、办公,并且还能做 3D 渲染、大数据编程等复杂工作。


在 PC 电脑端,未来阿里云继续将 RISC-V 芯片和无影架构结合,让创新终端具有更高性能、更低能耗,并实现全栈自研。目前,阿里巴巴已经成为全球 RISC-V 技术与生态发展的引领者,并且已经完成了和云操作系统的适配,迈出了端边云一体的重要一步。


无影近期在多个场景推出生产力解决方案,包括研发、分支机构、RPA、教育等,往往都属于数据敏感领域。在为终端研发厂商提供更好的云流协议之外,无影进一步集成了安全能力。


无论用户使用既有应用、桌面实例池还是进行其他调度,都能够在敏感数据检测、行为日志处理、高危操作拦截、安全态势感知、外接设备权限、网络与应用安全监控等多个方面,设定符合自己场景的权限与策略。

玄铁 C908 实现 RISC-V 架构高能效突破


另外,阿里云最新发布的玄铁 C908 处理器实现了 RISC-V 架构的高能效突破,较业界同性能处理器能效提升超 30%。


为进一步提升 AI 算力及能效,玄铁 C908 采用最新 RISC-V Vector 1.0 标准,并基于标准新增 DOT 指令,全面优化 AI 算子及算法库,仅典型神经网络计算的性能就提升 50% 以上。在国际权威 MLPerf Tiny V0.7 推理性能测试中,玄铁 C908 超越此前夺冠的玄铁 C906,在图像分类任务中性能再提升 3.5 倍。玄铁 C908 可应用于视觉 AI、智能交互、AR/VR、5G 等场景。

结束语


“科技是阿里巴巴从过去走到现在,并且更好走向未来的基石。”如阿里巴巴董事会主席兼首席执行官张勇在云栖大会上所说,阿里希望用计算为社会提供一种数字化的基础能力。


根据行业权威研究机构 Gartner 发布 2021 年全球云计算 IaaS 市场份额数据,阿里云排名全球第三,市场份额为 9.55%,连续六年实现份额增长;同时,阿里云排名亚太市场第一,市场份额为 25.53%。而面对未来云计算市场日益激烈的竞争,阿里云能否凭借找出的第二技术曲线稳固如今地位甚至更进一步,让我们拭目以待。


2022-11-04 14:272869

评论

发布
暂无评论
发现更多内容

2022年中国音频行业产品洞察分析

易观分析

音频体验 在线音频

Apache APISIX 2.13.0 发布

Apache APISIX 中文社区

开源 API网关 API Gateway Apache APISIX

芯片变得更复杂的今天,你需要最大限度复用IP资源

龙智—DevSecOps解决方案

芯片行业思考 芯片开发 ip复用 ip资源 芯片行业

实战天翼云云主机系统盘扩容

天翼云开发者社区

云主机

【新布局】火绒安全企业产品Linux终端、macOS终端开启公测

火绒安全

macos Linux 服务器 终端安全 Windows Server

菜鸟不菜,职场小白大变身

龙智—DevSecOps解决方案

Jira Jira插件 工作流扩展 并行审批 jira并行审批

使用对等连接在天翼云两个用户的云网络之间架起一座天桥

天翼云开发者社区

OceanBase 在证券行业基金资管场景落地实践与解决方案

OceanBase 数据库

证券 oceanbase

web前端培训-通过JS 可以读取电脑上所有数据

@零度

JavaScript 前端开发

Java篇|忘记格式化代码,把女朋友鸽了

Jianmu

Java 自动化 持续集成 建木CI 格式化代码

TDengine 助力智慧燃气,支撑数百万智能终端的接入管理

TDengine

围绕用户体验持续进化 英特尔Evo平台打造开放、多元创新优势

科技新消息

使用天翼云主机组功能让云主机不放在同一个篮子里

天翼云开发者社区

#JiraHero:Soumen Deb——重塑 Jira Software 中的 Bug 工作流,提高可见性、简化开发流程

龙智—DevSecOps解决方案

Atlassian Jira

中科柏诚:用数字技术纾困解难,助力中小企业恢复成长活力

联营汇聚

为什么要做等保二级,有什么好处?

行云管家

网络安全 等保 等保2.0

通过IPv6隧道实现天翼云云主机IPv4和IPv6双栈接入

天翼云开发者社区

网络

20万字《网易智企技术合辑》重磅发布!

网易云信

人工智能 大数据 大前端 即时通讯IM 音视频技术

大数据培训-Flink面试知识分享

@零度

flink 大数据开发

知识文档管理系统:帮助企业管理文档

小炮

知识管理 文档管理

从0到100:基于微信小程序的羽毛球馆预约系统的开发笔记

CC同学

“既要性能,也要安全”,这样的Rust,谁不喜欢!

非凸科技

rust 编程语言 软件开发 招聘

【CI/CD研讨会报名,截止最后一天】全程参会,还有惊喜奖品等你拿!

龙智—DevSecOps解决方案

cicd 持续集成 jenkins CI/CD 持续发布

教育行业可以用云管平台吗?有案例介绍吗?

行云管家

云计算 企业上云 云管平台 云管理

资产动态管理系统解决方案

低代码小观

资产管理 企业管理系统 CRM系统 客户关系管理系统 资产安全

核心产品全面Serverless化、开源300多个AI模型加速软件AI化,阿里云如何抓住技术“定义权”?_语言 & 开发_褚杏娟_InfoQ精选文章