写点什么

阿里发布自研 CPU 芯片倚天 710:采用 5nm 工艺,性能超过业界标杆 20%

  • 2021 年 10 月 19 日
  • 本文字数:1280 字

    阅读完需:约 4 分钟

阿里发布自研CPU芯片倚天710:采用5nm工艺,性能超过业界标杆20%

10 月 19 日,在 2021 云栖大会上,阿里巴巴旗下半导体公司平头哥发布自研云芯片倚天 710。该芯片是业界性能最强的 ARM 服务器芯片,性能超过业界标杆 20%,能效比提升 50%以上。倚天 710 是阿里云推进“一云多芯”策略的重要一步,也是阿里第一颗为云而生的 CPU 芯片,将在阿里云数据中心部署应用。



倚天 710 采用业界最先进的 5nm 工艺,单芯片容纳高达 600 亿晶体管。在此之前,服务器芯片最先进的工艺仍为 7nm,倚天 710 是第一颗采用 5nm 工艺的服务器芯片。据了解,5nm 工艺对能量密度、芯片内部结构的布局有极高的要求,在研发过程中,平头哥灵活调度多达 30 种不同 EDA 软件、深度定制时钟网络和定制 IP 技术,此外平头哥还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。


在芯片架构上,倚天 710 基于最新的 ARMv9 架构,内含 128 核 CPU,主频最高达到 3.2GHz,能同时兼顾性能和功耗。在内存和接口方面,集成业界最领先的 DDR5、PCIe5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。



据了解,倚天 710 采用了很多最领先的技术,包括 ARMv9、DDR5、PCIe5.0 等等,这些技术都是刚刚诞生不久,平头哥对此做了深度定制,同时也引入了许多自研技术。平头哥从前端架构设计到后端物理实现全自研,既要克服工艺以及 IP 不成熟带来的困难,又要针对云场景的独特要求做定制化设计,技术上保障性能、功耗的均衡。


在前端设计方面,为解决核数众多条件下的带宽瓶颈,平头哥对于片上互联作出特殊优化,采用新的流控算法,降低系统反压,有效提升了系统效率和扩展性,使单核高性能有效地转化为整个系统的高性能。此外,通过新的系统地址到 DRAM 地址的转换机制,支持安全、非安全隔离、多 NUMA、异常通道隔离多种特性,同时 DRAM 读写效率大幅度提升;在后端物理实现方面,灵活调度多达 30 种不同 EDA 软件、深度定制时钟网络和定制 IP 技术,此外平头哥还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。


为解决云计算高并发条件下的带宽瓶颈,倚天 710 针对片上互联进行了特殊优化设计,通过全新的流控算法,有效缓解系统拥塞,从而提升了系统效率和扩展性。在标准测试集 SPECint2017 上,倚天 710 的分数达到 440,超出超过业界标杆 20%,能效比提升 50%以上。


云是高性能服务器芯片最大的应用场景。倚天 710 针对云场景的高并发、高性能和高能效需求而设计,将领先的芯片设计技术与云场景的独特需求相结合,最终实现了性能和能效比的突破。目前,阿里云已全面兼容 x86、ARM、RISC-V 等主流芯片架构,自研倚天 710 进一步丰富了阿里云的底层技术架构,并与飞天操作系统协同,为云上客户提供高性价比的云服务。


阿里云智能总裁、达摩院院长张建锋表示:“基于阿里云‘一云多芯’和‘深基础’的商业策略,我们发布倚天 710,希望满足客户多样性的计算需求,这款芯片不出售,主要是阿里云自用。我们将继续与英特尔、英伟达、AMD、ARM 等合作伙伴保持密切合作,为客户提供更多选择。”


目前,平头哥拥有处理器 IP、AI 芯片及通用芯片等产品家族,旗下玄铁系列处理器出货量已达 25 亿颗;两年前问世的阿里第一颗芯片含光 800 已实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户。

2021 年 10 月 19 日 14:143688

评论

发布
暂无评论
发现更多内容

云图说 | 华为云医疗智能体,智联大健康,AI药物研发

华为云开发者社区

药物研发 AI药物 医疗智能体

TensorFlow Recommenders: Quickstart

毛显新

深度学习 tensorflow 推荐系统 keras

Using side features: feature preprocessing

毛显新

自然语言处理 深度学习 tensorflow 推荐系统 keras

WorkPlus高端制造业数字化解决方案—科达洁能

WorkPlus Lite

开源 企业 解决方案 即时通讯

区块链去中心化钱包开发|开发去中心化钱包

Geek_23f0c3

钱包系统开发 去中心化交易所系统开发 去中心化钱包 去中心化交易所

剖根问底:Java 不能实现真正泛型的原因是什么?

沉默王二

java

INFRA-JOY微服务治理验证工程实践分享

徐敏

微服务 自动化测试 全链路压测 性能压测

大数据实战训练营Hbase作业

Clarke

瞥一瞥AI,撩一撩算法

博文视点Broadview

中易通科技禾禾实验室产品培育田

叶落便知秋

3D地图与3D柱状图联合使用

森友小锘

前端 地图 可视化 数字孪生

大厂面试真题——Netty/IO篇,你能答上来几道?

Java架构师迁哥

CloudQuery v1.4.1 发布 | 开放「组织架构」模块 API

CloudQuery社区

数据库 数据安全 OpenAPI 数据库管控

数据对AI的重要性:采访首席数据官Rick McFarland - LexisNexis Legal & Professional

WorkPlus Lite

阅读

手把手体验远程开发,确实爽

程序员鱼皮

Java Python 软件 前端 后端

1.6W字!梳理50道经典计算机网络面试题(收藏版)

互联网架构师小马

来吧!一文写清前端面试难点及考点

前端依依

面试 前端 经验总结

CloudQuery 首次开放API,v1.4.1将开放「部门导入」和「用户导入」

CloudQuery社区

数据库 OpenAPI 数据库管控

第三届WICC北京落幕 展现开发者服务生态与建设新方向

融云 RongCloud

男人要慢,SQL要快:记一次慢SQL优化

艾小仙

小白必看,通俗易懂的LockSupport

程序猿阿星

Java并发 线程协作 LockSupport 线程间通信

WorkPlus高端制造业数字化解决方案—首发集团

WorkPlus Lite

开源 企业 即时通讯 移动开发

带你走进“华为链”

华为云开发者社区

区块链 高性能 华为链 自研区块链平台 自主可控

以两种异步模型应用案例,深度解析Future接口

华为云开发者社区

Java 模型 异步 FutureTask Future接口

Erda 1.1 版本发布|3 大亮点特性最新解读

尔达Erda

开源 云原生 k8s PaaS SaaS

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

华为云开发者社区

语义 视觉 多模态信息 文档版式 VSR

Java集合源码总结分析

泰国Ascend Money用开源软件加快应用交付

WorkPlus Lite

阅读

详解Camtasia的PPT录制功能

淋雨

视频剪辑 Camtasia 录屏软件

兰宝环保 | 新体系“行动计划”中化工制药行业VOCs废气治理要点

叶落便知秋

Java程序员必备框架—Spring全家桶的前世今生详细梳理

北游学Java

Java spring

基于英特尔x86平台构建AI软件生态系统

基于英特尔x86平台构建AI软件生态系统

阿里发布自研CPU芯片倚天710:采用5nm工艺,性能超过业界标杆20%-InfoQ