阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

以最新发布的含光 800 为引,看阿里在芯片领域都下了哪些“棋”

  • 2019-10-08
  • 本文字数:4303 字

    阅读完需:约 14 分钟

以最新发布的含光800为引,看阿里在芯片领域都下了哪些“棋”


9 月 25 日,阿里在此次云栖大会上落子清脆,其借助平头哥在整个“芯片棋盘”的布局已经初具规模。


至此,阿里旗下平头哥集齐了 AI 芯片(含光 800)、一站式芯片设计平台(无剑 SoC 平台)和高性能处理器 IP(玄铁系列),端云一体全栈芯片产品家族的雏形已然显现。


阿里巴巴 CTO 张建锋在此次云栖大会的主论坛上表示,含光芯片将是阿里芯片万里长征的第一步。

含光剑出,天下谁人不识君

既是第一步,那便迈出气势。


云栖大会首日主论坛上,阿里巴巴宣布全球最高性能 AI 推理芯片含光 800 正式发布。在业界标准的 ResNet-50 测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。



含光 800 是阿里成立平头哥芯片公司后第一款正式流片的芯片。目前,该芯片已经开始应用于阿里巴巴内部的核心业务中。同时,含光 800 将通过阿里 AI 云服务为各企业的 AI 场景输出 AI 算力。


AI 芯片是人工智能场景最高效的算力单元,阿里表示将投入重金打造好这些技术,同时构建应用生态。


在 AI 场景中,含光 800 是异构计算的很好补充。据悉,未来其产品形态还会进一步完善,包括云端 AI 训练芯片和端侧 AI 推理芯片,平头哥还在研发用于阿里云神龙服务器的 SoC 专用芯片,以满足更多场景的算力需求。

含光芯片为什么是 800?

含光 800 是阿里含光系列的第一款 AI 云端专用推理芯片,却被冠以 800 的名称,其内在含义并不是因为它的前面有多少款其他芯片,而是代表着芯片的级别。含光 800 在阿里的内部定位属于比较高端的一款芯片,所以取名 800。


而且其他芯片商都会有类似的命名方法,从这个角度来看,阿里还可能在以后的日子里,陆续推出名为 600 的中端产品,300 的低端产品,等等。

含光芯片微架构的创新之处

含光芯片的架构设计,关键在于阿里内部的 AI 算法团队,平头哥通过对其内部 AI 算法的通用特征提取,实现了芯片架构的创新。


具体而言,含光芯片在架构设计中主要做了这些创新:


  • 减少内存带宽


内存访问会造成芯片较大的功耗损失,平头哥自研架构通过缩短物理距离,将计算单元与存储单元尽可能的靠近,当遇到高密度计算和存储时,就可以很大程度上减少对内存的访问,并在保证性能的情况下,降低芯片功耗。


  • 组合算子优化融合


含光 800 芯片把最常用的组合算子做优化融合。根据神经网络推理运算特征,设计特定的硬件神经元、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。


  • 算法压缩


采用稀疏、量化等推理加速技术,对算法、模型进行压缩。比较突出的一点是基本实现全网络量化,尽可能的使所有数据在存储时按照压缩的形式存入内存,并在计算过程中,根据精度要求把数据做拓展,保持其较高精度。


  • 计算中高度并行处理


含光 800 芯片深度优化 CNN 及视觉类算法,在计算里面具有高度并行性,不仅可以加速计算矩阵、乘法、卷积等,还可以加速向量、激活函数等。

玄铁初试,锋芒渐露

与含光 800 不同,玄铁系列处理器 IP 早在今年 7 月份就已经正式发布,而且一经问世,便被当作阿里的一把“玄铁重剑”。


当时还在奇怪,为什么阿里会选择发布这样一款芯片 IP,而不是进行大规模流片。对此,在本次的云栖大会上,阿里给出了这样的答案:玄铁是铸就各大神剑的原材料



玄铁系列处理器,目前主要分为 8 系列和 9 系列。玄铁 8 系列处理器是具有自主知识产权,中国唯一规模量产的 CPU,授权芯片累计出货量达 10 亿颗;玄铁 9 系列处理器 IP,是目前单位性能最强的RISC-V处理器,相比同类产品性能提高 40%。


在云栖大会首日下午的平头哥生态论坛上,平头哥官宣 IP 联盟和发布《云端设计白皮书》,并携手清微智能、云天励飞、炬芯、奉加微、联盛德、艾派克、博雅鸿图等公司连发 7 款基于玄铁处理器的芯片。当日,天猫精灵与平头哥合作研发的智能语音芯片也正式发布,将用于即将推出的天猫精灵音箱中。

7 款玄铁系列芯片,强大朋友圈助力平头哥芯片生态

平头哥的玄铁系列处理器和无剑平台目前拥有 100 多家客户,在此次的云栖大会上,平头哥携手清微智能、云天励飞、炬芯、奉加微、联盛德、艾派克、博雅鸿图等公司连发 7 款基于玄铁处理器的芯片,分别涵盖视觉、语音、微控制、无线芯片等多种应用领域。


这 7 家公司既有垂直行业领军者,也有新兴领域后起之秀。炬芯是国内最老牌的 IC 设计企业之一,云天励飞是业界知名的 AI 独角兽。清微智能、联盛德、博雅鸿图则在可重构计算芯片、物联网通信芯片和数字视网膜芯片领域各有专长。


艾派克在中国打印机主控芯片市场占有龙头地位,预计今年搭载平头哥内核的艾派克芯片出货量将达 2 亿颗。蓝牙芯片新锐企业奉加微今年年初获得平头哥玄铁 802 MCU、YoC 操作系统及 CSI 外设接口授权,用 6 个月就完成了芯片设计。


以下是 7 家客户和芯片的基础信息:


铸剑台——无剑

本次云栖大会上,平头哥给自己的定位是:做 AIoT 时代芯片基础设施的提供者。


何为基础设施?它指的是完成一项工作所需的基本材料,以及这些材料的服务支撑体系和如何使用的方法等等。


AIoT 市场本身便是一个碎片化市场,各种端测设备对于功耗、性能、成本要求都不一样。所以除了玄铁系列处理器 IP 外,一站式芯片设计平台无剑则是其实现自身定位的重中之重。



作为系统芯片开发的基础共性技术平台,无剑由 SoC 架构、处理器、各类 IP、操作系统、软件驱动和开发工具等模块构成。平台能够承担 AIoT 芯片约 80% 的通用设计工作量,让芯片研发企业专注于剩余 20% 的专用设计工作,降低系统芯片的研发门槛,提高研发效率和质量,让定制化芯片成为可能。


目前,无剑已推出 MCU、语音、视觉三大平台,后续还会有更多平台推出。MCU 平台有 5 类 IP,3 家合作伙伴;语音识别平台有 8 类 IP,3 家合作伙伴;机器视觉平台有 9 类 IP,3 家合作伙伴。

什么是一站式芯片设计平台?

据了解,无剑平台是集芯片架构、基础软件、算法与开发工具等一体的整体解决方案:


面向硬件:为了充分发挥各种不同硬件的效能,研发人员打造了一个多场景灵活可配置的异构 AI 加速引擎框架,这里的 AI 加速引擎可以是用户自定义的。平头哥提供神经网络加速库及异构编译器技术,向芯片厂商提供多粒度的硬件抽象接口;芯片厂商可以根据硬件特征(无论是面向低功耗低沉本的语音芯片还是高性能高实时性的视觉芯片),快速对接到 AI 加速引擎,并高效地发挥其硬件性能。该引擎支持当前所有主流框架,几乎所有的标准模型都能够在上面一键部署;它也提供一套便捷的自定义层开发接口,方便开发者多样化需求。


面向应用开发:研发人员开发了一套标准统一的应用开发框架,同一个应用可以在不同算力的硬件上进行无缝迁移。另外,为了进一步降低使用难度,提升开发效率,平头哥集成开发环境完美融合该引擎,并添加一键部署、图形化算力分析、异构多核联合调试等功能,解决实际开发过程中最困难的问题。根据实际客户开发数据的统计,整个软件框架可为芯片厂商节省 60% 的 AI 基础软件开发成本,缩短方案厂商 50% 的应用开发时间。

无剑 SoC 平台的目标是助力芯片的差异化

据阿里巴巴称,取名无剑的目的是要以“超越常规”的方式做芯片。


无剑平台的目标并不是去做某一个具体的芯片,而是致力于把共性的基础工作做好,能够给客户提供完整的解决方案和可参考的设计,使客户做芯片时只需要针对行业的需求开发特有的内核技术。


另外,无剑平台的特点是“端云一体”、“软硬件深度融合”和“全栈集成”,通过基于共性技术开展设计,整个研发到量产的周期有望缩短 50%,通过跳过 MPW、缩短软硬件开发的人力成本,有望使得 NRE 费用降低 50%。

平头哥的“芯”战略

云端 AI 芯片含光 800,端侧处理器 IP 玄铁系列,再加上 SOC 芯片设计平台无剑,平头哥的“芯”战略展露无疑:


通过端侧的各种处理器 IP,以及芯片设计平台,降低各大芯片公司造芯的门槛;通过云端 AI 芯片,对阿里云及各企业用户进行智能化升级。

平头哥的共性技术体系:云端协同

在云侧,平头哥发布了含光 800 芯片,除此之外,平头哥还在做 MOC 相关的芯片;在端侧,平头哥更加注重生态合作,与行业合作伙伴共同开展芯片的设计,并提供玄铁处理器 IP、无剑 SoC 平台、AliOS 与基础软件以及面向领域算法提供的各种基础设施。


云和端看似两个不同的领域,从平头哥的角度看是一致的,云和端都是向行业释放算力。云侧,基于自有芯片、阿里云,提供算力;端侧,通过提供处理器 IP 与无剑平台这种面向行业的基础设施,进行相关赋能。

平头哥是“新手”?

2018 年 9 月,阿里巴巴云栖大会上,阿里巴巴 CTO 和达摩院院长张剑锋宣布成立平头哥半导体有限公司,推进云端一体化的芯片布局。这家公司由阿里此前收购的中天微系统有限公司和达摩院自研芯片业务整合而成。


虽然阿里自谦在全球芯片领域只是一个新人,但平头哥却并没有表面上仅成立一年那么简单,换句话说,如今阿里在芯片领域的成就,完全是平头哥厚积薄发的结果。


算上中天微的 19 年,以及阿里巴巴在服务器、FPGA 以及存储等硬件基础设施上早年的摸索,这些经年累月的研发经验使平头哥在体系结构、编译技术等领域拥有深厚的技术储备。

未来平头哥在芯片方面的规划

对于未来平头哥在芯片方面的规划,骄旸是这样说的:


从长远的规划上会对一些技术点深入挖掘。比如 AI 领域,虽然含光已经取得一些初步成果,但还远远不够,平头哥还有很长的路要走。


另外,关于未来芯片开发社区,将主要呈现基于平头哥基础设施的芯片产品,平头哥对芯片基础架构的统一会对软件开发产生积极的作用,而且这也会使得 IoT 开发者更加专注于行业的需求,做出有行业特色的有竞争力的产品。


总结而言,对于 IoT 芯片行业,平头哥不仅需要技术创新,同时也需要有合作模式的创新。芯片是技术性很强的行业,违背行业规律做事基本上很难成功,但除了技术还需要模式的创新。应用驱动在当前的 IoT 市场使得后来者更有优势,开放的合作是 IoT 芯片生态中必须要做的,平头哥希望未来的 IoT 芯片生态能够实现整个系统的普惠共赢。

写在后面

阿里拥有庞大的电商、金融、物流、云计算、物联网等业务,对于芯片的需求也越来越大。着力于芯片,不仅可以降低阿里整体计算的经济成本,还能以云服务的方式将更高算力、更低功耗提供给更多企业。


自去年平头哥成立以来,到现在含光 800 的正式发布流片,短短的一年时间里,平头哥便已经开始反哺阿里,为其提供芯片领域的各种支持,而平头哥的成立正是其顺应趋势的结果。


种种迹象表明,芯片、AI 与云计算三位一体的协调发展已经成为目前的主流趋势。各大公司或将根据 AI 算法设计制作芯片,通过专用 AI 芯片为云服务提供更强算力,再利用云计算加速了 AI 应用的大规模落地,进而形成了一个高效的闭环环境。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2019-10-08 15:052019
用户头像
张之栋 前InfoQ编辑

发布了 91 篇内容, 共 46.3 次阅读, 收获喜欢 159 次。

关注

评论

发布
暂无评论
发现更多内容

户外led显示屏常见规格有哪些

Dylan

广告 屏幕亮度 像素 LED显示屏 户外LED显示屏

新兴技术与禅坐 | 聊聊经验 | 社区征文

写程序的小王叔叔

经验分享 年中技术盘点

基于知识图谱的《红楼梦》人物关系可视化及问答系统(含码源):命名实体识别、关系识别、LTP简单教学

汀丶人工智能

人工智能 深度学习 nlp 知识图谱 智能问答

用友iuap亮相全球数字经济大会助力企业升级数智化底座

用友BIP

数智底座

加速布局,用友为国产化替代保驾护航!

用友BIP

国产替代

中国大模型的落地DNA,写在这个双螺旋结构里

脑极体

AI

企业内容管理升级 3.0:构建生态协同,助力合规成长

风来兮

软件 电子档案 OCR 合规 #人工智能

谈谈我这两年的前端开发经验

树上有只程序猿

源码解读之FutureTask如何实现最大等待时间

EquatorCoco

源码 前端 前端工具

王海峰最新发声!

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

几天不写React,已经看不懂语法了

伤感汤姆布利柏

业务创新的利器:探索Flutter与小程序容器的融合应用

FinClip

万字好文:大报文问题实战 | 京东物流技术团队

京东科技开发者

MySQL 网关 报文 企业号 7 月 PK 榜 大报文

区块链生态架构 | 社区征文

TiAmo

区块链 Baas 年中技术盘点

Rainbond开源

EquatorCoco

开源 rainbond

智能电视APP鲜时光,如何应用AB测试打造极致的用户观看体验?

字节跳动数据平台

万字血书React—走近React

不在线第一只蜗牛

React 教程分享

Git操作不规范,战友提刀来相见!

树上有只程序猿

INFINI Labs 产品更新 | Easysearch 新增 kNN 搜索功能、Console 支持 LDAP 认证登录等

极限实验室

console Gateway 产品更新 easysearch 极限科技

PoseiSwap 更新第二期空投,持有 Zepoch 节点数量将决定空投回报

西柚子

Pytorch: 数据读取机制Dataloader与Dataset

timerring

人工智能

深度剖析之由浅入深揭秘JavaScript类型转换(最全总结篇)

控心つcrazy

JavaScript 类型转换 隐式转换 类型 强制类型转换

Kurator v0.4.0版本更新4大内容,满足多云环境的复杂需求

华为云开发者联盟

云原生 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

科兴未来|第二届T-MAX“科创太仓”国际创新创业--先进材料专场赛

科兴未来News

飞桨和硬件伙伴们在WAIC 2023!

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

IT运维的福音!WeOps综合服务让运维更简单

嘉为蓝鲸

运维 IT weops

PoseiSwap 更新第二期空投,持有 Zepoch 节点数量将决定空投回报

威廉META

PoseiSwap 更新第二期空投,持有 Zepoch 节点数量将决定空投回报

鳄鱼视界

深入解析Redis的LRU与LFU算法实现

vivo互联网技术

redis LRU LFU

如何优化Flutter的性能?

没有用户名丶

手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询

汀丶人工智能

人工智能 深度学习 nlp 知识图谱 智能问答

以最新发布的含光800为引,看阿里在芯片领域都下了哪些“棋”_AI&大模型_张之栋_InfoQ精选文章