解读2020:聊聊芯片技术趋势

2020 年 12 月 30 日

解读2020:聊聊芯片技术趋势

今年我们看到很多芯片领域出现的“新现象”,也有不少会让你“陷入沉思”的时刻。对我个人来说,苹果 M1 可能是冲击最大的一个。


我从 04 年开始做手机 SoC,08 年开始接触 ARM,断断续续做到 16 年。在苹果 M1 之前,我从来没想过基于 ARM 的架构可能在性能上超越 X86。当然,M1 并不是传统意义上的 CPU,而是一颗 SoC,所以直接的比较也许并不完全公平。但如果从应用程序的角度来看,运行速度加快,功耗降低,都是实实在在的。对 M1 的分析很多,细看下来,大部分架构优化的思路和获得的结果也都是非常自然的(可能也有一些我们不知道的苹果黑科技)。但为什么苹果之前没人这么做,或者说做不到呢?


问题的关键在于苹果掌握了完整生态和供应链,在有充分的技术积累和丰厚利润之后,可以做更多的“纵向优化”。这个事件本身还不只是技术上的胜利,未来会给整个产业带来深远的影响。当然,从这句话的限定词来看,能成功复制者可能寥寥无几。后面的新闻说微软也打算给 Surface 自研芯片来看,不知是不是有戏。


之前的文章对芯片架构和技术趋势有不少讨论,“通用”到“专用”(后通用芯片时代:专用芯片兴起背后的经济学),“同构”到“异构”,“先进工艺”到“先进封装”(从AI Chip到AI Chiplet),“分而治之”到“跨边界优化”(AI芯片技术发展)。为什么会有这些趋势,简单说就是被逼的,一方面摩尔定律放缓和 Dark Silicon 问题,另一方面特定算力需求激增。一句话,要求高了,只有精耕细作了。但问题是,即使这些趋势大家都认可,具体该怎么做呢?真没那么简单。


先说说异构和专用的问题。我们可以看看已经“精耕细作”了很多年的手机芯片。手机 SoC 是非常典型的异构系统,包括大量的专用处理器,发展到今天,已经极为复杂。下图是我随便找的一个高通手机芯片的框图,大家可以看一看,除了 CPU,GPU,各种 DSP(“高通的Hexagon DSP”)和硬件加速器,可以说把异构做到极致了。


source: anandtech


为什么手机的主处理器在智能手机刚出现的时候就 SoC 的形式?也是被手机尺寸,功耗,成本这些限制给逼的,不可能照搬桌面 PC 独立 CPU 的架构。


这种架构的优势是将整个系统都放在一颗芯片上,而不仅仅是通用的 CPU。其中很多硬件模块都是根据特定功能需求定制的,比如通信基带,ISP,Connectivity,多媒体,语音,定位,可能是基于 DSP,也可以是更专用的硬件加速器。这其实也就是我们今天常说的 Domain-Specific 的概念(可以参考“专用处理器设计”)。


另一方面,模块间的通信是在片上解决,效率要高很多。这种 SoC/DSA 架构的优势是硬件 PPA 可以极致优化;缺点除了架构复杂度和不同类型硬件的优化之外,异构编程和软件优化也会比较困难。


先不看苹果,由于安卓系统的出现,独立的手机芯片厂商可以把精力集中在底层,反正这些 DSP 和硬件加速器一般也不开放,都是芯片厂商自己来优化相关软件(常说的 firmware)。这样的架构和生态已经发展了十几年,现存已经不多的独立手机芯片厂商已经很有经验。即便如此,芯片厂商提供的一些新算法的加速库往往还不能令人满意,也从侧面说明了异构专用架构软件优化的难度。


再看苹果,其技术上的优势,很大程度得益于在“封闭”的系统(操作系统也是自己的),有可能实现“纵向优化”。在技术上的优势转化为巨大的利润之后,苹果的芯片就进入良性循环。实际上,在苹果开始自研芯片之后,可以说整个半导体供应链,从 Foundry 到 EDA/IP 都是按照苹果新机发布的节奏在进步。积累到今天,苹果已经具备了挑战传统桌面系统架构的能力。


对于传统的桌面和数据中心处理器,简单的说“不思进取”也不是很公平,CPU 本身还是芯片技术的高峰。在它能做到的范围内(主要是硬件),工艺演进,封装演进,架构优化,硬件性能继续提升还是可以预期的。但它多年形成的生态特征(包括历史包袱)和苹果(还包括其他一些巨头)这样的“封闭”生态大不相同,苹果们能做到的事情它还真做不到。


讨论到这里,我们也不难看出,未来在技术上的优化,传统的分而治之的策略已经越来越困难(或者并不经济),打破边界有可能会实现“降维打击”的效果。虽然好处显而易见,但成功与否的决定因素可能不在技术,而是背后掌控生态和供应链的能力。


另一方面,抛开技术原因,越来越复杂的竞争关系,也是推动产业链重新整合的动力。今年,我们看到 Nvidia 收购 ARM,AMD 收购 Xilinx,Intel 推 oneAPI,其实都是这方面的尝试。对于芯片厂商来说,尽量在自己的核心领域实现生态的“垄断”是最高目标。但是,对于复杂芯片来说,构建软件生态可能要比设计或实现出芯片本身更为复杂。特别是在一些专用领域,单芯片硬件架构趋向简化,但软件栈的实现和产品化挑战很大。


因此,从目前整体状况来看,相对传统芯片公司,科技巨头在软件和系统生态上具有先天的优势的。我之前分析过 Google 情况(“Google的『泛芯片』科技蓝图”),有很多芯片厂商很难做的事情,在 Google 自己的生态里面相对容易(其实是和苹果 M1 的情况类似)。还有一个例子是这篇文章里 JAX 这个研究性框架可以很好的发挥 TPU 的性能,“AI训练芯片巅峰对决,如何正确“围观”?”。未来我们应该能看到更多由科技巨头发起的发自系统需求的跨层次优化


回顾历史,分而治之(分层优化)是计算机系统和通信系统这样的复杂系统几十年快速发展的关键,未来实现彻底扁平或端到端的优化是不太可能的(这个超越人类能力的问题可能得留给 AI),但找到更合理的分层或分块方式是完全有可能的。比如,我们看到深度学习框架和编译器领域就有很多尝试,一方面打破传统的图和算子的层次进行统一优化是一个广泛关注的路径;另一方面,通过多层 IR 和编译工具来更合理的实现“分而治之”也很有前景。苹果 M1 的例子再次给我们证明了现在确实是“架构的黄金时代”,芯片,软件,系统都还有很多优化空间。重新思考非常必要,甚至“重新设计轮子”有可能是非常合理且有效的选择


最后说两句“先进封装”的问题。“Chiplet”是今年的热词,历史更久且更准确的技术词汇应该是异构集成(Heterogeneous Integration),有兴趣的朋友可以看看 HIR(Heterogeneous Integration Roadmap),有这个领域非常完整的分析和预测。总的来说,这个技术趋势是比较清晰明确的,而且第一阶段的 Chiplet 形态(比如 HBM)在技术上已经比较成熟,除了成本比较高,在很多高端芯片上已经使用。而且这个技术涉及的供应链比较简单,可以说是花钱就可以解决的问题。当然,这个方向还是有很多技术挑战的,最终是要走向 Monolithic 3D(如下图)。


source: ERI summit 2020


另外一个和异构集成关系很大的是光互联,这两件事要是解决了,芯片和系统架构可能发生产生根本性的变化。


本文经原作者授权,转载自 StarryHeavensAbove 公众号,原文链接:https://mp.weixin.qq.com/s/u9KVll9SKFpRWjd_id-hyA,如需转载请联系作者。

2020 年 12 月 30 日 17:482

评论

发布
暂无评论
发现更多内容

视频码控:CBR、VBR和ABR

潇湘落木

直播 SRS 视频编码 码控

一个快捷方便的油煎鸡胸肉,懒人标配香喷喷好吃看得见

小霸王其乐无穷

美食 鸡胸肉 懒人

前端分页组件实现逻辑

书旅

php 前端 分页

POI 之 策略游戏

zhoo299

随笔杂谈

ARTS 挑战打卡第九周(200706-200712)

老胡爱分享

ARTS 打卡计划

动态修改logback的日志级别

华宇法律科技

Java springboot logback

图解javascript——基础篇(以思维导图总结js中关键技术点,为面试及工作助力)

执鸢者

Java 前端

【解Bug之路】——Nginx 502 Bad Gateway

简爱W

你可能不知道的计算机基础

书旅

c 常量 计算机 基础

Spring Boot 集成 Sharding-JDBC + Mybatis-Plus 实现分库分表

简爱W

十一周作业

olderwei

极客大学架构师训练营

Flink水位线和时间戳理解-7

小知识点

scala 大数据 flink 模块化流程

Netty之旅二:口口相传的高性能Netty到底是什么?

一枝花算不算浪漫

融云 X- Meetup 技术沙龙广州站:全球通信云技术实践分享

InfoQ_967a83c6d0d7

ARTS挑战打卡第八周(200629-200705)

老胡爱分享

ARTS 打卡计划

Linux系统监控工具推荐

王坤祥

监控 工具软件

介绍一款API敏捷开发工具

棒锤🐮

敏捷开发 Rocket API API敏捷开发

LeetCode题解:26. 删除排序数组中的重复项,双指针,JavaScript,详细注释

Lee Chen

LeetCode 前端进阶训练营

Redis 之父关于 CRC64 的神秘往事!

yes的练级攻略

redis CRC

战斗还是逃避,或许可以考虑一下合作?

escray

学习 面试 面试现场

week 11学习总结

Geek_2e7dd7

ARTS 挑战打卡第七周(200622-200628)

老胡爱分享

ARTS 打卡计划

完了,这个硬件成精了,它竟然绕过了 CPU

简爱W

请不要随便修改基类

架构师修行之路

SQL查询语句执行顺序详解

书旅

MySQL SQL语法 sql查询

Docker搭建项目环境实战

书旅

Docker Dockerfile Docker-compose

数据库是咋工作的?

简爱W

让理性思维走进我们的生活,帮助我们做出更好的决策。

叶小鍵

心理学 基思. 斯坦诺维奇 超越智商 认知科学

揭晓{大发正规平台邀请码}12812888

InfoQ_95ab3e73a57e

week 11

Geek_2e7dd7

用科学的方法理解每日优鲜

石云升

新零售 每日优鲜 多快好省 科学分析

解读2020之年终技术盘点特辑

解读2020之年终技术盘点特辑

解读2020:聊聊芯片技术趋势-InfoQ