提前锁票 InfoQ 最具价值感的视频栏目 | InfoQ 大咖说 了解详情
写点什么

面对“芯片荒”,芯片业者如何找到自己的定位?

2021 年 2 月 10 日

面对“芯片荒”,芯片业者如何找到自己的定位?

一场从 2020 年年尾开始的“芯片短缺”现象在全球愈演愈烈,无论是汽车还是消费电子产业,对芯片行业的需求似乎有增无减,芯片供应短缺正给产业带来一个又一个的危机。这轮“芯片荒”带来的行业启示是什么?


目光切回国内,在中国业界和政府大力推动半导体行业发展之际,市场总免不了泡沫,芯片初创公司的天价估值正引发争议…...芯片行业又是最现实的行业之一,投入大、产出慢,芯片业者如何找到自己的定位?


1 月 27 日晚,英国 AI 芯片创企 Graphcore 高级副总裁兼中国区总经理卢涛现身大咖说,与我们分享了他对芯片领域诸多问题的洞见与观察。


以下内容来自当天的分享,InfoQ 作了不改变原意的编辑:


InfoQ:全球芯片工艺短缺正在影响汽车制造,手机生产和笔记本电脑制造等产业链,您认为造成“芯片荒”的关键原因有哪些?


卢涛:最近大家看到相关的新闻也比较多,汽车产业整体缺芯片,甚至昨天还有个新闻说如果要买显卡,甚至要在芯片网站上摇号,意思就说芯片不是想买就能买得到。我们把这个产业拆开来看,不少环节现在都有些紧张。


从供应来看,首先是晶圆产能不足,像台积电、三星等晶圆厂商,目前产能非常告紧。此外,封装测试也是很重要的环节。目前,据我们了解,这些环节所需基本材料也有一些紧缺的情况。


从非供应的角度看,过去一年由于疫情的原因,全球数字产品的销售都有大幅增长,因为大家居家办公,对各种 IT 产品、数字产品的需求都在增加,同时对云的需求、对网络的需求也增加了。


还有第四个原因,是中美之间的贸易问题。基于现在的状况,许多企业为了自身的供应链安全,可能会囤积芯片,将未来一到两年的芯片需求都提前准备好。以上 4 个情况叠加在一起,我认为有点像“踩踏式效应”,导致一些正常的生产需求都遇到了很大的问题,最后就是大家看到的减产、停产的结果。


其实汽车电子产业跟手机还非常不一样。手机和一些数字平台的产品,我们往往追求最高、最先进的制程,但是很多工业产品,实际上是依靠像 65、28 纳米等比较成熟的工艺。但我们看到即使有一些不是用最新的 7 纳米或 5 纳米的产品,也遇到了供应方面的问题。


InfoQ:这个局面大概会持续多少时间?


卢涛:目前我们看待整体产业,大家的预测基本上可能要持续一年左右,甚至有些比较悲观的人,认为需要一到两年的时间。


InfoQ:目光聚焦回到国内,中国正在大力推动芯片的发展,但我们可以看到行业热的同时往往伴随很多泡沫,中国经济周刊指出在 2021 年 1 月到 10 月期间,中国与芯片相关的公司数量增加了 5.8 万家,相当于每天都有两百家的新增公司,同时又有不少烂尾项目被媒体陆续报道出来,我们该如何看待这里面的机遇跟泡沫呢?


卢涛:我当前对这个问题还是持比较正面的看法,因为这个泡沫其实一般来说只会伴随着产业的某个周期。

一两年以前,有些投资人跟我交流“中国芯片这个局怎么破”,我当时跟他分享了一个很浅显的道理:我说你们资本的钱都去投互联网公司了,互联网公司有了钱就能请到好的工程师、请到好的人才。最后因为资本都往那些产业涌,导致我们的人才也朝那些产业聚集。


芯片产业所需投资很大,目前人才问题也比较困难。如果能有足够的投入,吸引并培育出好的人才,还是很有机会的,整体来说我还是持乐观态度。


InfoQ:芯片人才匮乏被视为制约当前国内芯片行业发展的主要因素之一,关于芯片人才匮乏这个事情,您认为当前的一个现状是怎么样的?


卢涛:我觉得这里面人才肯定是非常重要的。实际上芯片产业链的链条非常长,从最前端的装备,就是制造设备,到最后芯片的设计、生产、封测。其实我们可以把这个眼光稍微放得宽一点点,不仅仅是芯片的人才,还有芯片的上下游的人才,也是要关注的。


因为芯片产业链条很长,如果中间任何一个环节断掉,整个产业都无法正常运转。因此,纵观整个产业链,不仅芯片设计公司需要人才,其他芯片上下游的产业也需要人才也需要重视人才。


InfoQ:现在市面上出现一些芯片大学,以芯片培训的形式去培养出一些芯片人才,你认为它的作用大吗?说说您对这类芯片培训的看法?


卢涛:芯片设计是一个非常工程化的事情,这里面电路电子的基本功还是非常重要的,中国跟一些发达区域相比,这方面的人才还有很大的差距,尤其是在经验的积累上。


我经常跟产业界的一些朋友开玩笑,我说当你观察某个芯片公司的关键的架构师或者核心芯片的自研能力,都跟这个公司在历史上做过多少颗芯片,花多少钱来流片有关。其实这里面真正顶尖的芯片工程技术人才(当然,大学的教育还是非常重要的),真真正正的高手,都是活生生拿钱来堆出来的。因为每一颗芯片都要花钱做设计做流片,中间积累下来的、对工程方面的很多认知和感觉,是需要好多代产品的积累才能形成。


除了顶尖设计人才需要工程积累,芯片里面还有一部分,比如芯片的封装,以及类似于像台积电做的事情,或者是一些顶尖的 Foundry/晶圆公司做的事情,在追求很高的工艺支撑的时候,对我们的很多基础学科有比较高的要求。比如说光刻机,这不仅仅是说纯电子系统的一个问题了,这需要你在光学方面的一些突破。然后比如说你要做一个晶圆,你从 7 纳米、5 纳米到 3 纳米,这里需要在物理方面的一些突破,甚至需要你在材料科学方面有一些突破。


所以从两个层面上看,如果我们关注公司的 IP、或者 EDA 工具,那么可以是工程导向的人才。然后世界级的、真正在芯片的制程方面,则需要在基础学科方面的许多积累。


InfoQ:总的来说,我们现在这个阶段还是需要更多的投入。


卢涛:需要投入,另外还有一点非常重要,需要有耐心。比如芯片这个产业跟互联网差别很大,如果是互联网产业,你有一些想法,可能三个月能出个原型,并可以迅速地试错。但是在芯片行业,从架构设计、芯片设计、流片,最后出这个产品,往往取决于芯片的复杂程度,一年到三年的时间都是很正常的。如果是个特别复杂的产品,可能从架构设计到这个芯片出来就需要 3 年时间,出来了之后,要有一些前期的客户的试用,评测,最后选用你的方案,再变成客户可以真正接纳的产品,中间可能很轻松就花了一到两年的时间。


所以芯片公司跟互联网公司的周期是非常不一样的,而且迭代的成本也非常不一样。比如说我们做个 App,不行我们就推翻,全部改,过三个月或半年,我们再上新的 App。但如果是做一个半导体产品,别说是整个推翻,就是比如做了一个芯片,我们要改 Metal layer 的话,不是改版(respin),可能轻轻松松要额外花 6 到 9 个月的时间,但如果你要真正改版,可能额外就要 12 个月时间。


所以不仅仅是我们的资本和市场,其实我们的人才在这里面都需要有非常有耐心。要不然可能这个热潮过了之后,大家就坐不住这个冷板凳了,事情就没办法往前走。


InfoQ:您觉得现在芯片业对于耐性有没有一个比较清晰的认知和认同,因为我们可以看到现在芯片行业也进来了很多公司,这些公司有没有意识到耐性的重要性才去做这个事情?


卢涛:我觉得是有两种。其实我们国内也有许多非常有名的半导体企业,有一些已经积累了将近 20 年,前面也有一批做机顶盒、MP3、数字电视的,其实这些领域涌现了一批公司是真正长期扎根在里面做的。中间肯定有公司能够做得下来,耐得住性子,踏踏实实做产品。


当然不排除有一部分人因为这里面热钱多,资本进来得很疯狂,所以想进来迅速捞一票,快进快出。快进快出的也可能有不同的人,出发点也不一样。有些人快进快出可能是想迅速构建一个团队,做一个原型产品,两年左右就退出。退出并不是说这个公司要 IPO 要上市,可能积累了一个产品,积累了某些技术,最后卖给某一个大公司,这不一定是坏事,也是帮一些大公司做一些尝试。另外也有一些是投机的人,这点在这个比较乱的阶段是不可否认的。


InfoQ:下面我们来聊下当前的一个热门方向,AI 加速芯片,它现在非常流行,也是行业重要的发展方向。能否请您先介绍一下什么是 AI 芯片?


卢涛:AI 芯片从字面意思上是做 AI 的芯片,但 AI 芯片这几个字背后的含义要更加深。这里面其实有几个产业背景,像 Google 母公司董事长 John Hennessy,他也是斯坦福大学前校长,还有 David Patterson,是 UC 伯克利的教授,他们两个人一直以来在计算机体系结构上是非常有建树,也做过一些企业,比如他们之前做了 MIPS 公司,后面的 RISC-V 基金会也有关系。


但是这一波真正起来跟他们的一些论文和演讲也是很有关系的。有一篇讲 DSA,说现在半导体行业进入了体系结构创新的黄金时期,于是他讲了一个概念,就是 DSA,全称是 Domain Specific Architectures,针对某一类的架构进行优化的计算。


在大概 2015 年之前,半导体产业的发展讲的是“摩尔定律”。英特尔是非常典型的例子,它那个叫 Tick-Tock 钟摆战略,基本上就是严格按照摩尔定理,每 18 个月做一个新的产品,依赖产品做架构创新,依赖产品做工艺创新、工艺升级,然后通过工艺的提升,来堆加自己的计算能力、CPU 的主频、核的数量,进而提高计算能力。


在大概 2010 年,45 纳米、28 纳米出来之后,当时大家对摩尔定律的未来发展也挺不乐观的。摩尔定律之后,我们该怎么去发展?我们以前说软件定义一切,Software Defined Everything,就是说任何事情,都是可以通过堆加 CPU 计算核心,堆加 CPU 主频来解决,不管是存储问题也好,网络问题也好,都是可以通过这个路径来解决。最后发现发展没有办法像以前那样快速迭代的时候,大家在想,我们在今天怎么能够继续优化我们的系统,或者说计算结构。


很直接地就想到,有一些非常复杂的工作负载,未必是在今天通用的 CPU 上能处理很好,那我们是不是能做一个专用的处理器来解决这个问题?这样子我们还可以用一些不是特别先进的制程,用比较小的晶体管数量,用比较低的功耗、比较低的成本就能够解决这个问题,甚至跑得比在 CPU 上更好。


其实在 AI 之前,DSA 也不是一个特别新的概念,只不过没有人提 DSA。如果有些人在网络通信行业做过,会知道 2000 年以后也有类似的经验:用 CPU 做控制,然后有一个处理器叫网络处理器,专门做网络业务处理。这其实是类似的,有一部分专门拿 CPU 做,有一部分是用专门的这个处理器来做专门的业务。而今天我们看到的未来是智能化,从过去六七年以来,全球的 IT 市场,我们把通用的计算服务器市场、网络市场、存储市场等等全部放在一起,会发现这个细分市场(AI)一骑绝尘。


举个例子,过去几年通用服务器的年度复合增长大概是在 3%左右,甚至有些年未必能够增长,基本上就是全球一千几百万台服务器的量。但是英伟达的 GPU 为什么这么疯狂,这么受追捧呢?那是因为 AI 发展起来了,做数据中心运算的 GPU 在过去几年得到非常高的增长。尤其是 16 年到 17 年,甚至可能有几倍的增长,直到现在也能够达到这个百分之四五十的年度增长率。


第二点是智能计算,它还处于整个产业比较初期的阶段,大家认为传统的计算会往智能计算来转换。传统计算是什么意思?就是我们的程序员,通过写代码——if 怎么样、Else 怎么样,来告诉计算机,去做某一些特定的任务。智能计算是我们写一个算法,它通过学习数据来获得一些能力,比如某一个算法模型,学习了一堆语言,它自己能够做对话,或者是能够写作等等。


大家认为现在智能计算还在比较初期的阶段,未来还会有很多倍的增长,这也导致很多公司进来做这个事情,做 AI 处理器。那为什么叫 AI 处理器,为什么 GPU 不叫 AI 处理器?因为 GPU 最初还是针对图形处理而设计的。


后面最早的 AI 应用是计算机视觉,其实也是做图片、视频方面的处理,跟之前显卡做的事情,本质上从底层的计算逻辑来说是比较类似的,GPU 就自然而然成为 AI 市场里面比较主要的计算平台。


但是其他的 AI 处理厂商认为,这个不是针对 AI 计算进行特别优化的处理器平台。所以,不同的厂商有不同的想法,各自按照自己的想法,用自己认为比较优的 AI 计算的逻辑来打造自己的产品。


所以全球范围之内,各种各样的 AI 处理器厂商有做数据中心的,有做边缘的,有做 IoT 的,估计大大小小得有上百家公司。过去几年,有一些公司开始退出,这是整体的大概情况。


InfoQ:AI 芯片跟算法演进是不是紧密联系的?


卢涛:AI 处理器其实还是我们刚刚讲的 DSA 里面的某一类,限定的是我们所做的 AI 业务。如果真正想要做一个比较好的处理器架构,是需要软硬件协同打造。即使是个芯片公司,你希望你打造的处理器平台,是能够最优来处理和解决这些问题,它跟算法的演进肯定有关系的。当然,不同的 AI 处理器厂商看到的未来是不一样的,所以每一家都有自己不同的路径。


InfoQ:刚刚您大概介绍了 AI 芯片的行业现状,也追溯了一些历史,从根本上来说,AI 芯片的市场取决于 AI 应用的增长,能否介绍下当前 AI 芯片在支撑应用落地方面的进展如何,大家现阶段要解决的问题主要是哪些,我们的目标又是什么?


卢涛:今天 AI 已经在很多地方落地,而且很多人已经亲身体验到这些场景。举个例子,我们上淘宝、抖音,我看到的淘宝跟你看到的淘宝可能不一样,这背后有一套推荐算法,这个推荐算法是 AI 的一个应用领域,还有搜索引擎也是 AI 的应用。


比如说现在很多互联网公司在内容的合规上面,以前大家可能听说,某一些头部的互联网公司有两万人的内容合规团队,今天其实用了大量的机器来替代这部分人力。比如我们日常打银行的客服电话、或者是运营商的客服,最开始的接线人往往都是机器人,这个机器人也是 AI 的应用。


AI 也在支持一些大产业的发展,像智慧医疗、汽车产业也都跟进非常快。我认为机器智能,或者是 AI,后面会彻底、全面地重塑一遍我们的 IT 产业,甚至可以把它当做 IT 2.0。


我们有很多场景,未来都非常有想象力。比如一家十万人的企业,有一万人的销售团队,大家产生了大量的像客户访客的会议记录,收集了很多产业里面各种各样的材料文件,最后做了各种标书,怎么样才能够把它呈现出来?如果我们有一个比较好的 NLP 自然语言处理的算法,能够把这些内容给提炼出来,对销售转化率来说是很有帮助的。


但同时它也是非常碎片化和场景化的,需要一段时间,我们一个个产业、一个个场景去打造,最后真正产生价值。


所以我个人对整个 AI 产业是看好的,只是这个产业需要比较长的周期。我工作已经 20 年了,我加入 Graphcore 后,我就跟大家开玩笑说,估计 AI 这个工作够我做一辈子了,做到退休是没问题的。这里面想象空间是非常大的,不管是 AI 处理器公司,或者是我们 AI 做算法的公司,做解决方案的公司,这里面是巨大的市场,等于是整个产业的重造。


InfoQ:现在芯片初创公司,大家都会试图以技术创新来争取自己的一些优势,能否说下,跟大厂这些巨头相比的话,初创公司的优势跟劣势是什么?


卢涛:大厂的优势肯定是规模效应,产品在市场的份额以及各方面的资源,不管是自己的资源,产业上的资源,都是它的优势。但是我们往往讲,事情都有辩证性,巨大的优势有的时候也是一个大包袱。所以初创公司来说,不仅仅局限于芯片公司,各行各业的初创公司,进入市场的时候基本上都是两类逻辑。


并不是所有的公司都是像您刚才讲的,以技术创新的姿态进入。我认为是两类,一类公司是跟随策略,头部的大公司在做什么事情,然后跟着做类似的事情,通过提供更廉价的方案,提供性价比,对某一些客户提供更加贴身的服务,通过商务上的灵活性、支持上的灵活性,来取得自己的成功。坦诚讲,这类在创业公司里面是属于大部分,大部分是跟随策略的比较多,那些真正有技术创新的公司不是特别多。


第二类是要做技术创新,做模式创新的公司。我们之前一直讲南坡北坡的故事,我们爬珠峰有南坡和北坡,一条道路我们上去的时候比较平坦。另外一个道路可能上去的时候,气侯条件非常恶劣,风险也非常大,但是最后可能就是选择走更难一段的能成功。


尤其在技术行业里面,我们讲大的 IT 行业,不管是互联网还是芯片行业,还是传统的 IT 设备公司,技术产业的马太效应非常明显,基本上非常符合 721 原则,就是头部的公司能获得整个市场 70%的利润,甚至可能比 70%还要多的市场份额。第二名的公司,可能获得 20%,剩下的其他所有公司在 10%里面垂死挣扎。所以如果采用跟随策略,不管是产品逻辑还是市场战略,头部公司如果真的想打击,其实是非常容易的。


我经常在公司内部讲,价格永远都不是自身的首要条件,如果产品是跟随策略,最后想通过这个低价来获胜,是非常危险的。我一直认为,在大的 IT 产业里面,如果你是个小公司,是个创业公司,就必须要立志做一个颠覆者。


InfoQ:技术创新或者模式创新,对于初创公司来说还是比做随大流的事情会更有意义。


卢涛:更有意义,可能就是起步的时候会非常难。因为要去教育市场这个技术和模式,可能不仅是教育客户,还得教育资本,甚至教育自己内部的同事和员工,所以会非常难起步,风险也很大,因为你认为的非常牛的路径,也未必是成立的。但是,往往只有冒险这么大风险的时候,我觉得在已经有巨头的产业里面,才有机会真正杀出一片血路来。


InfoQ:一个初创公司要怎么去找到自己的定位,您如何看待这个事情?


卢涛:首先对自己要有认知,对自己团队的能力有认知,边界在哪里,对这个目标产业的认知。这个认知未必是正确的,但至少在某一个阶段,需要有当前的认知和想法,才能去定位。我觉得很关键的是,要尽量地有更多的数据,更多的信息来源,更多的一线的场景认知。


但是这里面往往有两种公司,一种公司是拿着锤子找钉子的,另一种是拿着钉子找锤子的。他们的目的也非常不一样,拿着锤子找钉子的团队,自己可能在技术方面非常卓越,但在市场化,或者是在工程、逻辑方面有不足,拿着自己认为很牛的某个产品来找场景。还有一类典型的是,拿着钉子找锤子,以前是做落地的,做市场出身的团队,可能看到了一些产业上的问题,需要解决的问题,最后需要找一个锤子把这个钉子给锤进去,我觉得核心还是要对自己的团队,对这个产业要有自己的认知。


InfoQ:Graphcore 是属于锤子找钉子还是钉子找锤子的?


卢涛:我觉得 Graphcore 更多的是锤子找钉子,但也不完全是锤子找钉子,我们在做芯片的时候对未来有很多的认知。


Graphcore 的创始团队,比如 CEO、CTO 本身是芯片背景的专家,不是 AI 专家,但是 Graphcore 对 AI 的 know-how 是从哪里来的?我们有一群世界级的 AI 科学家,他们作为我们的大脑,比如像 DeepMind 的联合创始人是我们的技术顾问以及个人投资者,OpenAI 的几个创始人也是我们的顾问,我们有这么一群世界级的科技家,他们会向我们勾勒他们对未来 AI 世界的看法,是朝什么方向演进的,他们今天遇到了什么问题。


我们可能是拿着锤子在敲未来的一颗钉子,但这个钉子我们是知道的,它也不是说拿着锤子到处去找钉子,而不知道钉子在哪里。


InfoQ:Graphcore 自身来说,在当前这个阶段怎么去应对来自全球和本土的竞争?


卢涛:首先我们看整个竞争的格局,我今天想了一个词,叫做“一超一强”和“其他”。一超是 Nvidia,一强是 Google 的 TPU,因为它也做了四代了,以及“其他”。包括我们自己其实还是在这个“其他”里面的,但我们可能走的比其他人快一点。有这样的一个认知之后,其实像 Google 的 TPU,它主要是随着 Google 的云来进行售卖的一个计算平台。所以我们把 Google 排除出去,我们认为在整个市场格局里面,基本上,我们主要盯的一个对象就是英伟达 Nvidia。


我们认为现在只要我们按照自己既定的路径去执行就好。因为从我们自身的角度来看,在 AI 处理器创业公司这个群体里面,我们还是非常有先发优势的。你看目前还有很多公司在讲 PPT,我们已经发第二代产品,7 纳米都已经量产了,另外就是我们确实在北美、欧洲、中国等地,都跟头部的一些公司有比较深的进展。我们承认我们跟 Nvidia 在生产的完美性、可用性上还是有差距,但也许其他人跟我们的差距比我们跟英伟达的差距更大。


因为我们的技术架构非常有特点,Nvidia GPU 做得不好的一些场景,我们做可能有非常大的优势,可能不止好 30%、50%,我们甚至看到在国内有一些落地场景,我们的性能真的是 GPU 的 10 倍。我们未来还可能有机会探索一些在 GPU 上不能实现的场景。


InfoQ:能否说说在您看来,2021 年芯片行业有哪些值得关注的趋势?


卢涛:我觉得不一定是要讲趋势,大家如果有兴趣想跟踪 AI,或者是芯片的产业,可以稍微关注几个方向。

第一,今天我们聊了很多 AI 方面的话题,AI 加速器大家还可以持续关注,因为最近这个赛道里面新进来的玩家还是不少的。过去半年,拿了很好的投资的公司,在中国本土至少有 5 家以上,所以这个赛道还是非常热闹的。我觉得大家可以持续再关注一下,看看未来 2021 年、2022 年大家的一些进展,最后看看大家是怎么样在做产品,如何玩市场和玩生态。


第二个,我们前面讲过汽车,我觉得大家可以关注一下智能驾驶或者是智能汽车相关的一些情况,我们讲 AI 落地有可能是单一的非常大的场景。像我们在移动互联网时代,智能手机是真正的杀手级的领域,每年发货量以亿级为单位,未来或许是智能汽车或智能驾驶相关的。


还有两个是比较前沿的事物,大家有兴趣也可以关注一下,一个是光子计算,一个是量子计算。

还有两个更近一点,一个是 ARM 架构在数据中心和在 PC 端的一些进展,另一个是 RISC-V 在 IoT 领域的进展,也可以关注一下。


InfoQ:接下来剩下大概十分钟左右的时间我们来看一下听众有哪些问题,有一个问题可能有点意思,怎么看待当下许多 AI 芯片公司挑战英伟达的底气?


卢涛:首先我觉得,我们要承认这是非常难的事情,刚才我看到这个评论区里有一个网友讲生态构建非一朝一夕,这个跟人才投入度非常有关,这个我非常认可。大家要挑战 Nvidia 长期来说还是个生态之争,英伟达在过去超过十年做的生态是它最大的护城河。


其他 AI 芯片公司,我相信如果单从芯片的角度要做出跟英伟达的 GPU 比较起来,在某些场景里面有非常大的优势,或者甚至非常有特点,在全球范围之内应该不止一支团队,而是有不少团队是有这个实力做这个事情的,英伟达最大的护城河就是软件生态,从 CUDA,到最开始做 HPC,做游戏,到后来开始 AI。

但是到了今天,当然并不是说我们这些在做 AI 处理器的公司都要跟当时英伟达做 CUDA 一样,要花 20 年的时间来做这个事情,如果真的要做 20 年,我估计不管是创业团队,还是投资人,还有市场和用户未必都会等你。


今天生态的情况跟当时会有一些差别。我们回顾一下,最开始真正有意义的 GPU 做 AI 应用的场景,叫 AlexNet,当时并没有所谓的机器学习框架,是当时有个叫 Alex 的极客,他用 CUDA 写了第一个计算机视觉的模型,真的是拿 CUDA 一行一行代码写出来的。


假如说今天做 AI 算法模型开发还是那样的一个情况,相信整个 AI 产业的发展都不可能经历今天这样的繁荣,因为在全球范围之内,能够做这样的事情的人都不是特别多。后来就是有一些事情大家能够一起建立,第一就是现在的机器学习框架软件,以及在框架软件之上的 Model 库,模型库是很大的一个建立点。


举例来说,TensorFlow 有很多的用户,或者 PyTorch 有很多的用户,他们做开发是用 Python 语言,在 TensorFlow 之上进行编程。当然我们今天的 AI 其实并不一定是跑在 GPU 上的,有些可能是跑在 CPU 上,但我们真正做算法的开发工程师,或者是我们的研究员,他很多时候并不关注底下到底是用了 CPU 或者是 GPU 平台,它就是通过 TensorFlow 这个框架来构建自己的算法。


类似这样的一些工具,能帮助我们今天的 AI 处理器公司,不仅仅是 Graphcore,其他的 AI 处理器公司能够缩短打造生态的过程。拥抱一些开源的社区,通过对像 TensorFlow、PyTorch 这些产品的支持,很大意义上能够降低用户的使用门槛,并不需要让程序员把一行一行 CUDA 的代码移植到某一个 Graphcore 的 IPU,或者是另外一个 AI 处理器上,这种是非常非常少的。这是第一点,今天我们有建立的点。


第二点就是我们现在看到在全球范围之内,一些比较领先的 AI 玩家,他们也在做一些工作,比如微软亚洲研究院,前一阵子在 GitHub 上也开源了一个项目叫 NNFusion,还有阿里云也开源了一个项目叫 HALO,也两个项目有一点异曲同工的感觉,当然今天我不能说项目很完美,但是它的初衷,出发点是想构建一个相对 TensorFlow 和 PyTorch 再往下面一点,在 AI 处理器跟框架之间的一个平台。这个平台,他们把它定位叫做 AI 编译环节。尽量把像 GPU 和 IPU,未来还有其他的一些 AI 处理器,中间迁移的工作量尽量缩小,甚至也会缩短大家往上对接 TensorFlow 或 PyTorch 的工作量,这样就是大家有意识共同在使一些力。


所以我们也看到,整个产业想在英伟达之外构建一些能力的意愿还是非常强烈的。最后我总结一下,这个事情还是非常难的,但是这个事情难度比当年 GPU 做 CUDA 生态要小一些。另外,如果我们借助一些巨头玩家的力量,跟他们一起合作,这样子可能又能够把难度降低一些。


InfoQ:最后一个问题,有观众提问,“像我这样普通的开发者如果想要使用 IPU 有什么比较简单的路径吗?”


卢涛:目前在我们 Graphcore 的中文官网http://www.graphcore.cn/,有开发者的申请入口。目前我们在国内跟金山云合作发布了一些实例,可以分配一些计算资源来使用,这个对于很多开发者都是免费的。


另外在 2021 年,我们会在这块会加大投入,会有更多的计算资源进来,来打造开发者和研究者的生态。如果是一些商业公司,可以联系我们的合作伙伴,像神州数码、戴尔、浪潮、微软云等等。所以基本是两种类型,除了商业以外,我们会针对开发者、研究者专门做些计算资源来免费供大家使用。

2021 年 2 月 10 日 14:224347
用户头像
罗燕珊 InfoQ中文站记者

发布了 80 篇内容, 共 27.7 次阅读, 收获喜欢 92 次。

关注

评论

发布
暂无评论
发现更多内容

如何在 Go 中写出高效的单元测试

_why先生

go testing slideshare

ARTS 04 - 使用 Gitlab + Generic Webhook Trigger 触发 Jenkins 自动化构建

jerry.mei

算法 ARTS 打卡计划 CI/CD 函数式编程 Elixir

vue项目发布时去除console语句

网站,小程序,APP开发定制

了不起的 Webpack Scope Hoisting 学习指南

pingan8787

Java 前端 webpack

[译] 图解前端-深入理解 Props 和 State

梦见君笑

前端 前端框架 React 前端进阶训练营 漫画编程

java8的parallelStream提升数倍查询效率

网站,小程序,APP开发定制

java8

AOP有几种实现方式?

八苦-瞿昙

技术 随笔杂谈 aop 代理 框架

[译] 图说前端-图解 React Native

梦见君笑

前端 前端框架 前端进阶训练营 漫画编程

每周学习总结 - 架构师培训 6期

Damon

U盘+grub2安装centos8实战

昌安古城

使用 Generic Webhook Trigger 触发 Jenkins 多分支流水线自动化构建

jerry.mei

DevOps 持续集成 jenkins CI/CD 持续交付

[译] 图说前端-图解 React

梦见君笑

前端 前端框架 React 框架 前端训练

[译] 图说前端-组件、Prop 和 State

梦见君笑

前端 前端框架 React 前端进阶训练营 漫画编程

海南的七星彩网站系统盘口代码解析

网站,小程序,APP开发定制

代码

帮助小团队实现大梦想 | Atlassian 云产品免费使用

Atlassian

要不要做一个gif动态图玩一下?

诸葛小猿

GIF ScreenToGif 动态图

架构师课程第六周 作业

杉松壁

如何使用预测性指标衡量敏捷转型的成功?

Atlassian

敏捷开发 开发工具 Atlassian Jira

万字详解加拿大央行CBDC分析报告

CECBC区块链专委会

手把手整合SSM框架

JavaPub

每周学习总结 - 架构师培训 5 期

Damon

技术解读:单集群如何做到2万+规模

FI洞见

大数据 FusionInsight 华为云 大集群

JavaScript 混淆与逆向必读之 AST 节点类型名词基础

Python编程参考官方账号

Java

架构师训练营第六周作业--doris临时失效时序图

CATTY

时序图

架构师训练营第六周学习总结

CATTY

极客时间 - 架构师培训 - 6 期作业

Damon

如何编写可怕的 Java 代码?

武培轩

Java 编程 程序员 后端

架构师训练营第六周学习总结

张明森

创业使人成长系列 (3)- 如何取个好名字

石云升

创业 成长 取名

架构师训练营第六周作业

talen

观智能化浪潮如何改变产业链创新

CECBC区块链专委会

OCR技术的未来发展与演进

OCR技术的未来发展与演进

面对“芯片荒”,芯片业者如何找到自己的定位?-InfoQ