写点什么

现在 Google 制造自己的芯片,Intel 要发疯

  • 2016-06-28
  • 本文字数:2691 字

    阅读完需:约 9 分钟

GOOGLE 已经制造出自己的计算机芯片,而事情还远没有结束。

整个互联网上最强大的公司昨天在科技界抛出了几枚重磅炸弹,披露了全新的定制化芯片,借此这家庞大的在线帝国可以更好地经营未来的主营业务:人工智能

为了制造自己的芯片,Google在改造了科技界的很多东西之后,又向前迈近一步。为巩固各类在线服务,过去十多年来这家公司为自己的大规模数据中心设计了各种新硬件,包括计算机服务器、网络设备等。随着服务范围和规模达到一个空前的高度,他们需要通过更高效的硬件运行这些服务。多年来,其他很多互联网巨头也曾效仿这种做法,以此为契机全球硬件市场产生了翻天覆地的变化

Google 在芯片制造方面努力的结果辐射范围已经超越了 Google 帝国本身,甚至让芯片行业的未来受到威胁。

对于这款新芯片,Google 的目标始终未变:空前的高效。为了让 AI 技术跃上一个新高度,他们需要一种能在更低能耗前提下,用更短时间完成更多任务的芯片。但这个芯片所产生的效果已经超越了 Google 帝国本身,甚至让 Intel 和 nViaia 这样的商业化芯片制造商的未来受到威胁,尤其是考虑到 Google 对于未来的愿景,这种情况显得更为紧迫。根据在 Google 帝国的巩固之路上主要负责全球数据中心网络的Urs Hölzle 所说,新的定制芯片只是万里长征的第一步。

不,Google 不打算将自己的芯片出售给其他公司,他们不会与Intel 或nVidia 直接竞争。但考虑到这家公司的数据中心规模之大,Google 目前已经是这些芯片公司最大的潜在客户。与此同时,随着越来越多企业开始使用Google 提供的云计算服务,他们自行购买的服务器(以及芯片)数量只会越来越少,这等于进一步蚕食了芯片制造商的市场份额。

确实,Google 公布有关新芯片的新闻只是为了宣传自家的云服务业务,让更多企业和开发者选用自家的AI 引擎,并将其用于自己的应用程序中。随着Google 开始将AI 的强大能力出售给其他公司,这实际上是在(以相当高调的方式)宣称他们可以提供运行这种AI 的最佳硬件,而且绝无仅有的硬件。

Google 对速度的渴求

Google 的新芯片叫做 Tensor Processing Unit(张量处理器),即 TPU。这是因为这种芯片更适合运行 TensorFlow,正是这个软件引擎驱动着Google 的深度神经网络,硬件和软件组成的网络可以通过分析海量数据学习如何完成特定任务。其他技术巨头通常使用图形处理器,即GPU 运行自己的深度神经网络,而这GPU 最初是针对游戏和其他图形密集型应用程序的图像渲染任务设计的。虽然GPU 在设计上很适合用于运行驱动深度神经网络所需的计算任务,但Google 认为如果使用定制芯片可以进一步提高效率

根据Google 的介绍,他们结合机器学习的具体需求对TPU 的规格进行了调整,用更少量事务就可以运行每一步操作。这意味着这样的芯片每秒钟都能执行更多操作。

目前Google 同时使用TPU* 和*GPU 运行自己的神经网络。Hölzle 拒绝详细介绍Googe 对于这种TPU 的使用方式细节,不过透露说这种技术可以处理驱动Android 手机语音识别功能所需的“部分运算量”。同时他还说Google 即将发布一篇介绍这种芯片好处的论文,并且还会继续设计能够以其他方式处理机器学习任务的新芯片。最终,他们的目标是彻底停止使用GPU。“已经取得一些进展了,”Hölzle 说:“对机器学习来说,GPU 还是不够专精,毕竟从设计上就不是针对这种用途的。”

nVidia 可不愿意听到这种说法。作为全球最主要的 GPU 经销商,nVidia 正在急迫地将自家业务拓展到 AI 领域。同时 Hölzle 也提出,最新款 nVidia GPU 包含一个专门的机器学习模式。但是很明显,Google 希望这个变化能够进行的快点,再快点。

最智能的芯片

与此同时,其他公司,尤其是 Microsoft也在芯片之路上进行着探索。场效可编程门阵列(Field-programmable gate array,FPGA)就是一种可以通过重新编程执行特定任务的芯片。Microsoft 已经测试过FPGA 在机器学习领域的运用,而Intel 也明确了市场的发展方向,最近收购了一家销售FPGA 的公司。

一些分析师认为这才是最明智的发展之路。密切关注芯片制造业务的Moor Insights and Strategy 事务所总裁兼首席分析师Patrick Moorhead 认为FPGA 可以提供更高灵活性。Moorhead 怀疑Google 新发布的TPU 是否有些“过犹不及”,并指出制造这样的芯片至少需要六个月,在竞争日趋激烈的市场中,六个月时间已经太长了,并且还要与最大的互联网公司展开竞争。

但Google 不想要这样的灵活性。对他们来说,速度的重要性超越一切。在被问到为什么Google 要从零开始制造自己的芯片而不是使用FPGA 时,Hölzle 说:“只是想实现更高的速度。”

核心业务

Hölzle 还提到 Google 的芯片并不是为了取代 CPU。中央处理器是所有计算机服务器的心脏,这个搜索巨头依然需要使用这种芯片运行数据中心内成千上万的服务器,而 CPU 是 Intel 的主营业务。当然如果 Google 愿意专门为了 AI 打造一款自己的芯片,那么人们不禁好奇他们是否打算更进一步重新设计自己的 CPU。

Hölzle 淡化了这种可能性。“只需要解决尚未解决的问题,”他说。换句话说,CPU 是一种成熟的技术,已经可以按照预期正常工作。但同时他也说,Google 希望芯片市场能够呈现出良性竞争的环境。也就是说,他们希望从多家经销商处购买,而不只是购买 Intel 的产品。毕竟更激烈的竞争对 Google 而言意味着更低的价格。同时 Hölzle 也解释说,Google 正是为了能获得更丰富的选择而与 OpenPower 基金会合作,这家机构的目标是提供任何人都可以使用和修改的芯片设计。

这是个很强大的想法,同时对全球最大的芯片制造商来说也是一个很强大的潜在威胁。根据 IDC 研究公司分析师 Shane Rau 所说,全球服务器 CPU 出货总量中有大约 5% 是 Google 购买的。他说在最近一年内,Google 购买了大约 120 万块芯片,其中大部分来自 Intel。(2012 年,Intel 高管 Diane Bryant告诉 WIRED 说 Google 从 Intel 处购买的服务器芯片数量远远超过其他五家客户,而其他这些客户全都是 _ 销售服务器 _ 的公司。)

无论对 CPU 有何计划,Google 还将继续探索更适合机器学习需求的芯片,而我们要等到很多年后才能知道什么可行,什么不可行。毕竟神经网络这个概念本身也在继续进化。“我们的探索从未中断,”他说:“但最终答案是什么我还不知道。”可以肯定的是,随着 Google 继续探索,全世界的芯片制造商都在密切关注。

作者:CADE METZ
阅读英文原文 Google’s Making Its Own Chips Now. Time for Intel to Freak Out


感谢陈兴璐对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-06-28 18:385574
用户头像

发布了 283 篇内容, 共 116.2 次阅读, 收获喜欢 62 次。

关注

评论

发布
暂无评论
发现更多内容

数据查询慢?别着急,读个执行计划定位优化下

NebulaGraph

性能优化 图数据库 NebulaGraph

用PHP使用API接口获取虾皮商品详情

Noah

大模型在数据分析场景下的能力评测|进阶篇

Kyligence

数据分析 指标平台

神秘的SQL AST抽象语法树

张磊

sql AST 语法树

我终于学会的前端技能——代码调试、打断点

小白Coding日志

Vue 前端 vscode JavaScrip debugger

基于 Amazon EKS 搭建开源向量数据库 Milvus

亚马逊云科技 (Amazon Web Services)

向量数据库 大语言模型

五大场景,助力煤炭行业设备资产数智化管理

用友BIP

资产管理

医院智慧运营管理转型,到底应该如何推动?

用友BIP

应用架构的演进 I 使用无服务器保证数据一致性

亚马逊云科技 (Amazon Web Services)

Serverless 微服务 Amazon DynamoDB Amazon Step Functions

阿里云宕机带来的稳定性思考

老张

混沌工程 全链路压测 稳定性保障

图像和文档透明显示软件 Overlay激活版最新

胖墩儿不胖y

Mac软件

电脑网站支付报错“验签出错,建议检查签名字符串或私钥与应用公钥是否匹配”问题解决记录

盐焗代码虾

Java 支付宝报错 排查思路

【云栖2023】姜伟华:Hologres Serverless之路——揭秘弹性计算组

阿里云大数据AI技术

大数据

零一万物回应「抄袭 LLaMA」;京东原副总裁试用可穿戴人工喉丨 RTE 开发者日报 Vol.85

声网

香港服务器助您实现在线业务的成功之路

一只扑棱蛾子

香港服务器

添添闺蜜机销量超12000台,市场领先优势进一步凸显

新消费日报

用友力量!三峡、中粮、云投等众多央国企成功上线数智化领先实践项目

用友BIP

企业数智化

「智造」第7期:浅谈工业生产设备采集方式

用友BIP

智能制造

【专家观点】社会化架构支撑产业链服务

用友BIP

产业链

光纤接入网的方式有哪几种?

小魏写代码

从“用数据说话”到“让数据说话”,全面数据服务焕发酒店生意新生

用友BIP

数据资产

C++异常处理:如何使用try、catch、throw

互联网工科生

C++

从 MLOps 到 LMOps 的关键技术嬗变

Baidu AICLOUD

大模型 LLMOps 千帆大模型平台 LMops

现在Google制造自己的芯片,Intel要发疯_Google_CADE METZ_InfoQ精选文章