2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

现在 Google 制造自己的芯片,Intel 要发疯

  • 2016-06-28
  • 本文字数:2691 字

    阅读完需:约 9 分钟

GOOGLE 已经制造出自己的计算机芯片,而事情还远没有结束。

整个互联网上最强大的公司昨天在科技界抛出了几枚重磅炸弹,披露了全新的定制化芯片,借此这家庞大的在线帝国可以更好地经营未来的主营业务:人工智能

为了制造自己的芯片,Google在改造了科技界的很多东西之后,又向前迈近一步。为巩固各类在线服务,过去十多年来这家公司为自己的大规模数据中心设计了各种新硬件,包括计算机服务器、网络设备等。随着服务范围和规模达到一个空前的高度,他们需要通过更高效的硬件运行这些服务。多年来,其他很多互联网巨头也曾效仿这种做法,以此为契机全球硬件市场产生了翻天覆地的变化

Google 在芯片制造方面努力的结果辐射范围已经超越了 Google 帝国本身,甚至让芯片行业的未来受到威胁。

对于这款新芯片,Google 的目标始终未变:空前的高效。为了让 AI 技术跃上一个新高度,他们需要一种能在更低能耗前提下,用更短时间完成更多任务的芯片。但这个芯片所产生的效果已经超越了 Google 帝国本身,甚至让 Intel 和 nViaia 这样的商业化芯片制造商的未来受到威胁,尤其是考虑到 Google 对于未来的愿景,这种情况显得更为紧迫。根据在 Google 帝国的巩固之路上主要负责全球数据中心网络的Urs Hölzle 所说,新的定制芯片只是万里长征的第一步。

不,Google 不打算将自己的芯片出售给其他公司,他们不会与Intel 或nVidia 直接竞争。但考虑到这家公司的数据中心规模之大,Google 目前已经是这些芯片公司最大的潜在客户。与此同时,随着越来越多企业开始使用Google 提供的云计算服务,他们自行购买的服务器(以及芯片)数量只会越来越少,这等于进一步蚕食了芯片制造商的市场份额。

确实,Google 公布有关新芯片的新闻只是为了宣传自家的云服务业务,让更多企业和开发者选用自家的AI 引擎,并将其用于自己的应用程序中。随着Google 开始将AI 的强大能力出售给其他公司,这实际上是在(以相当高调的方式)宣称他们可以提供运行这种AI 的最佳硬件,而且绝无仅有的硬件。

Google 对速度的渴求

Google 的新芯片叫做 Tensor Processing Unit(张量处理器),即 TPU。这是因为这种芯片更适合运行 TensorFlow,正是这个软件引擎驱动着Google 的深度神经网络,硬件和软件组成的网络可以通过分析海量数据学习如何完成特定任务。其他技术巨头通常使用图形处理器,即GPU 运行自己的深度神经网络,而这GPU 最初是针对游戏和其他图形密集型应用程序的图像渲染任务设计的。虽然GPU 在设计上很适合用于运行驱动深度神经网络所需的计算任务,但Google 认为如果使用定制芯片可以进一步提高效率

根据Google 的介绍,他们结合机器学习的具体需求对TPU 的规格进行了调整,用更少量事务就可以运行每一步操作。这意味着这样的芯片每秒钟都能执行更多操作。

目前Google 同时使用TPU* 和*GPU 运行自己的神经网络。Hölzle 拒绝详细介绍Googe 对于这种TPU 的使用方式细节,不过透露说这种技术可以处理驱动Android 手机语音识别功能所需的“部分运算量”。同时他还说Google 即将发布一篇介绍这种芯片好处的论文,并且还会继续设计能够以其他方式处理机器学习任务的新芯片。最终,他们的目标是彻底停止使用GPU。“已经取得一些进展了,”Hölzle 说:“对机器学习来说,GPU 还是不够专精,毕竟从设计上就不是针对这种用途的。”

nVidia 可不愿意听到这种说法。作为全球最主要的 GPU 经销商,nVidia 正在急迫地将自家业务拓展到 AI 领域。同时 Hölzle 也提出,最新款 nVidia GPU 包含一个专门的机器学习模式。但是很明显,Google 希望这个变化能够进行的快点,再快点。

最智能的芯片

与此同时,其他公司,尤其是 Microsoft也在芯片之路上进行着探索。场效可编程门阵列(Field-programmable gate array,FPGA)就是一种可以通过重新编程执行特定任务的芯片。Microsoft 已经测试过FPGA 在机器学习领域的运用,而Intel 也明确了市场的发展方向,最近收购了一家销售FPGA 的公司。

一些分析师认为这才是最明智的发展之路。密切关注芯片制造业务的Moor Insights and Strategy 事务所总裁兼首席分析师Patrick Moorhead 认为FPGA 可以提供更高灵活性。Moorhead 怀疑Google 新发布的TPU 是否有些“过犹不及”,并指出制造这样的芯片至少需要六个月,在竞争日趋激烈的市场中,六个月时间已经太长了,并且还要与最大的互联网公司展开竞争。

但Google 不想要这样的灵活性。对他们来说,速度的重要性超越一切。在被问到为什么Google 要从零开始制造自己的芯片而不是使用FPGA 时,Hölzle 说:“只是想实现更高的速度。”

核心业务

Hölzle 还提到 Google 的芯片并不是为了取代 CPU。中央处理器是所有计算机服务器的心脏,这个搜索巨头依然需要使用这种芯片运行数据中心内成千上万的服务器,而 CPU 是 Intel 的主营业务。当然如果 Google 愿意专门为了 AI 打造一款自己的芯片,那么人们不禁好奇他们是否打算更进一步重新设计自己的 CPU。

Hölzle 淡化了这种可能性。“只需要解决尚未解决的问题,”他说。换句话说,CPU 是一种成熟的技术,已经可以按照预期正常工作。但同时他也说,Google 希望芯片市场能够呈现出良性竞争的环境。也就是说,他们希望从多家经销商处购买,而不只是购买 Intel 的产品。毕竟更激烈的竞争对 Google 而言意味着更低的价格。同时 Hölzle 也解释说,Google 正是为了能获得更丰富的选择而与 OpenPower 基金会合作,这家机构的目标是提供任何人都可以使用和修改的芯片设计。

这是个很强大的想法,同时对全球最大的芯片制造商来说也是一个很强大的潜在威胁。根据 IDC 研究公司分析师 Shane Rau 所说,全球服务器 CPU 出货总量中有大约 5% 是 Google 购买的。他说在最近一年内,Google 购买了大约 120 万块芯片,其中大部分来自 Intel。(2012 年,Intel 高管 Diane Bryant告诉 WIRED 说 Google 从 Intel 处购买的服务器芯片数量远远超过其他五家客户,而其他这些客户全都是 _ 销售服务器 _ 的公司。)

无论对 CPU 有何计划,Google 还将继续探索更适合机器学习需求的芯片,而我们要等到很多年后才能知道什么可行,什么不可行。毕竟神经网络这个概念本身也在继续进化。“我们的探索从未中断,”他说:“但最终答案是什么我还不知道。”可以肯定的是,随着 Google 继续探索,全世界的芯片制造商都在密切关注。

作者:CADE METZ
阅读英文原文 Google’s Making Its Own Chips Now. Time for Intel to Freak Out


感谢陈兴璐对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-06-28 18:385788
用户头像

发布了 283 篇内容, 共 122.3 次阅读, 收获喜欢 63 次。

关注

评论

发布
暂无评论
发现更多内容

TiDB 配置参数修改与系统变量修改步骤

TiDB 社区干货传送门

实践案例

TiDB集群的GC不回收案例(案情二)

TiDB 社区干货传送门

故障排查/诊断

使用 TiCDC 实时同步 TiDB 数据到备用逃生环境的实践

TiDB 社区干货传送门

实践案例 安装 & 部署

TiDB K8S 定时备份状态异常问题排查

TiDB 社区干货传送门

管理与运维

伴鱼数据库之性能大盘

TiDB 社区干货传送门

社区资源这么丰富我们怎么抄作业

TiDB 社区干货传送门

TiDB 集群 TiKV 节点内存占用较高问题排查

TiDB 社区干货传送门

故障排查/诊断

DM 2.0 小试牛刀

TiDB 社区干货传送门

TiDB SQL调优实战——索引问题

TiDB 社区干货传送门

性能调优 实践案例

生产环境 TiDB V5.0.3 集群部署

TiDB 社区干货传送门

实践案例

TiDB K8S 删除备份阻塞问题排查

TiDB 社区干货传送门

TiDB 底层架构 管理与运维

TiDB在X86和ARM混合平台下的离线部署和升级

TiDB 社区干货传送门

安装 & 部署

SQLserver迁移TiDB场景的实践

TiDB 社区干货传送门

迁移 管理与运维

扩容TIKV节点遇到的坑

TiDB 社区干货传送门

管理与运维

【TiDB CPU使用率过高之一】Scheduler worker CPU

TiDB 社区干货传送门

实践案例

TiDB 在 2021 易车 818 汽车狂欢节的应用

TiDB 社区干货传送门

实践案例

干货分享丨携程国际业务动态实时标签处理平台实践

TiDB 社区干货传送门

实践案例

【精选实践】58 集团的数据库技术选型思路

TiDB 社区干货传送门

数据库架构选型

【SOP 系列 19】region 分布不均问题排查及解决不完全指南

TiDB 社区干货传送门

管理与运维

TiDB 入门运维基础教程(二)--生产环境安装

TiDB 社区干货传送门

安装 & 部署

【TiDB 最佳实践系列】海量 Region 集群调优

TiDB 社区干货传送门

实践案例

TiDB 集群跨平台在线迁移方案(离线环境下从 x86 节点迁移到 arm64 节点)

TiDB 社区干货传送门

管理与运维

SQL上线引发的血案

TiDB 社区干货传送门

都是空格惹的祸

TiDB 社区干货传送门

TiDB 对大事务的简单拆分

TiDB 社区干货传送门

性能调优

从TiDB中学习代码提交规范的重要性

TiDB 社区干货传送门

TiDB 底层架构

TiDB for PostgreSQL 学习指南

TiDB 社区干货传送门

实践案例 管理与运维

TiDB 集群跨平台在线迁移方案(离线环境下从 x86 节点迁移到 arm64 节点)

TiDB 社区干货传送门

管理与运维

TIDB br 备份 PermissionDenied

TiDB 社区干货传送门

TIDB:分布式事务算法Percolator学习笔记

TiDB 社区干货传送门

TiDB 底层架构

TiDB和MySQL的锁一些分析比对

TiDB 社区干货传送门

实践案例 TiDB 底层架构

现在Google制造自己的芯片,Intel要发疯_Google_CADE METZ_InfoQ精选文章