
整理 | 华卫
近日,据外媒报道,Meta 正考虑采用谷歌设计的芯片。受此消息影响,英伟达股价下跌,盘中最大跌幅达 7%,随后有所回升,于 11 月 25 日收盘下跌 4.3%。谷歌母公司 Alphabet 股价则延续涨势,在前一天大涨逾 6% 后,当日再涨 4.2%。
报道称,Meta 计划斥资数十亿美元采购谷歌张量处理单元(TPU),相关芯片预计将于 2027 年在 Meta 的数据中心投入使用,且明年或将从谷歌云部门租赁该类芯片。据了解内部表态的人士透露,部分谷歌云高管认为,该计划有望帮助公司抢占英伟达数据中心业务高达 10% 的营收份额。考虑到英伟达仅 2025 年第二季度的 Data Center 部门营收就超过 510 亿美元,若谷歌能拿下这一比例的份额,或意味着数百亿美元的营收增量。
作为定制化芯片,TPU 被业内专家认为是谷歌的核心竞争优势,该产品能为客户提供高效能的 AI 专用计算解决方案。此外,谷歌还开发了全新配套软件,旨在降低 TPU 的使用门槛。若 Meta 最终落地 TPU 采购计划,这将成为谷歌的重大胜利,也是对其芯片技术的潜在市场验证。
一笔交易,或助 Alphabet 估值达 4 万亿美元
2018 年,谷歌推出第一代 TPU,最初专为自身云计算业务的内部场景设计。此后,谷歌陆续发布了更先进的迭代版本,重点优化人工智能工作负载的处理能力。今年 4 月,谷歌推出了最新一代 TPU 芯片 “Ironwood”。其采用双芯片设计,集成 192GB 高速高带宽内存(HBM)和六个定制化 AI 处理模块,加速核心基于两种不同架构打造。
每块 Ironwood 芯片包含四个 SparseCore 核心,该核心专为处理大型嵌入向量优化,嵌入向量是一种存储 AI 模型信息的数学结构;此外还搭载两个 TensorCore 核心,用于加速矩阵乘法运算,这是 AI 模型处理数据的核心计算环节。谷歌将 Ironwood 部署于液冷集群中,单个集群最多可集成 9216 块液冷芯片。该公司表示,单集群算力可达 42.5 exaflops 的性能,1 exaflop 相当于每秒进行百亿亿次的计算。
目前,尚不清楚 Meta 与谷歌的潜在芯片合作是否会涉及 Ironwood 或其他 TPU 型号。考虑到这家 Facebook 母公司预计 2027 年才开始部署相关芯片,其可能会选择采购明年大概率推出的 Ironwood 继任者。
当前,全球 AI 基础设施建设企业正积极寻求芯片供应多元化。作为该领域的顶级投资方,Meta 预计今年资本支出将达到 700 亿至 720 亿美元。谷歌与 Meta 的潜在合作释放出明确信号,其定制化 TPU 正崛起为可靠且高性能的替代选择。
就在上月,Anthropic 宣布将从谷歌采购多达 100 万个 TPU 芯片用于人工智能研究,这一合作无疑亦为谷歌云技术部门在 AI 时代的芯片竞争野心注入了强心剂。当时,谷歌云 CEO Thomas Kurian 表示,“Anthropic 选择大幅扩大 TPU 的使用规模,反映出其团队多年来使用该芯片所体验到的卓越性价比和能效表现。我们将在已成熟的 AI 加速器产品组合(包括第七代 TPU 芯片 Ironwood)基础上,持续创新,进一步提升 TPU 的能效和产能。”
受 Meta 拟采购谷歌 TPU 人工智能芯片的相关消息提振,市场情绪高涨, Alphabet(谷歌母公司)昨日股价上涨约 5%,市值突破 3.8 万亿美元。目前,全球仅有微软、英伟达和苹果三家公司曾达到 4 万亿美元市值门槛,其中仅后两家仍维持这一水平。2025 年以来,Alphabet 股价已累计上涨约 70%。
连为谷歌 TPU 提供设计支持的 Synopsys 公司股价都呈亮眼表现,在 11 月 24 日大涨 11% 后,11 月 25 日继续上涨逾 1%。
对谷歌而言,这不仅仅是一笔单一的交易,更是其终于能变现长达十年的定制芯片设计投入的机会。成功向 Meta 这样的客户供货,不仅会带来数十亿美元的营收,还能证明其 TPU 在性能和效率上都能与英伟达的产品抗衡。这一潜在的巨额新营收来源,正是支撑谷歌近期股价上涨的重要因素。
而对 Meta 来说,这笔交易是一个明智且具有战略性的举措。该公司计划 2026 年在数据中心领域投入至少 1000 亿美元,若核心硬件几乎完全依赖单一供应商,将构成重大商业风险。引入谷歌 TPU 后,Meta 不仅能降低这一风险、增强议价能力,还有望压低长期成本。这种审慎的供应链管理策略,或将对 Meta 股价的长期走势形成积极支撑。
谷歌发言人表示,“谷歌云业务部门的自研 TPU 和英伟达 GPU 的需求都在加速增长;我们致力于支持这两者,正如多年来一直做的那样。”
英伟达体面回应,AI 芯片竞争格局或剧变
对于这一消息,英伟达还第一时间作出了回应。英伟达新闻中心账号在 X 平台上发布声明称,“我们对谷歌的成功感到高兴,他们在 AI 领域取得了重大进展,而我们也将继续向谷歌供应产品。英伟达的技术领先行业一代,它是唯一能运行所有 AI 模型,且能在所有计算场景中实现这一功能的平台。与专为特定 AI 框架或功能设计的专用集成电路(ASIC)相比,英伟达产品具备更卓越的性能、更强的通用性和兼容性。”
值得注意的是,英伟达股价在 11 月 25 日盘前交易中最大跌幅达 3%。有分析师认为,在支撑 AI 热潮的核心芯片领域,谷歌正稳步推进与英伟达的竞争。
多年来,英伟达一直是 AI 专用芯片领域无可争议的龙头,其高性能处理器成为 Meta、OpenAI 等几乎所有头部企业研发及运行复杂 AI 系统的核心支撑。这一近乎垄断的地位,正是英伟达股价实现爆发式增长的核心原因。然而,一段时间以来,全球各地的公司也一直对它们过度依赖英伟达感到担忧。
尽管英伟达的主导地位短期内难以撼动,但谷歌 TPU 的崛起似乎亦正加剧 AI 半导体市场的竞争。市场对此变化的反应更加迅速。
11 月 25 日,曾被视为英伟达 GPU 最有力挑战者的 AMD 股价下跌 6%,芯片设计公司 Arm 的股价也下滑 4.2%。D.A. Davidson 技术研究主管 Gil Luria 表示:“此前市场普遍认为 AMD 有望成为行业老二,但如今看来,这一市场位置可能已无其容身之地。”
此外,此次芯片公司们的股价波动,恰逢市场对 “AI 泡沫是否存在” 及科技公司估值过高的争议持续升温。
集群挑战下,合作有众多可能性
另有报道称,Meta 要采用谷歌的 TPU 芯片可能会面临巨大的集成挑战。理论上,谷歌也可为 Meta 提供其云平台所用的完整 TPU 集群,但后者可能会选择仅采购芯片并集成至自有系统,Meta 的数据中心采用定制化服务器和机架设计。
而 TPU 的部署方式与 Meta 惯用的基于 AMD 和英伟达芯片的集群截然不同。AMD 和英伟达 GPU 通过分组交换机将数百或数千块芯片连接成大规模横向扩展的计算架构,TPU 则采用光电路交换(OCS)技术连接成大型环形网格。关键在于,这类设备的运行原理与分组交换机完全不同,通常需要不同的编程模型。
更大的挑战在于 PyTorch,这是 Meta 开发的深度学习框架,旨在让机器学习工作负载能够在 CPU 和 GPU 硬件上无缝运行。PyTorch 可以在 TPU 上运行,但 TPU 并不原生支持该框架,这意味着 Meta 需要采用一个名为 PyTorch/XLA 的转换层。
考虑到科技巨头拥有庞大的软件开发团队,Meta 和谷歌能够克服这一挑战。但他们为何要费心这么做呢?有可能的情况是,Meta 在讨论为其 Llama 系列模型进行针对谷歌 TPU 的推理优化。在模型上运行推理所需的计算资源比训练模型少一个数量级,推理工作负载还能从靠近终端用户的部署中受益,这有助于减少延迟并提升交互性。
此前,Meta 曾在 Hugging Face 等代码仓库向公众发布其大型语言模型系列,用户可以在该平台下载这些模型,并在包括谷歌 TPU 在内的各类加速器上运行。因此,Meta 需要确保 Llama 模型在 TPU 上能良好运行,以促进企业用户采用该模型。但如果仅以推理为目标,Meta 并不需要自行拥有这些芯片,企业用户完全可以直接从谷歌租赁 TPU 来运行 Llama 模型。
数年前,Meta 曾自主研发一款名为 MTIA 的定制化推理芯片。有外媒报道称,该公司计划于 2025 年底部署该处理器的新一代产品。而此次与谷歌的潜在 TPU 合作,或许意味着其 MTIA 芯片计划或将缩减规模;另一种可能性是,Meta 拟将 MTIA 用于推理任务,同时采用 TPU 承载训练工作负载。
参考链接:
https://www.cnbc.com/2025/11/25/nvidia-shares-today-google-meta-ai-chip-report.html
https://dataconomy.com/2025/11/25/recent-chip-deal-impact-on-google-meta-and-nvidia-stock/
https://www.theregister.com/2025/11/25/nvidia_google_tpu_meta/
https://siliconangle.com/2025/11/25/nvidia-shares-drop-report-meta-may-buy-tpus-google/







评论