
整理 | 华卫
昨夜,AI 芯片初创企业 Groq 宣布,英伟达将以非独家授权的形式获得其技术授权。作为一项技术授权协议的一部分,创办 Groq 的前谷歌芯片工程师 Jonathan Ross 以及该初创企业的总裁 Sunny Madra 等多名 Groq 核心员工将加入英伟达。
Groq 投资方 Disruptive Technology Advisers 的首席执行官 Alex Davis 透露,该交易价值 200 亿美元,较该初创企业 2024 年 9 月的估值高出 131 亿美元。
挖角核心人才还不够,收走 Groq 最强 “推理技术”
“我们计划将 Groq 的低延迟处理器整合到英伟达 AI 工厂架构中,扩展该平台以服务更广泛的 AI 推理及实时工作负载。” 英伟达首席执行官黄仁勋(Jensen Huang)在发给员工的邮件中表示,与 Groq 的合作将 “拓展” 围绕英伟达芯片搭建的数据中心的能力,他将这类数据中心称为 “AI 工厂”。
此前,Groq 一度挑战英伟达在 AI 处理器领域的主导地位。这次,Groq 称,其与英伟达的协议 “体现了双方共同的关注点,扩大高性能、低成本推理技术的普及范围”。
两家公司表示,技术授权涵盖 Groq 的 “推理技术”,推测指其旗舰产品 “语言处理单元”(LPU)推理芯片。Groq 声称,其 LPU 的能效比英伟达及其主要竞争对手 AMD 生产的 GPU 高出 10 倍。该语言处理单元运行推理工作负载时,速度是 GPU 的 10 倍、能耗却只有其十分之一。据介绍,这款芯片的高效能源于其 “确定性设计”(deterministic design):即能高度精准地控制计算时序。相比之下,标准的 “非确定性芯片”(nondeterministic chips)常出现意外处理延迟,导致计算完成顺序错乱。
LPU 还通过其他方式优化 AI 性能,其内置数百兆字节的片上静态随机存取存储器(SRAM,这是目前市场上速度最快的内存类型。该内存池的性能优于显卡所采用的高带宽内存(HBM),且耗电量更低。Groq 通过自主研发的 “实时扩展”(RealScale)互联技术,将搭载 LPU 的服务器连接成推理集群。
该公司表示,这项技术解决了一个名为 “晶体漂移”(crystal-based drift)的技术难题,该难题此前一直阻碍着 AI 服务器的协同工作。处理器通过时钟控制电路执行计算的频率,这类时钟通常由微型石英晶体实现。“晶体漂移” 是指时钟频率意外变慢的现象,会导致 AI 推理流程效率下降。Groq 称,“实时扩展”(RealScale)技术可自动调整处理器时钟,以缓解这一问题。
留守班底“不倒”,财务官接棒出任 CEO
“反垄断似乎是此次交易的主要风险,不过将交易结构设计为非独家授权,或许能维持竞争的表面假象,” Bernstein Research 分析师 Stacy Rasgon 在关于英伟达与 Groq 交易的客户报告中表示。近年来,科技行业并购交易面临的反垄断审查日益严格,包括微软、Meta 和谷歌在内的多家科技巨头,纷纷与初创企业达成授权协议:无需直接收购即可吸纳顶尖人才和核心资产。
交易完成后,尽管失去了大部分领导团队,Groq 仍表示 “将继续作为独立公司运营”,该公司首席财务官 Simon Edwards 将接替 Ross 担任首席执行官。
Groq 成立于 2016 年,专注于研发可加速 AI “推理” 的芯片。所谓 “推理”,即通过 OpenAI 的 ChatGPT 或谷歌的 Gemini 等聊天机器人,向用户的查询返回响应的过程。这家初创企业最近一次估值为 69 亿美元(2024 年 9 月),当时其完成了 7.5 亿美元的融资。
身为创始人的 Ross,在离职创办 Groq 之前,曾助力谷歌启动 AI 张量处理单元(TPU)芯片项目。TPU 被广泛视为谷歌 AI 技术库中引以为傲的重要资产,帮助其 Gemini 聊天机器人追赶 OpenAI 的 ChatGPT,后者在很大程度上依赖英伟达的芯片。而如此传奇的人物,高中就辍学了,工作后再次去大学上课但后来又辍学了。
截至 2024 年 7 月,Groq 预计年末营收将达 5 亿美元。该公司通过名为 “Groq 云”(GroqCloud)的云平台提供芯片使用服务,该平台还包含开源 AI 模型库,以及搜索引擎等可供这些模型处理用户提示词的工具。
盯上 Groq 前,测了英特尔芯片无果
此次合作达成之际,英伟达的众多大型客户正纷纷研发自有 AI 处理器,或寻求其 GPU 的替代方案,包括采用谷歌的 TPU。据外媒上周报道称,亚马逊正洽谈向 OpenAI 投资超 100 亿美元,作为协议的一部分,这家 ChatGPT 开发商将更多使用这家电商巨头的 Trainium 系列 AI 芯片。
在此情况下,英伟达似乎正积极吸纳外部的先进技术。
对 Groq“反向人才收购”前,英伟达已对英特尔的 18A 工艺芯片进行了测试,但后续未继续推进。今年 9 月向英特尔投资 50 亿美元时,英伟达也并未承诺会采用英特尔的制造服务。据悉,英特尔代工部门正寻求突破,而实现这一目标的途径之一便是为其 18A、14A 等工艺芯片争取外部客户。此前有报道称,苹果、英伟达、AMD、高通等企业对此表现出浓厚兴趣;不过,每家无晶圆厂制造商都在观望该工艺的量产爬坡进度及英特尔内部的工艺采用情况。
英特尔的 14A 工艺节点正成为其代工业务的核心产品,目前研发进展活跃,计划于 2027 年推出。英特尔过去曾表示,预计下一代 14A 工艺节点将获得外部客户采用,该节点更贴合英伟达等客户的需求,即高性能计算(HPC)级别的性能。早期客户反馈显示,各方对其研发进展满意度较高,熟悉该节点的人士称其具备 “真正的竞争力”。
近日,有外媒采访了约 20 位相关人士,包括英特尔现任及前任员工、政府顾问以及陈立武(Lip-Bu Tan)的行业人脉。据悉,尽管陈立武的交易谈判能力在白宫及其他场合帮他取得了不错的成效,但其中部分人士仍质疑,他是否具备足够的技术洞察力,能够重振英特尔在芯片制造领域的地位,并制定出成功的 AI 战略。
三位了解英特尔内情的人士表示,陈立武的交易手腕对英特尔的帮助仅停留在一定层面。例如,他曾提议收购 SambaNova,这一想法在公司内部引发争议。原因是这家初创企业主打专用人工智能芯片,而当时市场更青睐通用型芯片。此外,这些人士指出,芯片制造行业所需的工程专业知识远超普通科技企业。该行业最成功的高管中,不少人(如英伟达的黄仁勋)均为电气工程师出身。部分华尔街分析师认为,陈立武是英特尔 CEO 的绝佳人选:他拥有数十年芯片行业经验,且有着为股东创造回报的良好业绩记录。
还有一位消息人士表示,陈立武致电了自己人脉网络中的顶尖高管,询问他们的运营方式。另有两位知情人士称,他还联系了亚马逊、谷歌等云服务巨头等大客户,了解他们的需求。
两位消息人士表示,陈立武绕开中层管理人员,直接让技术人才向自己汇报工作,并任命英特尔资深工程师 Pushkar Ranade 为首席幕僚长,于 12 月将其提拔为临时首席技术官。一位前英特尔员工透露,在评估英特尔风投部门的潜在交易时,陈立武还会征求自己投资公司的意见。
参考链接:
https://www.ft.com/content/3584197e-a99a-4a06-9386-dc65cf603f45







评论