写点什么

黄仁勋 200 亿美金“招安”高中辍学生!英伟达挖空 Groq TPU 核心人才,逼财务官上位 CEO,英特尔 18A 遭弃

  • 2025-12-25
    北京
  • 本文字数:2776 字

    阅读完需:约 9 分钟

大小:1.31M时长:07:37
黄仁勋200亿美金“招安”高中辍学生!英伟达挖空Groq TPU核心人才,逼财务官上位CEO,英特尔18A遭弃

整理 | 华卫

 

昨夜,AI 芯片初创企业 Groq 宣布,英伟达将以非独家授权的形式获得其技术授权。作为一项技术授权协议的一部分,创办 Groq 的前谷歌芯片工程师 Jonathan Ross 以及该初创企业的总裁 Sunny Madra 等多名 Groq 核心员工将加入英伟达。

 

Groq 投资方 Disruptive Technology Advisers 的首席执行官 Alex Davis 透露,该交易价值 200 亿美元,较该初创企业 2024 年 9 月的估值高出 131 亿美元。

 

挖角核心人才还不够,收走 Groq 最强 “推理技术” 

“我们计划将 Groq 的低延迟处理器整合到英伟达 AI 工厂架构中,扩展该平台以服务更广泛的 AI 推理及实时工作负载。” 英伟达首席执行官黄仁勋(Jensen Huang)在发给员工的邮件中表示,与 Groq 的合作将 “拓展” 围绕英伟达芯片搭建的数据中心的能力,他将这类数据中心称为 “AI 工厂”。

 

此前,Groq 一度挑战英伟达在 AI 处理器领域的主导地位。这次,Groq 称,其与英伟达的协议 “体现了双方共同的关注点,扩大高性能、低成本推理技术的普及范围”。

 

两家公司表示,技术授权涵盖 Groq 的 “推理技术”,推测指其旗舰产品 “语言处理单元”(LPU)推理芯片。Groq 声称,其 LPU 的能效比英伟达及其主要竞争对手 AMD 生产的 GPU 高出 10 倍。该语言处理单元运行推理工作负载时,速度是 GPU 的 10 倍、能耗却只有其十分之一。据介绍,这款芯片的高效能源于其 “确定性设计”(deterministic design):即能高度精准地控制计算时序。相比之下,标准的 “非确定性芯片”(nondeterministic chips)常出现意外处理延迟,导致计算完成顺序错乱。

 

LPU 还通过其他方式优化 AI 性能,其内置数百兆字节的片上静态随机存取存储器(SRAM,这是目前市场上速度最快的内存类型。该内存池的性能优于显卡所采用的高带宽内存(HBM),且耗电量更低。Groq 通过自主研发的 “实时扩展”(RealScale)互联技术,将搭载 LPU 的服务器连接成推理集群。

 

该公司表示,这项技术解决了一个名为 “晶体漂移”(crystal-based drift)的技术难题,该难题此前一直阻碍着 AI 服务器的协同工作。处理器通过时钟控制电路执行计算的频率,这类时钟通常由微型石英晶体实现。“晶体漂移” 是指时钟频率意外变慢的现象,会导致 AI 推理流程效率下降。Groq 称,“实时扩展”(RealScale)技术可自动调整处理器时钟,以缓解这一问题。

 

留守班底“不倒”,财务官接棒出任 CEO

“反垄断似乎是此次交易的主要风险,不过将交易结构设计为非独家授权,或许能维持竞争的表面假象,” Bernstein Research 分析师 Stacy Rasgon 在关于英伟达与 Groq 交易的客户报告中表示。近年来,科技行业并购交易面临的反垄断审查日益严格,包括微软、Meta 和谷歌在内的多家科技巨头,纷纷与初创企业达成授权协议:无需直接收购即可吸纳顶尖人才和核心资产。

 

交易完成后,尽管失去了大部分领导团队,Groq 仍表示 “将继续作为独立公司运营”,该公司首席财务官 Simon Edwards 将接替 Ross 担任首席执行官。

 

Groq 成立于 2016 年,专注于研发可加速 AI “推理” 的芯片。所谓 “推理”,即通过 OpenAI 的 ChatGPT 或谷歌的 Gemini 等聊天机器人,向用户的查询返回响应的过程。这家初创企业最近一次估值为 69 亿美元(2024 年 9 月),当时其完成了 7.5 亿美元的融资。

 

身为创始人的 Ross,在离职创办 Groq 之前,曾助力谷歌启动 AI 张量处理单元(TPU)芯片项目。TPU 被广泛视为谷歌 AI 技术库中引以为傲的重要资产,帮助其 Gemini 聊天机器人追赶 OpenAI 的 ChatGPT,后者在很大程度上依赖英伟达的芯片。而如此传奇的人物,高中就辍学了,工作后再次去大学上课但后来又辍学了。

 

截至 2024 年 7 月,Groq 预计年末营收将达 5 亿美元。该公司通过名为 “Groq 云”(GroqCloud)的云平台提供芯片使用服务,该平台还包含开源 AI 模型库,以及搜索引擎等可供这些模型处理用户提示词的工具。

 

盯上 Groq 前,测了英特尔芯片无果

 

此次合作达成之际,英伟达的众多大型客户正纷纷研发自有 AI 处理器,或寻求其 GPU 的替代方案,包括采用谷歌的 TPU。据外媒上周报道称,亚马逊正洽谈向 OpenAI 投资超 100 亿美元,作为协议的一部分,这家 ChatGPT 开发商将更多使用这家电商巨头的 Trainium 系列 AI 芯片。

 

在此情况下,英伟达似乎正积极吸纳外部的先进技术。

 

对 Groq“反向人才收购”前,英伟达已对英特尔的 18A 工艺芯片进行了测试,但后续未继续推进。今年 9 月向英特尔投资 50 亿美元时,英伟达也并未承诺会采用英特尔的制造服务。据悉,英特尔代工部门正寻求突破,而实现这一目标的途径之一便是为其 18A、14A 等工艺芯片争取外部客户。此前有报道称,苹果、英伟达、AMD、高通等企业对此表现出浓厚兴趣;不过,每家无晶圆厂制造商都在观望该工艺的量产爬坡进度及英特尔内部的工艺采用情况。

 

英特尔的 14A 工艺节点正成为其代工业务的核心产品,目前研发进展活跃,计划于 2027 年推出。英特尔过去曾表示,预计下一代 14A 工艺节点将获得外部客户采用,该节点更贴合英伟达等客户的需求,即高性能计算(HPC)级别的性能。早期客户反馈显示,各方对其研发进展满意度较高,熟悉该节点的人士称其具备 “真正的竞争力”。

 

近日,有外媒采访了约 20 位相关人士,包括英特尔现任及前任员工、政府顾问以及陈立武(Lip-Bu Tan)的行业人脉。据悉,尽管陈立武的交易谈判能力在白宫及其他场合帮他取得了不错的成效,但其中部分人士仍质疑,他是否具备足够的技术洞察力,能够重振英特尔在芯片制造领域的地位,并制定出成功的 AI 战略。

 

三位了解英特尔内情的人士表示,陈立武的交易手腕对英特尔的帮助仅停留在一定层面。例如,他曾提议收购 SambaNova,这一想法在公司内部引发争议。原因是这家初创企业主打专用人工智能芯片,而当时市场更青睐通用型芯片。此外,这些人士指出,芯片制造行业所需的工程专业知识远超普通科技企业。该行业最成功的高管中,不少人(如英伟达的黄仁勋)均为电气工程师出身。部分华尔街分析师认为,陈立武是英特尔 CEO 的绝佳人选:他拥有数十年芯片行业经验,且有着为股东创造回报的良好业绩记录。

 

还有一位消息人士表示,陈立武致电了自己人脉网络中的顶尖高管,询问他们的运营方式。另有两位知情人士称,他还联系了亚马逊、谷歌等云服务巨头等大客户,了解他们的需求。

 

两位消息人士表示,陈立武绕开中层管理人员,直接让技术人才向自己汇报工作,并任命英特尔资深工程师 Pushkar Ranade 为首席幕僚长,于 12 月将其提拔为临时首席技术官。一位前英特尔员工透露,在评估英特尔风投部门的潜在交易时,陈立武还会征求自己投资公司的意见。

 

参考链接:

https://www.ft.com/content/3584197e-a99a-4a06-9386-dc65cf603f45

https://siliconangle.com/2025/12/24/nvidia-license-technology-inference-chip-startup-groq-reported-20b-deal/

https://www.reuters.com/world/us/how-silicon-valley-dealmaker-charmed-trump-gave-intel-lifeline-2025-12-24/

2025-12-25 16:435
用户头像
华卫 InfoQ 内容编辑

发布了 375 篇内容, 共 272.2 次阅读, 收获喜欢 155 次。

关注

评论

发布
暂无评论

半年涨粉1000万!揭秘快意大模型在短视频互动场景中的大规模应用实践!

快手技术

短视频 机器人 #大模型

音乐弹幕?智能修音?回森K歌社区的创新玩法?(上)

快手技术

商业模式 创新 玩法

基于串口通信的电子相册设计

芯动大师

Python COF 智能屏

全球厂商之最,华为17篇论文入选国际数据库顶会ICDE

华为云开发者联盟

华为云 华为云GaussDB 华为云开发者联盟 华为云GeminiDB 企业号2024年5月PK榜

鸿蒙4.2小版本大亮点,鸿蒙5.0也不远了

FinFish

鸿蒙应用开发 小程序容器技术 鸿蒙Next 鸿蒙5.0 鸿蒙SDK

GitHub天花板!清华大佬纯手码的《python背记手册》火了!

我再BUG界嘎嘎乱杀

Python 后端 软件开发 入门 零基础

快手工程架构治理大揭秘:告别崩溃,提效神器来袭!

快手技术

架构 架构治理

加速规模化应用,火山引擎升级金融大模型服务体系

新消费日报

开源啦,Redis跨集群实时数据同步工具

golang 数据库 微服务、 redis 底层原理

Dubbo 全链路监控技术实践

乘云数字DataBuff

dubbo 全链路监控

提升医疗服务质量的基石:全面解析医疗数据治理

郑州埃文科技

数据治理

DashVector + ModelScope 玩转多模态检索

DashVector

数据库 AI 向量检索 大模型

用数据,简单点!奇点云2024 StartDT Day数智科技大会,直播见

奇点云

发布会 奇点云 数据云 分析云

Win10-VMware安装CentOS7.5

vinci321

centos win10 vmware 虚拟机

大厂程序员的一天,沉浸式体验Baidu Comate代码助手如何用于面试、代码评审……

申屠鹏会

大模型 Baidu Comate comate

云原生多云多集群Karmada|2024开源之夏8项课题邀您共创

华为云开发者联盟

Kubernetes 云原生 华为云 华为云开发者联盟 企业号2024年5月PK榜

为什么要迈进NGAIOps(下一代AIOps)

乘云数字DataBuff

AIOPS NGAIOps

DashVector x 通义千问大模型:打造基于专属知识的问答服务

DashVector

数据库 后端 向量检索 大模型

零成本开发!试试这6个免费的API接口平台

幂简集成

API 免费API接口 免费API 免费API接口平台

AAAI 2024 | 基于由粗到细的视觉表征实现的高效匹配且兼顾性能的跨模态检索

快手技术

快手闪耀VALSE2024:揭秘视频生成技术,展示文生图大模型

快手技术

学术会议 学术论文

IntelliJ IDEA集成Baidu Comate,商城系统支付交易功能开发实战

阿Q说代码

百度 智能推荐 comate 代码助手 智能编码

伙伴活动|W3C 标准带头人开讲 WebGPU 前沿趋势

RTE开发者社区

AWS Elastic Beanstalk 监控可观测最佳实践

观测云

APM AWS

黄仁勋200亿美金“招安”高中辍学生!英伟达挖空Groq TPU核心人才,逼财务官上位CEO,英特尔18A遭弃_AI&大模型_华卫_InfoQ精选文章