写点什么

马斯克 22 万张 GPU 救场后,Claude 勉强恢复“三个月前体验”,Gary Marcus 却警告:GPU 将严重过剩,很快不值钱

  • 2026-05-07
    北京
  • 本文字数:4604 字

    阅读完需:约 15 分钟

Anthropic 时不时限制用户使用速率的问题终于迎来一次大的改善。

当地时间 5 月 6 日,Anthropic 宣布,将使用马斯克旗下 SpaceX 的计算资源。根据协议,Anthropic 将使用 SpaceX 位于田纳西州孟菲斯的 Colossus 1 设施的全部算力。该设施拥有超过 22 万块 Nvidia GPU,并将在一个月内为 Anthropic 提供 300 兆瓦的新容量。这将直接提升 Claude Pro 和 Claude Max 订阅用户可获得的服务能力。

在 SpaceX 交易以及近期其他类似协议带来的额外容量支持下,Anthropic 表示,将 Claude Code 在 Pro、Max、Team 以及按席位计费的 Enterprise 计划中的五小时速率限制提高一倍;取消 Pro 和 Max 账户 Claude Code 的高峰时段额度削减限制;同时将大幅提高 Claude Opus 模型的 API 速率限制。

据悉,官方在活动上表示,Anthropic 平台的 API 交易量同比增长 17 倍。

Anthropic 联合创始人兼 CCO Tom Brown 发推表示,未来几天,公司会逐步在 Colossus 上提升 Claude 的推理能力。

“很高兴能在这件事上与 SpaceX 合作。为了跟上 AI 需求,我们需要调动大量现实世界中的'原子',而在快速调动原子这件事上,不管是在地球上,还是离开地球,都没人比他们更擅长。”Brown 说道。

Anthropic 明确表示有兴趣与 SpaceX 合作开发多个吉瓦级(GW)的太空轨道数据中心。这是马斯克的关键目标之一,也是 SpaceX 首次公开募股背后的重要推动因素,因为这一项目预计将高度依赖资本投入,并且面临巨大技术挑战。

“认真的公司甚至已经开始讨论太空中的计算容量,这件事本身就说明,市场正在多么激进地寻找电力和扩大规模。”数据中心运营商 Flexential CEO Ryan Mallory 说道。

在接受 CNBC 采访时,Claude Code 负责人 Boris Cherny 说道,“我们的增长是爆炸性的,已经超出了我们所有的预估。在 Anthropic,我们非常重视以负责任的方式管理容量、管理我们构建一切所依赖的资源。负责任,对我们来说不是一句口号,而是我们看待这份工作的方式。所以,当客户有一定需求时,我们就需要相应的算力来满足这些需求。现在需求已经爆发了,因此我们接入了更多算力,后面还会有更多算力上线,这样我们才能跟上需求。”

在内部算力分配问题上,Boris 表示,长期来看,会有一部分算力用于产品,一部分算力用于研究。“这就是整体上的平衡。最重要的是,从长期看,这个平衡要非常健康。我们既不能买一大堆用不上的算力,也不能买得太少。所以核心就是保持平衡,让它处在健康状态。”

今天,英伟达也不忘送上祝贺,并表示,“人工智能的未来依赖于 NVIDIA。”

此外,这项合作也加入了 Anthropic 此前宣布的一系列重要算力进展:

  • 与 Amazon 达成最高 5 吉瓦的协议,其中包括到 2026 年底新增近 1 吉瓦容量;

  • 与 Google 和 Broadcom 达成 5 吉瓦协议,该容量将从 2027 年开始陆续上线;

  • 与 Microsoft 和 NVIDIA 建立战略合作,其中包括 300 亿美元的 Azure 容量;

  • 通过 Fluidstack 在美国 AI 基础设施上投资 500 亿美元。

“我们在多种 AI 硬件上训练并运行 Claude,包括 AWS Trainium、Google TPU 和 NVIDIA GPU,并将继续探索让更多容量上线的机会。”Anthropic 官方表示。

“这太疯狂了。”Henry Intelligent Machines PBC 创始人兼首席执行官、Buddy 创始人 Alex Finn 直接评价道。

“过去几个月,Anthropic 一直有点哑火。使用上限不断下调,Claude Code 被从 Pro 计划里拿掉,模型感觉也变笨了。Elon 这次等于是把他们救了出来,给了他们使用全球最大超级计算集群的权限。”Finn 表示,“Anthropic 的算力紧缺,一直是整个公司的阿喀琉斯之踵。用户口碑也因此大幅下滑。Elon 用一笔交易就解决了这个问题。”

“我真的希望,这意味着 Anthropic 长期默默下调限额、沟通糟糕的阶段终于结束。巅峰时期的 Claude Code,是真的传奇。”Finn 说出了众多用户的希望。

不过,有网友指出,这次提高限额后,其实也只是回到了 3 个月前的水平。

xAI 解散,马斯克对 Anthropic 态度反转

这笔交易显然为正准备 IPO 的 SpaceX 带来了一位重量级客户,有助于其向投资者展示自己的 AI 雄心。马斯克在 X 上也简单阐述了双方达成合作的一些情况。

上周我花了很多时间和 Anthropic 团队的高层成员交流,想了解他们具体做了哪些事,来确保 Claude 对人类是有益的。交流之后,我的印象不错。

我见到的每个人都非常能干,也都非常在意做正确的事。没有一个人触发我的‘邪恶探测器’。只要他们持续进行严格的自我审视,Claude 大概率会是好的。

在那之后,我就同意把 Colossus 1 租给 Anthropic 了,因为 SpaceXAI 当时已经把训练迁移到了 Colossus 2。

这与马斯克今年 2 月的说法形成鲜明对比。当时,他指责 Anthropic 的 AI 存在偏见。“坦率地说,我认为你们无论做什么,都无法逃脱这样一种不可避免的讽刺:Anthropic 最终会变成厌恶人类的。”

显然,大家也没有忘记马斯克当时的发言:

“对 SpaceX 来说,这招确实高明。他们把原本为了一个无底洞而打造的资产(Grok)变成了 IPO 前的重要收入来源。”网友 brokencode 评价道。

不过,有网友认为这对 Anthropic 来说是“羞耻”。

“在我看来,这次合并显然是为了悄悄关闭 xAI,同时又能让投资者满意。此外,它还被用来将 Twitter 的债务转嫁给公众,看来他的会计师团队确实很厉害。”网友 cedws 评价。

事实上,马斯克确实几乎同时宣布,xAI 将不再作为一家独立公司存在,而是会被并入 SpaceXAI,也就是 SpaceX 旗下的 AI 产品线。

“只要在外界意识到 xAI 显然正在变成一家数据中心公司、而不是一家 AI 公司之前完成这件事,它就仍然是 SpaceX 用来抬高 IPO 估值的一项资产。”有网友评价。

对于这次合作,Jamin Ball 为马斯克粗略算了一笔账:

假设 Colossus 1 有 22 万块 GPU,其中包括 15 万块 H100、5 万块 H200、2 万块 GB200,定价是 H100 每小时 2.30 美元、H200 每小时 2.60 美元、GB200 每小时 5 美元,整个集群的混合租赁价格是每小时 2.60 美元。

假设这些都是 take-or-pay 类型的交易,也就是不管你实际用不用,都按 24 小时 × 365 天付费。这意味着,xAI 每年大约能获得 50 亿美元收入。

我们有了一个新的 neo cloud!

除此之外,Jamin Ball 引用了 Dario 在最近一期 Dwarkesh 播客里做的一些关于单位经济模型的粗略计算。Dario 提到,可以假设有 1000 亿美元的算力支出,这笔支出会在训练和推理之间发生结构性分配:如果太偏向训练,就无法产生足够收入;如果太偏向推理,又会削弱未来研发进展。假设在算力支出上,训练和推理各占 50%,推理业务有一定毛利率而且高于 50%。这意味着,稳定状态下,你会得到一定规模的收入。比如说,每年算力成本 1000 亿美元,其中每年 500 亿美元的算力用于推理,可以支撑 1500 亿美元收入,另外 500 亿美元用于训练。

Jamin Ball 把这个逻辑带回 xAI 这笔交易后称,Anthropic 能把这笔算力转化为每年 150 亿美元收入,对应 60% 到 70% 的毛利率。“双赢!!”他得出结论。

纽约大学学者 Gary Marcus 则发表观点称,把 30 兆瓦算力租给 Anthropic,这等于变相承认了 xAI 距离 AGI 并没有那么近,尽管马斯克去年曾暗示过相反的情况。此外这进一步证明,单纯扩大规模并不能让你通向 AGI。

Marcus 还指出,如果 xAI 最后只是变成又一家云计算公司,而这个市场又越来越拥挤,那么 SpaceX 的投资者很可能买贵了。

“xAI 竟然有足够多的过剩算力,可以卖给一个大型竞争对手,这件事本身对超大规模云厂商来说不是好兆头。我们可能很快会进入一个供给超过需求、价格急剧下跌的世界。”Marcus 进而说道,“客户会是赢家,但是……Amazon、Google、Meta、Microsoft 和 Oracle 这样的公司都可能受到冲击,尤其考虑到它们为了建设云算力资源,已经对自身现金流造成了很大压力。”

Anthropic 发力争夺企业客户

Anthropic 周三在旧金山举办开发者日活动,并在活动上发布了 Claude AI 的一项新功能,名为“dreaming”。该功能旨在帮助其 AI 系统在不同会话之间通过回顾工作来学习,识别模式,并更新用于存储用户偏好和其他上下文信息的文件。“dreaming”功能目前作为研究预览版开放,并与其用于管理智能体的软件一起推出。

这一动作是 Anthropic 争夺企业客户努力的一部分。此前,Claude Code 人气暴涨,加剧了市场竞争,也促使 OpenAI 缩减部分工作,例如其 Sora 视频生成工具,以便将更多精力集中在快速增长的 AI 编程市场。

在活动上,Boris 展示了开发者如何设置“routines”(例程),让 Anthropic 的 AI 计算机程序员按计划执行操作。他表示,“默认状态不再是,‘我要去提示 Claude Code。’现在的默认状态是,‘我会让 Claude 去提示 Claude Code。’”

Cherny 强调了 AI 的生产力潜力。他说:“能力已经在这里了。剩下的差距,是我们能以多快的速度把它投入使用。”

而在采访中,Boris 也提到,企业想真正获得 AI 带来的生产力提升,不能只是把 AI 当作外挂工具,而必须围绕 AI 重构业务流程。

他引用了早期关于计算机生产力的案例:当年计算机已经出现,但企业并没有立刻看到明显效率提升,原因在于业务流程仍以旧的文件柜和人工流程为中心,计算机只是被放在角落里。只有当企业把计算机放到工作流中心,生产力红利才真正释放出来。

Boris 认为,今天 AI 面临类似阶段。对 Anthropic 来说,Claude 已经处在公司所有工作的中心;而最成熟的企业客户,也正在围绕 Claude 重构业务流程。这种提升不是几个百分点,而是数倍的生产力提升,而且提升速度还在继续加快。

谈到 AI 对软件行业的冲击时,Boris 承认,一些传统护城河正在消失,尤其是转换成本。因为 Claude 可以帮助用户写软件,也可以让用户从一个软件迁移到另一个软件变得更容易。不过,他并不认为所有旧护城河都会被摧毁。相反,很多传统护城河依然有效,只是所有事情都在加速,竞争节奏变得更快。

对于 Anthropic 是否想成为未来应用和客户关系的“前门”,Boris 表示,公司会从多个角度思考。一方面,Anthropic 确实希望在某些产品上直接拥有客户关系;另一方面,也希望保持开放和公平。

他强调,Anthropic 自己使用的工具栈也开放给开发者。例如 Claude Code 构建在 Claude Agent SDK 和 Anthropic API 之上,而这些能力都向全球开发者开放。Anthropic 已经看到大量开发者基于同一技术栈构建业务和创业公司。

在 Boris 看来,软件能力会像读写能力一样,成为现代社会的基础技能。普通人可以通过和 Claude 对话来生成软件,就像今天每个人都能写字一样。但这并不意味着专业开发者会消失。Boris 将其类比为写作:虽然每个人都会写字,但社会仍然需要专业作家。同样,未来每个人都能使用 AI 写代码,但仍然需要在软件构建上特别专业的人。

同时,他也强调,无论是工程师、产品经理还是设计师,公司仍然需要最好的人。AI 会改变工作方式,但不会让顶尖人才失去价值。相反,在一个所有工具都更强、所有节奏都更快的环境中,真正能理解问题、定义方向、构建产品的人仍然非常稀缺。

此外,对于即将毕业或仍在大学阶段的年轻人,Boris 给出了两点建议:

第一,学会使用这些工具。不要害怕 AI,也不要害怕智能体。应该主动靠近它们,尝试它们,理解它们如何适合自己的工作方式。

第二,如果有创业精神,现在就是创业的最好时机。Boris 认为,AI 正在开启一个创新黄金时代。今天已经有大量创新发生,接下来还会出现更多变化。他甚至判断,未来创业公司的数量可能会是今天的十倍,甚至一百倍。

参考链接:

https://www.anthropic.com/news/higher-limits-spacex

https://www.youtube.com/watch?v=kRgdkOw82F0