硬核干货——《中小企业 AI 实战指南》免费下载! 了解详情
写点什么

Anthropic 公布 Claude 性能问题根源:三大基础设施漏洞

作者:Renato Losio

  • 2025-10-08
    北京
  • 本文字数:1154 字

    阅读完需:约 4 分钟

大小:565.04K时长:03:12
Anthropic 公布 Claude 性能问题根源:三大基础设施漏洞

Anthropic 近日发布故障报告,揭示近期 Claude 模型输出质量间歇性下降的根源在于三个独立的基础设施漏洞。Anthropic 表示目前已解决所有问题,且在改进内部流程以防类似事件发生。此事也引发社区对三大硬件平台服务运行难点的关注。

 

2025 年 8 月至 9 月初,Claude AI 用户陆续反馈模型响应质量下降或表现不稳定。最初看似普通的性能波动,实际并非由大流量或高需求引发,而是被追溯至三个分别影响底层基础设施、路由逻辑和编译流程的独立基础设施漏洞。团队解释称:

我们从未因流量、时段或负载而降低模型质量。用户反馈的问题完全源于基础设施漏洞(..……)每个漏洞在不同平台以不同频率引发不同问题,导致其线索错综复杂。

 

团队披露的三重故障包括:上下文窗口路由错误,导致 8 月 31 日的峰值时段影响了 16% 的 Sonnet 4 请求;由于 Claude API 的 TPU 服务器配置错误,在令牌生成过程中触发了故障,导致输出内容损坏,影响了 8 月 25 日至 28 日期间对 Opus 4.1 和 Opus 4 的请求,以及 8 月 25 日至 9 月 2 日期间对 Sonnet 4 的请求;最后,因为编译器中的一个潜在缺陷所导致的近似 top-k XLA:TPU 错误编译问题,影响了针对 Claude Haiku 3.5 的请求,持续时间近两周。Anthropic 补充道:

我们将 Claude 部署在 AWS Trainium、英伟达 GPU 和谷歌 TPU 三大硬件平台。各硬件平台特性迥异且需专门优化,尽管如此,我们的模型实现严格遵循统一等效的标准。

 


来源:Anthropic 博客 blog

 

Anthropic 的可靠性负责人 Todd Underwood 在领英上回应了这些问题

这个夏天我们在可靠性方面表现不佳。早在这些问题出现之前,七八月就已持续出现容量与可靠性故障(..……)我对此深表歉意,团队正全力提供兼具高质量与高可用的最佳模型。

 

OpenAI 技术团队成员 Clive Chan 评论

机器学习基础设施运维难度极高,向参与问题定位与报告撰写的同仁致敬。

 

Anthropic 致力于让所有硬件平台都对用户透明化,确保无论什么平台的请求都能获得同等质量响应,其硬件复杂度意味着每次基础设施变更都需全平台验证。Google DeepMind 高级 AI 开发者关系工程师 Philipp Schmid 指出

大规模模型服务本已困难,在三大硬件平台(AWS Trainium、英伟达 GPU、谷歌 TPU)上维持严格等效更是难上加难。令人质疑硬件灵活性是否值得以开发速度和用户体验为代价。

 

Hacker News 用户 Mike Hearn 分析:

最值得注意的是单元测试的明显缺失。针对 XLA 编译漏洞的测试仅打印了结果,这更像是一个复现案例,而不是那种由测试框架执行、并且会跟踪覆盖率的单元测试。而后续的改进措施,也仅仅是更激进地依赖评估手段。

 

这家 AI 公司承诺将推行更灵敏的评估机制,在更多环节加入质量检验,并开发新工具在保护隐私前提下高效分析社区反馈。


原文链接:

https://www.infoq.com/news/2025/10/anthropic-infrastructure-bugs/

2025-10-08 14:264

评论

发布
暂无评论

深入理解vue2.x双向数据绑定原理

不叫猫先生

Vue vue响应式 三周年连更

产品质量管理利器,华为云发布CodeArts Defect缺陷管理服务

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

iOS MachineLearning 系列(9)—— 人物蒙版图生成

珲少

Selenium操作已经打开的浏览器

IT蜗壳-Tango

三周年连更

大数据集群的部署实例

TiAmo

大数据 集群 三周年连更 开发实例

【Linux】之Jumpserver堡垒机的部署_搭建

A-刘晨阳

Linux 跳板机 三周年连更

AI新时代拐点:人工智能当红炸子鸡Chatgpt

AI探险家小新

人工智能 程序员 创作 工作 ChatGPT

Bitmap引起的OOM问题

芯动大师

App 三周年连更 Out Of Memory

《一文带你读懂:云原生时代业务监控》

后台技术汇

三周年连更

【直播回顾】3月银行APP用户体验评测+中国金融业财富管理AI应用分析

易观分析

金融 银行

使用 Vue.js 和 JavaScript 在 Web 应用程序中下载 PDF 文件

海拥(haiyong.site)

三周年连更

基于STM32+华为云设计的智慧烟感系统

DS小龙哥

三周年连更

Qz学算法-数据结构篇(非线性结构、树)

浅辄

数据结构 三周年连更

OpenHarmony驱动子系统开发—GPIO

鸿蒙之旅

OpenHarmony 三周年连更

干货|SpringBoot JMS(ActiveMQ)API实践应用详解

浅羽技术

Apache 中间件 ​ActiveMQ 消息列队 三周年连更

一键生成rpc网关服务项目代码,让你轻松实现跨语言、跨平台的服务调用

vison

微服务 Go 语言 gin 代码自动生成 rpc gateway

Git 速查表:初学者必备的 12 个 Git 命令

Se7en

多维评测指标解读2022MSU世界编码器大赛结果

阿里云CloudImagine

云计算 编码 编码器 视频云 MSU

程序员失业:现实还是幻想?| 社区征文

断墨寻径

人工智能 三周年征文

大流量时代,如何规划系统流量提升可靠性

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 4 月 PK 榜

vivo 推送系统的容灾建设与实践

vivo互联网技术

容灾 推送系统

探秘!第四代北斗芯片

江湖老铁

招商证券与易观千帆达成合作,持续深耕数字化金融

易观分析

金融 证券

Marior去除边距和迭代内容矫正用于自然文档矫正

合合技术团队

人工智能 OCR 识别

2023移动端技术探索

轻口味

android 移动端 行业趋势 三周年连更

《详谈·张勇》

石云升

读书笔记 三周年连更

从软件哲学角度谈 Amazon SageMaker

亚马逊云科技 (Amazon Web Services)

Amazon SageMaker

什么是软件开发领域的 disruptive innovation

汪子熙

软件工程 软件开发 三周年连更

sdn网络

乌龟哥哥

三周年连更

【Python实战】Python采集图书信息

BROKEN

三周年连更

Spring Boot之根据数据库连接信息指定分页查询表结构信息

bug菌

Spring Boot 2 spring-boot 三周年连更

Anthropic 公布 Claude 性能问题根源:三大基础设施漏洞_AI&大模型_InfoQ精选文章