2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Claude Sonnet 4 上下文窗口扩展至 100 万个 Token

作者:Robert Krzaczyński

  • 2025-08-27
    北京
  • 本文字数:928 字

    阅读完需:约 3 分钟

大小:447.13K时长:02:32
Claude Sonnet 4上下文窗口扩展至100万个Token

Anthropic 已将 Claude Sonnet 4 的上下文长度提升至最多 100 万个词元,相比之前增加了五倍。目前,该功能处于公开测试阶段,用户可以通过 Anthropic API 和 Amazon Bedrock 使用,预计不久后将支持 Google Cloud 的 Vertex AI。


扩展后的上下文窗口让用户能够在单次请求中提交更大的数据集。对于开发者来说,这意味着他们可以加载整个代码库——数万个文件,包括测试和文档——同时保持跨文件的感知能力。对于研究人员来说,它能够在不丢失引用的情况下,对数十篇长篇文档(如学术论文或法律合同)进行综合分析。


Anthropic 表示,这一变化对于构建需要跨数百次工具调用和多步骤工作流的上下文感知智能体来说特别有价值。在实际应用中,这使得开发者能够在长时间的会话中提供完整的 API 文档、配置文件和系统历史记录,同时保持交互的连贯性。


从技术角度来看,更大的窗口降低了重复检索或重新嵌入内容的需求,使得持续数天的任务变得更加可行。不过它们也增加了计算负载,如果不加以仔细管理,可能会导致答案变得不够聚焦。一些开发者认为,只是扩展上下文是不够的。


一位 Hacker News 用户 aliljet 指出

能够将整个代码库塞进上下文窗口确实很棒,但如果不去评估 Sonnet 是否能够保持专注,就很难判断这是否真的有价值。


另一位评论者补充道

一个包含一切的上下文窗口会让保持专注变得更加困难。用户必须通过提出恰当的问题,才能更好地理解和把握代码库的精髓。


另一个担忧来自实际应用情况。在 Reddit 上,一位用户分享了他的观点:

我几乎没看到有人去测试它,因为成本实在太高了。Anthropic 的计算成本可能是整个 AI 行业中最高的。


还有人持有更为务实的态度

虽然它很贵,但有这个选项仍然是好事。大多数人会继续采用一直以来的管理上下文的策略,但我相信,在某些特定情况(或者对于一些不差钱的人来说),使用更大的上下文是值得的。


目前,100 万个词元的上下文窗口仅对拥有高级访问权限的 Anthropic 客户开放,预计在未来几周内将进行更广泛的推广。尽管此次升级显著提升了 Claude 在单次处理中能够处理的范围,但开发者对于仅靠规模就能解决上下文管理的实际挑战仍存在分歧。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


原文链接:

https://www.infoq.com/news/2025/08/claude-sonnet-4/

2025-08-27 11:012902

评论

发布
暂无评论

智源发布三款BGE新模型,再次刷新向量检索最佳水平

智源研究院

硅纪元视角 | 6秒生成4张图,Getty Images和英伟达联合推出文生图AI模型

硅纪元

InPlant SCADA笔记 工程属性中的经典模式

万里无云万里天

工厂运维 InPlant SCADA

(代购系统神器)深入解析1688平台API:商品图片与详情描述的获取之道

代码忍者

API 文档 API 测试 API 设计

螺旋文字滚动特效源码解析

南城FE

CSS 前端 动画

macOS Monterey 12.7.6 (21H1320) 正式版发布,ISO、IPSW、PKG 下载

sysin

macos ISO ventura

【YashanDB知识库】自动选举配置错误引发的一系列问题

YashanDB

yashandb 崖山数据库 崖山DB

AI技术修复奥运珍贵历史影像,《永不失色的她》再现百年奥运女性光彩

阿里云CloudImagine

云计算 音视频 AI技术 视频云 奥运会

再获奖项,亚信安慧AntDB数据库被评为“2023-2024国产数据库创新赋能优秀产品”

亚信AntDB数据库

一枚与时间赛跑的中国芯片

脑极体

AI

【YashanDB知识库】账号被锁,如何分析具体原因

YashanDB

yashandb 崖山数据库 崖山DB

wamp配置多目录访问方法

tbapi

wamp

大咖公开课 | 大模型场景讲解以及测试方法

测试人

软件测试

新版HAP应用市场即将推出,诚邀意向开发者提前入驻,抢占先机

明道云

利用人工智能ChatGPT自动生成基于PO的数据驱动测试框架

测试人

软件测试

【Hbase】运维问题汇总

扬_帆_起_航

穿越流程管理的丛林!Prothentic学院「流程管理培训」第1期圆满落幕

望繁信科技

业务流程管理 望繁信科技 流程管理培训 陈果George Prothentic学院

InPlant SCADA笔记 二次确认

万里无云万里天

工厂运维 InPlant SCADA

InPlant SCADA笔记 工程管理的工程属性与全局设置

万里无云万里天

工厂运维 InPlant SCADA

面向物联网的 NGINX Plus:对 MQTT 流量进行加密和身份验证

NGINX开源社区

负载均衡 开源 物联网 IoT mqtt

【YashanDB知识库】ycm纳管主机安装YCM-AGENT时报错“任务提交失败,无法连接主机”

YashanDB

yashandb 崖山数据库 崖山DB

闲鱼开发者必读:如何利用闲鱼商品列表数据接口进行数据分析

tbapi

闲鱼API 闲鱼商品列表接口 闲鱼商品列表数据接口 闲鱼商品列表数据采集

InPlant SCADA笔记 工程管理界面的五种风格

万里无云万里天

工厂运维 InPlant SCADA

在 Go 中如何使用反射实现简易版 encoding/json

江湖十年

Go json 后端

macOS Ventura 13.6.8 (22G820) 正式版发布,ISO、IPSW、PKG 下载

sysin

macos ISO ventura

Claude Sonnet 4上下文窗口扩展至100万个Token_AI&大模型_InfoQ精选文章