写点什么

Claude Sonnet 4 上下文窗口扩展至 100 万个 Token

作者:Robert Krzaczyński

  • 2025-08-27
    北京
  • 本文字数:928 字

    阅读完需:约 3 分钟

大小:447.13K时长:02:32
Claude Sonnet 4上下文窗口扩展至100万个Token

Anthropic 已将 Claude Sonnet 4 的上下文长度提升至最多 100 万个词元,相比之前增加了五倍。目前,该功能处于公开测试阶段,用户可以通过 Anthropic API 和 Amazon Bedrock 使用,预计不久后将支持 Google Cloud 的 Vertex AI。


扩展后的上下文窗口让用户能够在单次请求中提交更大的数据集。对于开发者来说,这意味着他们可以加载整个代码库——数万个文件,包括测试和文档——同时保持跨文件的感知能力。对于研究人员来说,它能够在不丢失引用的情况下,对数十篇长篇文档(如学术论文或法律合同)进行综合分析。


Anthropic 表示,这一变化对于构建需要跨数百次工具调用和多步骤工作流的上下文感知智能体来说特别有价值。在实际应用中,这使得开发者能够在长时间的会话中提供完整的 API 文档、配置文件和系统历史记录,同时保持交互的连贯性。


从技术角度来看,更大的窗口降低了重复检索或重新嵌入内容的需求,使得持续数天的任务变得更加可行。不过它们也增加了计算负载,如果不加以仔细管理,可能会导致答案变得不够聚焦。一些开发者认为,只是扩展上下文是不够的。


一位 Hacker News 用户 aliljet 指出

能够将整个代码库塞进上下文窗口确实很棒,但如果不去评估 Sonnet 是否能够保持专注,就很难判断这是否真的有价值。


另一位评论者补充道

一个包含一切的上下文窗口会让保持专注变得更加困难。用户必须通过提出恰当的问题,才能更好地理解和把握代码库的精髓。


另一个担忧来自实际应用情况。在 Reddit 上,一位用户分享了他的观点:

我几乎没看到有人去测试它,因为成本实在太高了。Anthropic 的计算成本可能是整个 AI 行业中最高的。


还有人持有更为务实的态度

虽然它很贵,但有这个选项仍然是好事。大多数人会继续采用一直以来的管理上下文的策略,但我相信,在某些特定情况(或者对于一些不差钱的人来说),使用更大的上下文是值得的。


目前,100 万个词元的上下文窗口仅对拥有高级访问权限的 Anthropic 客户开放,预计在未来几周内将进行更广泛的推广。尽管此次升级显著提升了 Claude 在单次处理中能够处理的范围,但开发者对于仅靠规模就能解决上下文管理的实际挑战仍存在分歧。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


原文链接:

https://www.infoq.com/news/2025/08/claude-sonnet-4/

2025-08-27 11:011

评论

发布
暂无评论

极光笔记丨Spark SQL 在极光的建设实践

极光GPTBots-极光推送

大数据 spark 计算引擎

“神算子”上线!EasyDL时序预测模型零门槛轻松上手

百度开发者中心

百度飞桨

如何获取所有安装的应用程序信息

Changing Lin

11月日更

内在可解释模型之RuleFit

索信达控股

机器学习 算法 模型

Apache APISIX 扩展指南

API7.ai 技术团队

Apache 插件 API网关 Apache APISIX

技术干货|开源项目-FlyFish使用攻略

云智慧AIOps社区

开源 大前端 低代码 数据可视化 大屏

恒源云(GPUSHARE)_Child Tuning: 反向传播版的Dropout

恒源云

深度学习

初识Java反射概念和使用

CRMEB

百度人脸活体检测系统通过信通院“护脸计划”首批优秀级安全防护能力评估

百度开发者中心

安全 人脸识别 百度安全

行云管家荣登36kr企服点评云计算软件排行榜NO.1

行云管家

云计算 软件 排行榜 IT运维

11.11上云嘉年华,华为云数据库助力客户备战业务高峰

华为云数据库小助手

GaussDB GaussDB(for openGauss) GaussDB ( for Redis ) 华为云数据库

原来我才是内卷王,闭关3个月肝完Java 7大核心知识,成功斩获字节58万Offer。

Java高级开发

字节跳动 java; 字节跳动面经

IOS技术分享| WebRTC iOS源码下载&编译

anyRTC开发者

ios 音视频 WebRTC 实时通信 视频直播

什么是DISA STIG?概述+STIG安全

旋极智能

入职字节跳动那一天,我哭了(蘑菇街被裁,奋战7个月拿下offer)

Java MySQL redis 程序员 算法

墨天轮国产数据库沙龙 | 黄新著:金仓数据库全生命周期管控

墨天轮

国产数据库 KingBase 人大金仓

低代码是什么意思?

低代码小观

程序员 低代码 开发工具 开发平台 企业开发系统

为什么那么多人在用WGCLOUD

王逅逅

zabbix 监控系统 linux运维 运维系统

一文,动态规划入门

bigsai

算法 动态规划

真香!180页100+题15W+字解析的《Java高级面试指南》,果断收下

Java 程序员 架构 分布式 算法

个人信息保护法生效,企业数据安全合规正当时

行云管家

信息安全 数据安全 企业安全 网络保护

《Linux一学就会》:第二章:Linux基本命令操作和文件管理

侠盗安全

Linux 运维 linux运维 云计算架构师

腾讯安全李滨:腾讯云数据安全与隐私保护探索与实践

腾讯安全云鼎实验室

数据安全 云安全

推动产业创新,腾讯的底层逻辑是什么?

ToB行业头条

JavaIO流核心模块与基本原理

Java nio IO流 字符流 字节流

springboot集成阿里云短信

小鲍侃java

11月日更

让脂肪起内讧?从内部全面瓦解脂肪

脑极体

业务数据清洗,落地实现方案

数据 数据清洗 数据管理 数据服务 业务数据

300行ABAP代码实现一个最简单的区块链原型

汪子熙

区块链 SAP abap 11月日更

OceanBase 源码解读(六):存储引擎详解

OceanBase 数据库

数据库 开发者 高性能 资源隔离 租户

白码低代码/无代码开发平台功能及作用

低代码小观

低代码 开发工具 开发平台 无代码 企业服务

Claude Sonnet 4上下文窗口扩展至100万个Token_AI&大模型_InfoQ精选文章