如何 0 成本启动全员 AI 技能提升?戳> 了解详情
写点什么

Claude Sonnet 4 上下文窗口扩展至 100 万个 Token

作者:Robert Krzaczyński

  • 2025-08-27
    北京
  • 本文字数:928 字

    阅读完需:约 3 分钟

大小:447.13K时长:02:32
Claude Sonnet 4上下文窗口扩展至100万个Token

Anthropic 已将 Claude Sonnet 4 的上下文长度提升至最多 100 万个词元,相比之前增加了五倍。目前,该功能处于公开测试阶段,用户可以通过 Anthropic API 和 Amazon Bedrock 使用,预计不久后将支持 Google Cloud 的 Vertex AI。


扩展后的上下文窗口让用户能够在单次请求中提交更大的数据集。对于开发者来说,这意味着他们可以加载整个代码库——数万个文件,包括测试和文档——同时保持跨文件的感知能力。对于研究人员来说,它能够在不丢失引用的情况下,对数十篇长篇文档(如学术论文或法律合同)进行综合分析。


Anthropic 表示,这一变化对于构建需要跨数百次工具调用和多步骤工作流的上下文感知智能体来说特别有价值。在实际应用中,这使得开发者能够在长时间的会话中提供完整的 API 文档、配置文件和系统历史记录,同时保持交互的连贯性。


从技术角度来看,更大的窗口降低了重复检索或重新嵌入内容的需求,使得持续数天的任务变得更加可行。不过它们也增加了计算负载,如果不加以仔细管理,可能会导致答案变得不够聚焦。一些开发者认为,只是扩展上下文是不够的。


一位 Hacker News 用户 aliljet 指出

能够将整个代码库塞进上下文窗口确实很棒,但如果不去评估 Sonnet 是否能够保持专注,就很难判断这是否真的有价值。


另一位评论者补充道

一个包含一切的上下文窗口会让保持专注变得更加困难。用户必须通过提出恰当的问题,才能更好地理解和把握代码库的精髓。


另一个担忧来自实际应用情况。在 Reddit 上,一位用户分享了他的观点:

我几乎没看到有人去测试它,因为成本实在太高了。Anthropic 的计算成本可能是整个 AI 行业中最高的。


还有人持有更为务实的态度

虽然它很贵,但有这个选项仍然是好事。大多数人会继续采用一直以来的管理上下文的策略,但我相信,在某些特定情况(或者对于一些不差钱的人来说),使用更大的上下文是值得的。


目前,100 万个词元的上下文窗口仅对拥有高级访问权限的 Anthropic 客户开放,预计在未来几周内将进行更广泛的推广。尽管此次升级显著提升了 Claude 在单次处理中能够处理的范围,但开发者对于仅靠规模就能解决上下文管理的实际挑战仍存在分歧。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


原文链接:

https://www.infoq.com/news/2025/08/claude-sonnet-4/

2025-08-27 11:012698

评论

发布
暂无评论

如何在敏捷开发中实现更好的需求管理

易成研发中心

需求管理 需求管理工具

商业开源的最佳起步实践 PPT 分享中|QCon・北京站圆满落幕

Greptime 格睿科技

数据库 AI 云原生 活动

hyperf-alarm-clock,一个自动计算代码执行时间,超时并发送通知的小工具

左诗右码

数智绩效合并报表:全球化合并实现财报精准高效

用友智能财务

科技 财务 企业数智化 财务软件

长上下文语言模型评估体系探析

Baihai IDP

程序员 AI LLMs 长上下文语言模型

KWDB v2.1.0 发版说明

KWDB数据库

时序数据库 查询优化 分布式架构 DataX 数据查询

和鲸科技创始人&CEO范向伟出席首届工业智算产业发展研讨会,共话 AI 创新与产业化落地

ModelWhale

人工智能 大数据 AI R语言

【稳定性】上线三板斧(可灰度、可验证、可回滚)

京东科技开发者

用户指南 | 快速迁移 InfluxDB v2 数据至 GreptimeDB

Greptime 格睿科技

数据库 云原生 数据存储 数据迁移

实录速递 | 和鲸ModelWhale助力医学Datathon跨学科协同,共筑数据科学与临床研究标准化新路径

ModelWhale

Python 人工智能 数据库 R语言 临床医学

人工智能与人类合作:未来工作模式的新探索

天津汇柏科技有限公司

AI人工智能

保障管理系统(源码+文档+部署+讲解)

深圳亥时科技

某充电桩业务服务内存监控和程序行为分析

乘云数字DataBuff

运维 内存监控

华为阅读启动“乘国航 阅世界”国航伴读计划,3重好礼免费领!

最新动态

华为视频多平台聚合,热门IP《白夜破晓》《珠帘玉幕》任你追

最新动态

模拟器快速上手,助力HarmonyOS应用/服务高效开发

白晓明

HarmonyOS 模拟器 HarmonyOS NEXT

【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit(6)

HarmonyOS SDK

HarmonyOS

能源能耗分析平台(源码+文档+部署+讲解)

深圳亥时科技

为什么说逻辑数据编织是一种低门槛、高容错度、高 ROI 的数据集成与开发模式?

Aloudata

数据仓库 数据开发 数据集成 数据虚拟化 数据编织

强化学习在众包差异化定价中的探索

京东科技开发者

释放数据生产力——数据编织的价值实现与评估

Aloudata

数据分析 数据开发 数据集成 数据虚拟化 数据编织

【论文速读】| 人工智能驱动的网络威胁情报自动化

云起无垠

国内外十大开源快速开发平台推荐

NocoBase

开源 低代码 快速开发 无代码

NocoBase 本周更新汇总:优化 REST API 数据源插件

NocoBase

开源 低代码 插件 无代码 版本更新

《京东金融APP的鸿蒙之旅系列专题》鸿蒙新特性篇:Hello, 仓颉 World

京东科技开发者

《一文讲透》第4-3期:KWDB 数据库运维 —— 安全与审计(上)

KWDB数据库

时序数据库 数据库运维 审计 数据库安全 多模数据库

可观测场景如何使用 Vector Remap 优化日志数据的解析与存储

Greptime 格睿科技

云原生 日志 vector 可观测 database

和鲸气象联合解决方案闪耀亮相第29届联合国气候变化大会(COP29)

ModelWhale

人工智能 AI R 语言 气候 COP29

Claude Sonnet 4上下文窗口扩展至100万个Token_AI&大模型_InfoQ精选文章