写点什么

Claude Sonnet 4 支持百万 Tokens 上下文:容量提升 5 倍,支持 7.5 万行代码一键处理

  • 2025-08-14
    北京
  • 本文字数:658 字

    阅读完需:约 2 分钟

大小:342.40K时长:01:56
Claude Sonnet 4 支持百万 Tokens 上下文:容量提升 5 倍,支持7.5万行代码一键处理

Anthropic 宣布,Claude Sonnet 4 现已支持 100 万 tokens 上下文长度,将此前 20 万 tokens 的上限直接提升 5 倍。这使得你可以通过一次请求处理超过 7.5 万行代码的完整代码库,或多篇科研论文。


 

对于开发者而言,这一升级是 Claude Code 的“猛兽级”增强,能够通过 API 一次性处理海量代码库或文档,不再需要繁琐的内容拆分与分批上传,甚至有可能用它来重构整个应用。

 

Anthropic 表示,基于这个上下文长度,开发者可以用 Claude 来进行大规模代码分析,比如一次性加载完整代码库,涵盖源代码、测试文件和文档,从而识别项目架构与跨文件依赖,提供整体优化建议。


 

值得注意的是,20 万 tokens 上下文窗口曾被视为 Claude Sonnet 的“致命弱点”,而如今这一短板终于补齐。目前,该功能仅向 Tier 4 用户(即 API 消费累计达到 400 美元以上的账户)开放。根据官方文档,要启用 100 万 tokens 上下文窗口,开发者需要在 API 请求中添加 context-1m-2025-08-07 beta 标头。

 

更有意思的是,这次更新也是 Anthropic 首次根据上下文长度分级定价:

  • ≤ 200K tokens:输入 $3 / 百万 tokens,输出 $15 / 百万 tokens

  • > 200K tokens:输入 $6 / 百万 tokens,输出 $22.50 / 百万 tokens

 

事实上,在此之前,Gemini 和 OpenAI 已率先推出百万 token 级模型。其中,Gemini 早已实施类似分级,Gemini 2.5 Pro 在 200K 以下的价格为 $1.25 / $10,以上则为 $2.50 / $15。从实际效果来看,有用户表示,Sonnet 4 相较于 Gemini 2.5 Pro,响应更快、表达更简洁,同时对细节把握更到位,非常适合用作 AI 代理,缺点就是价格太贵。



2025-08-14 10:085031

评论

发布
暂无评论

深度拆解UI智能设计:如何用D2C设计稿转代码,实现产设研一体化

职场工具箱

AI 产品经理 产品设计 ui设计 设计稿转代码

观安信息新一代政务数据共享交换平台

极客天地

Golang基础笔记十四之文件操作

Hunter熊

golang 后端 文件写入 文件读取

BOE(京东方)携手生态伙伴推出公益微电影 见证“照亮成长路”十年科技赋能教育之路

爱极客侠

bsfgo 一个轻量级的go web框架

车江毅

90%企业误解的低代码真相,已经不单纯了

秃头小帅oi

唯一中资厂商!腾讯云连续三年入选 Gartner® CPaaS 魔力象限“挑战者”,AI 实践与国际化布局成效显著

极客天地

MyEMS能源管理系统后台配置-空间管理

开源能源管理系统

开源 能源管理系统

NineData新增SQL Server到MySQL复制链路,高效助力异构数据库迁移

NineData

MySQL 数据库迁移 数据复制 NineData SQL Server

Promtail 对接日志最佳实践

观测云

日志分析

李沐团队开源音频模型 Higgs Audio V2,基于千万小时数据训练;生数科技发布长时文生音频系统 FreeAudio丨日报

声网

BOE(京东方)携多领域商显解决方案亮相InfoComm Asia 2025 “科技+绿色”引领万物互联新时代

爱极客侠

零踩坑!Figma组件库无损迁移全流程图解(2025版)

职场工具箱

效率工具 产品经理 产品设计 figma ui设计

2025年4月补丁星期二安全更新全景

qife122

网络安全 漏洞修复

代码智能化在互联网大厂的规模化落地实践

思码逸研发效能

人工智能 研发效能 智能代码 研发效能管理 AI 编程

6 款支持角色权限控制(RBAC)的开发工具对比与应用场景解析

NocoBase

开源 权限管理 rbac 身份管理 角色管理

快手DHPS:国内首个实现基于RDMA 通信的可负载均衡高性能服务架构!

快手技术

高性能 服务架构 快手 RDMA技术

JNPF组织权限,让企业权限体系更清晰高效​

引迈信息

亚太企业AI应用现状---- 理想丰满、现实骨感

财见

拯救重复劳动:无代码实现 Markdown 图&表抽取

数由科技

人工智能 markdown 数据科学 ETL 无代码

开源鸿蒙走进地方开源生态建设交流会:政企办公应用落地牵引开源创新

最新动态

发布即颠覆?实测smardaten 2.0 :当 AI 遇上无代码软件开发,真的能重新定义 “对话即开发”

程序员洲洲

客户为纲,万目皆张——中烟创新致烟草客户的一封信

中烟创新

2025年6月补丁星期二:微软修复67个漏洞,包含2个零日漏洞

qife122

漏洞管理 Windows安全

抖音集团基于Flink的亿级RPS实时计算优化实践

Apache Flink

大数据 flink 实时计算 实时处理

多语种AI舆情监测的关键技术与挑战

沃观Wovision

NLP 大模型 海外舆情 AI 大模型 沃观Wovision 舆情监测系统

焱融科技携手信通院、青云科技启动“AI推理高性能存储技术推进计划”

焱融科技

人工智能 大模型推理 焱融存储 KVCache

《开源鸿蒙共建地图4.0》发布 加速构建面向万物互联的操作系统能力

最新动态

Claude Sonnet 4 支持百万 Tokens 上下文:容量提升 5 倍,支持7.5万行代码一键处理_生成式 AI_Tina_InfoQ精选文章