9 月 13 日,2025 Inclusion・外滩大会「开源嘉年华」正在限量报名中! 了解详情
写点什么

Qwen 团队发布了 Qwen3-Coder,一个具有开放工具的大型智能体编码模型

作者:Robert Krzaczyński

  • 2025-07-28
    北京
  • 本文字数:909 字

    阅读完需:约 3 分钟

大小:454.61K时长:02:35
Qwen团队发布了Qwen3-Coder,一个具有开放工具的大型智能体编码模型

Qwen 团队宣布了Qwen3-Coder,这是一个新的智能体编码模型家族,专为长上下文、多步骤编程任务而设计。能力最强大的变体 Qwen3-Coder-480B-A35B-Instruct 是一个专家混合模型,总共有 480 亿个参数,每次前向传递有 35 亿个活跃参数。它原生支持 256K 个 token,并且通过上下文扩展支持最多支持 100 万个 token,旨在处理仓库规模的输入和扩展的工具交互。

 

与静态代码生成模型不同,Qwen3-Coder 强调执行和决策。该模型使用强化学习在广泛的现实世界任务上进行后训练,其中成功取决于生成的代码是否运行并解决问题。该方法被 Qwen 称之为“难求解,易验证”,旨在提高鲁棒性和实用性。

 

此外,该团队扩展了长视距智能体强化学习,训练模型在模拟环境中使用工具并响应多轮反馈。为了支持这一点,Qwen 部署了一个能够在云基础设施上运行 20,000 个并行环境的系统,从而能够在类似实际开发人员活动的工作流上进行规模化的代理训练。

 

为了支持实验,Qwen 发布了Qwen Code,这是一个从 Gemini CLI 分叉出来的开源命令行界面。它具有自定义的提示结构,并增强了对工具使用和函数调用的支持。该工具可以通过 npm 安装,并支持与 OpenAI 兼容的 API。

 

此外,Claude Code 用户可以通过代理或路由器配置选项,通过 DashScope 路由请求。这提供了一个熟悉的编码界面,同时能够在多模型设置中评估 Qwen3-Coder 的输出。

 

CLI 工具与 Cline、Node.js 和 Python 环境兼容,支持完整的环境变量和 API 支持。

 

Qwen3-Coder 目前可以通过 DashScope API 获得。中国大陆以外的开发人员可以使用国际端点,并且提供了快速集成的 Python 代码示例。预计很快会发布额外的模型尺寸,重点是在降低推理成本的同时保持性能。

 

一些 Reddit 用户指出,虽然本地部署是可能的,但高效运行更大的模型显然需要大量的基础设施:

 

除非你有正确的多 GPU 设置,否则 Qwen3-Coder 的本地使用并不会节省成本。当发布较小版本时,运行才可能会降低费用。根据你的工作负载需求,平衡 GPU 成本与云或托管解决方案可能提供更好的方法。动力和维护也是关键因素。

 

未来的工作包括扩展 Qwen 编码智能体的能力,并探索自我完善的机制,其中智能体可以在最少的人类监督下,跨任务迭代提高性能。

 

原文链接:

https://www.infoq.com/news/2025/07/qwen3-coder/

2025-07-28 17:004408

评论

发布
暂无评论

数据分析如何解决商业问题?这里有份超详细攻略

博文视点Broadview

通过14个入门实战案例教大家快速学习Python编程语言

小院里的霍大侠

Python Python初学者 程序员‘ 编程入门 兴趣编程

web前端技术前景如何?

小谷哥

阿里P8熬了一个月肝出这份32W字Java面试手册,在Github标星31K+

程序员啊叶

Java 编程 程序员 架构 java面试

es6 class 继承的重点

掘金安东尼

JavaScript 前端 ES6 7月月更

深入理解MySQL主从复制原理以及集群部署过程

jiangxl

MySQL 数据库 运维 dba 签约计划第三季

学习Java开发技术建议

小谷哥

面试官常问:如何手撸一个“消息队列”和“延迟消息队列”?

程序员啊叶

Java 编程 程序员 架构 java面试

Go语言系列:如何搭建Go语言开发环境?

小黑豆豆

后端 安装 教程 Go 语言 签约计划第三季

Java——AOP案例之测量业务层接口执行效率

王小凡

Java 程序员 apo

以科技传递温度,vivo亮相数字中国建设峰会

极客天地

学习Typescript(一)

bo

前端 ts 7月月更

Snowflake vs. Databricks谁更胜一筹?2022年最新战报

雨果

数据中台 数据平台 snowflake DaaS数据即服务 Databricks

字节前端面试题总结

buchila11

前端面试

《数字经济 科技向善》大咖对谈干货来啦

易观分析

金融科技

责任链模式在转转精准估价中的应用

转转技术团队

设计模式 责任链

语音直播系统——开发推送通知需要遵守的原则

开源直播系统源码

如何使用TDengine Sink Connector?

TDengine

tdengine Kafk

续上,Python爬虫在 fiddler 中调用本地 JS 代码文件

梦想橡皮擦

Python 爬虫 7月月更

OpenAtom OpenHarmony分论坛,今天14:00见!附大事记精彩发布

OpenHarmony开发者

OpenHarmony

YonBuilder赋能创新,用友第四届开发者大赛“金键盘奖”开启竞逐!

科技热闻

在web前端培训机构应该如何学习前端

小谷哥

Redis总结:缓存雪崩、缓存击穿、缓存穿透与缓存预热、缓存降级

程序员啊叶

Java 编程 程序员 架构 java面试

华硕无双,这可能是屏幕最好的平价高刷轻薄笔记本

科技热闻

什么是私域流量?

源字节1号

软件开发

尚硅谷Elasticsearch8.X视频教程

小谷哥

WEB服务如何平滑的上下线

转转技术团队

nginx Java web

Java 多商户外贸版 PC 端功能,出场就是这么硬核!

CRMEB

程序员培训学习后好找工作吗

小谷哥

腾讯云联合中国工联院发布工业AI质检标准化研究成果加速制造业智能化转型

科技热闻

Seata 在蚂蚁国际银行业务的落地实践

SOFAStack

开源项目 seata 项目实践 多编程语言 蚂蚁国际

Qwen团队发布了Qwen3-Coder,一个具有开放工具的大型智能体编码模型_AI&大模型_InfoQ精选文章