Agentic AI、具身智能、强化学习框架、端侧大模型……来QCon上海站,感受AI的未来! 了解详情
写点什么

Qwen 团队发布了 Qwen3-Coder,一个具有开放工具的大型智能体编码模型

作者:Robert Krzaczyński

  • 2025-07-28
    北京
  • 本文字数:909 字

    阅读完需:约 3 分钟

大小:454.61K时长:02:35
Qwen团队发布了Qwen3-Coder,一个具有开放工具的大型智能体编码模型

Qwen 团队宣布了Qwen3-Coder,这是一个新的智能体编码模型家族,专为长上下文、多步骤编程任务而设计。能力最强大的变体 Qwen3-Coder-480B-A35B-Instruct 是一个专家混合模型,总共有 480 亿个参数,每次前向传递有 35 亿个活跃参数。它原生支持 256K 个 token,并且通过上下文扩展支持最多支持 100 万个 token,旨在处理仓库规模的输入和扩展的工具交互。

 

与静态代码生成模型不同,Qwen3-Coder 强调执行和决策。该模型使用强化学习在广泛的现实世界任务上进行后训练,其中成功取决于生成的代码是否运行并解决问题。该方法被 Qwen 称之为“难求解,易验证”,旨在提高鲁棒性和实用性。

 

此外,该团队扩展了长视距智能体强化学习,训练模型在模拟环境中使用工具并响应多轮反馈。为了支持这一点,Qwen 部署了一个能够在云基础设施上运行 20,000 个并行环境的系统,从而能够在类似实际开发人员活动的工作流上进行规模化的代理训练。

 

为了支持实验,Qwen 发布了Qwen Code,这是一个从 Gemini CLI 分叉出来的开源命令行界面。它具有自定义的提示结构,并增强了对工具使用和函数调用的支持。该工具可以通过 npm 安装,并支持与 OpenAI 兼容的 API。

 

此外,Claude Code 用户可以通过代理或路由器配置选项,通过 DashScope 路由请求。这提供了一个熟悉的编码界面,同时能够在多模型设置中评估 Qwen3-Coder 的输出。

 

CLI 工具与 Cline、Node.js 和 Python 环境兼容,支持完整的环境变量和 API 支持。

 

Qwen3-Coder 目前可以通过 DashScope API 获得。中国大陆以外的开发人员可以使用国际端点,并且提供了快速集成的 Python 代码示例。预计很快会发布额外的模型尺寸,重点是在降低推理成本的同时保持性能。

 

一些 Reddit 用户指出,虽然本地部署是可能的,但高效运行更大的模型显然需要大量的基础设施:

 

除非你有正确的多 GPU 设置,否则 Qwen3-Coder 的本地使用并不会节省成本。当发布较小版本时,运行才可能会降低费用。根据你的工作负载需求,平衡 GPU 成本与云或托管解决方案可能提供更好的方法。动力和维护也是关键因素。

 

未来的工作包括扩展 Qwen 编码智能体的能力,并探索自我完善的机制,其中智能体可以在最少的人类监督下,跨任务迭代提高性能。

 

原文链接:

https://www.infoq.com/news/2025/07/qwen3-coder/

2025-07-28 17:004561

评论

发布
暂无评论

DDIA 读书笔记(3)数据编码与演化

莫黎

架构师训练营第 2 周学习总结

菜青虫

极客大学架构师训练营

架构训练营-week6-学习总结-技术选型(二)

于成龙

架构训练营

Mac常见问题解决方案与使用技巧

jiangling500

Mac

二、ood原则

Geek_28b526

CAP 原理

黄立

CAP

钻石与小度:智能语音助手背后的“马斯洛需求模型”

脑极体

三分钟带你分清Mysql 和Oracle之间的误区

华为云开发者联盟

MySQL 数据库 oracle 安全 关系型数据库

使用抓包工具fiddler和apipost进行接口测试

测试人生路

测试工具 fiddler

第2周 框架设计-作业

SuGeek

架构师训练营第 2 周课后练习

菜青虫

极客大学架构师训练营

深入浅出System.gc() 源码解读

AI乔治

Java 架构

作业一:

丁乐洪

第六周 Doris临时故障时序图

Geek_fabd84

架构师训练营第 1 期第 6 周作业

owl

极客大学架构师训练营

架构师训练营第 1 期 week6 总结

张建亮

极客大学架构师训练营

写时复制集合 —— CopyOnWriteArrayList

程序员小航

Java 源码 并发 源码阅读 JUC

前端组件化

韩向民

第二周-作业

ray-arch

极客大学架构师训练营

软考资料学习库

玄兴梦影

架构师训练营第 1 期 week6

张建亮

极客大学架构师训练营

架构师训练营第六周作业

我是谁

极客大学架构师训练营

jdk 源码系列之HashMap

sinsy

源码 jdk HashMap底层原理

Mysql中,这21个写SQL的好习惯,你值得拥有呀

捡田螺的小男孩

MySQL sql SQL优化 sql习惯

cglib 入门前篇

Rayjun

Java cglib

成为架构师 - 架构师训练营第 02 周

陈永龙Vincent

架构训练营第二周学习小结

李日盛

阿里内部首发Spring Cloud全套微服务架构笔记,速拿去怼面试官!

Java架构追梦

Java 编程 面试 微服务 SpringCloud

架构训练营-week6-作业

于成龙

CAP 架构训练营

新手初学Java性能之 垃圾收集器

Java架构师迁哥

最实用的无线PORTAL测试案例

测试 无线网络 网络

Qwen团队发布了Qwen3-Coder,一个具有开放工具的大型智能体编码模型_AI&大模型_InfoQ精选文章