写点什么

阿里 Qwen3-Coder 携 1M 上下文杀来!5 分钟生成网站,开发者狂欢:Claude Code 可以卸载了

  • 2025-07-24
    北京
  • 本文字数:2648 字

    阅读完需:约 9 分钟

阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了

7 月 23 日,阿里正式发布了其“迄今为止最具代理能力的代码模型” Qwen3-Coder。


Qwen3-Coder 有多个版本,其中 Qwen3-Coder-480B-A35B-Instruct 是一个有 480B 参数、35B 激活参数的 MoE 模型,原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。据悉,该模型支持 358 种编程语言,在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美。



与此同时,阿里还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。Qwen Code 是一个 CLI 工具,修改自 Gemini CLI,针对 Qwen3‑Coder 系列的模型增强了解析器和工具支持。据悉,Qwen Code 基于 Gemini Code 进行二次开发,但团队进行了 prompt 和工具调用协议适配,以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。另外,Qwen3-Coder 还可以和社区优秀的编程工具结合,如 Claude Code、Cline 等。


据介绍,借助 Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需 5 分钟。


目前,Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源,全球开发者都可以免费下载使用。截至发稿前,该模型已在 Github 上获得 5.1k stars。此外,Qwen3-Coder 很快将接入阿里的 AI 编程产品通义灵码,API 也已上线阿里云百炼。


相关地址:

https://github.com/QwenLM/Qwen3-Coder

https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

Qwen3-Coder 训练过程

预训练


据悉,这次团队从不同角度进行 Scaling,以提升 Qwen3-Coder 的代码能力:


  • 数据扩展:总计 7.5T(代码占比 70%),在保持通用与数学能力的同时,具备卓越的编程能力;

  • 上下文扩展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,专为仓库级和动态数据(如 Pull Request)优化;

  • 合成数据扩展:利用 Qwen2.5-Coder 对低质数据进行清洗与重写,来显著提升整体数据质量。

后训练


团队在更丰富的真实代码任务上进行了扩展 Code RL 训练。与当前社区普遍聚焦于竞赛类代码生成不同,团队认为所有的代码任务天然适合执行驱动的大规模强化学习。通过自动扩展测试样例,团队构造了大量高质量的训练实例,不仅显著提升了代码执行成功率,还对其他任务带来增益。



在真实世界的 Software Engneering Task,比如 SWE-Bench,模型需要在环境中不断交互,自主规划、选择工具调用、接受反馈不断做出新决策,这是一个典型的 Long-Horizon RL 任务。


团队在 Qwen3-Coder 的后训练阶段执行了 Agent RL,鼓励模型通过多轮交互的方式利用工具解决问题。据介绍,Agent RL 的主要挑战在于 Environment Scaling,团队实现了可验证环境的扩展系统,借助阿里云的基础设施,实现同时运行 20k 独立环境。这一套基础设施可以提供大规模的强化学习反馈和评测,最终我们在 SWE-bench Verified 上实现了开源模型 SOTA 的效果。

效果如何?


Qwen3-Coder 是社区期待已久的大模型之一。4 月底时候就有人提出,希望确保 Qwen3coder 使用最新 / 更新的高质量代码进行训练,尤其是针对系统编程语言的代码。还有开发者表示,希望 Qwen3-coder 能在 C 和 C++ 领域有更多涉猎。“现在的 AI 模型都针对 Web 和桌面开发进行了优化。但我们今天使用的很多技术仍然嵌入在智能设备中,而且由于对传统硬件组件的依赖,大多数公司无法切换到 Rust。”


Qwen3-Coder 发布后开发者们表现出了很大的热情。



SnapEdit 联合创始人兼首席执行官 Oscar Le 发推称,“Qwen 从来没有让我失望过。现在大家不用再每月花 200 美元购买 Claude Code 了。”



苹果研究员 Yufan Zhuang 也称赞 Qwen 正在推动开源人工智能研究。



Qwen3-Coder 是千问系列模型中首个采用混合专家 MoE 架构的代码模型。在浏览器调用(WebArena)、工具调用(BFCL)等 Agent 能力评测中,Qwen3-Coder 刷新开源模型纪录,超越 GPT4.1;在考察模型自主规划解决编程任务的 SWE-Bench 评测中,Qwen3-Coder 取得了开源最佳效果,媲美 Claude4。


据介绍,Qwen3-Coder 具备出色的 Agent 能力,尤为擅长解决多步骤的长任务,它能通观全局自主安排工作内容,支持 Agent 调用各种工具深入钻研,最终解决复杂编程任务。官方实测数据显示,在执行任务时,Qwen3-Coder 能够调用的工具数量比 Claude 多几倍,效果非常出色。


Qwen3-Coder 能帮助程序员完成基础的编程任务,比如写代码、补全代码、修 Bug 等,编程工作效率大幅提升,代码测试、查询生成等工作从人工编写的数小时骤降至数分钟。同时,Qwen3-Coder 也极大降低了普通人入门编程的门槛,比如一句话就能生成精妙复杂的 3D 物理模拟过程:


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    Qwen Chat Web Dev:

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      用一句名言测试你的 WPM:

      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        旋转超立方体中的弹跳球:

        00:00 / 00:00
          1.0x
          • 3.0x
          • 2.5x
          • 2.0x
          • 1.5x
          • 1.25x
          • 1.0x
          • 0.75x
          • 0.5x
          网页全屏
          全屏
          00:00


          太阳系模拟:

          00:00 / 00:00
            1.0x
            • 3.0x
            • 2.5x
            • 2.0x
            • 1.5x
            • 1.25x
            • 1.0x
            • 0.75x
            • 0.5x
            网页全屏
            全屏
            00:00


            DUET 游戏:

            00:00 / 00:00
              1.0x
              • 3.0x
              • 2.5x
              • 2.0x
              • 1.5x
              • 1.25x
              • 1.0x
              • 0.75x
              • 0.5x
              网页全屏
              全屏
              00:00


              “我测试了该基准测试的几个示例。默认基准测试使用的提示只要求回答问题。这意味着推理模型凭借其较长的 COT(参见 QwQ)具有巨大的优势。但当我更改提示词,要求模型逐步推理并考虑所有细微的上下文时,更新后的 Qwen3 235B 表现明显更好。”有开发者反馈道。


              还有做了测试的开发者表示“速度快得离谱”。不过,也有开发者遇到了一些问题:“我尝试让它进行一些基本操作,如用 MCP 工具读取一些文件,但即使我详细解释了如何操作,它还是失败了。”


              另外,有开发者找到了阿里云百炼上的价格:



              附:在 Claude Code 使用 Qwen3‑Coder 的方法


              官方给出了 Qwen3‑Coder 与 Claude Code 搭配使用的具体方法,具体提供了两种接入方式。


              方案 1:使用 dashscope 提供的代理  API


              只需要将 Anthropic 的 base url 替换成 dashscope 上提供的 endpoint 即可。


              export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxyexport ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey
              复制代码


              至此,可以直接输入 claude 开始使用 Qwen3-Coder & Claude Code


              方案 2:使用 claude-code-config 自定义路由


              claude-code-router 是一个第三方的路由工具,用于为 Claude Code 灵活地切换不同的后端 API。dashscope 平台提供了一个简单的扩展包 claude-code-config,可为 claude-code-router 生成包含 dashscope 支持的默认配置。


              npm install -g @musistudio/claude-code-routernpm install -g @dashscope-js/claude-code-config
              复制代码


              生成配置文件和插件目录:


              ccr-dashscope
              复制代码


              该命令会自动生成 ccr 所需的配置文件和插件目录。你也可以手动调整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/ 中的配置。最后,通过 ccr 开始使用 Claude Code:


              ccr code
              复制代码


              2025-07-24 09:447803

              评论

              发布
              暂无评论

              房地产行业具体怎么定义呢?需要堡垒机吗?

              行云管家

              网络安全 数据安全 堡垒机 房地产

              “AI+Security”系列第2期(三):面向LLM(大语言模型)的漏洞挖掘与对齐防御研究

              云起无垠

              脱敏效率提升70%!城商行:嘉为蓝鲸日志中心助力保障数据安全与合规

              嘉为蓝鲸

              运维 日志 日志管理 银行业

              AI驱动的商品企划软件 零售企业市场致胜的智能化利器

              第七在线

              万亿城商行如何借助 TiDB 构建面向未来的金融核心系统

              TiDB 社区干货传送门

              实践案例

              从 MySQL 迁移到 TiDB:使用 SQL-Replay 工具进行真实线上流量回放测试 SOP

              TiDB 社区干货传送门

              全球化浪潮下的数据库革新:嘉里物流 TiDB 实践价值的设想

              TiDB 社区干货传送门

              从供应商深度绑定,到走向真正的云原生,他们是这样做的

              阿里巴巴云原生

              阿里云 云原生 云效

              从供应商深度绑定,到走向真正的云原生,他们是这样做的

              阿里云云效

              阿里云 云原生 云效

              如何快速查看 Mac 的温度?

              Rose

              PS画画工具推荐:让画面一键发光的 PS 插件如何使用

              Rose

              HTAP 数据库在国有大行反洗钱场景的应用

              TiDB 社区干货传送门

              2024福州等保测评机构名单大汇总

              行云管家

              等保 等保测评 福州

              华为云低代码AstroZero技巧教学1:表格的超链接赋能

              低代码 华为云

              新增姿态估计标注,以及模型应用优化|ModelWhale 版本更新

              ModelWhale

              鉴权 模型应用 模型服务

              数业智能心大陆 AI解答如何应对焦虑

              心大陆多智能体

              智能体 焦虑 AI大模型 心理健康 数字心理

              TCL 实业 x TiDB丨从分销转向零售,如何考虑中台建设和数据库选型?

              TiDB 社区干货传送门

              TiKV存储节点计划内外停机,如何去处理?

              TiDB 社区干货传送门

              故障排查/诊断 TiKV 底层架构 7.x 实践

              Lightroom Classic教程:修复画笔(污点去除)工具的使用

              Rose

              Lightroom Classic教程 lr修复画笔工具

              【灾备应急管理】《2023年金融机构业务连续性管理能力建设调研报告》解读

              嘉为蓝鲸

              灾备建设 金融业 业务连续性

              AirServer 7 mac激活版:macOS专业的投屏工具

              Rose

              AirServer 7 mac激活版 mac投屏软件 airserver投屏

              更强模型、更低价格、更易落地,豆包大模型日均tokens使用量超5,000 亿,落地实践再进阶

              新消费日报

              企业该怎么适应数字化转型?

              优秀

              数字化转型

              photoshop 运行弹窗This non-genuine Adobe app has been disabled 详细的解决方法

              Rose

              Apache RocketMQ 中文社区全新升级!

              阿里巴巴云原生

              阿里云 云原生 Apache RocketMQ

              Final Cut Pro教程:fcpx跟踪功能如何添加马赛克?

              Rose

              智谱AI与和鲸科技签署战略合作协议,共拓大模型产业应用与人才培养新未来

              ModelWhale

              人工智能 大模型 ChatGLM

              sync-diff-inspector比对表结构,索引

              TiDB 社区干货传送门

              谈一谈数据虚拟化的技术核心和应用架构

              Aloudata

              RP Data Fabric 逻辑数据编织

              阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了_AI&大模型_褚杏娟_InfoQ精选文章