阿里云ODPS普惠算力再升级,Data+AI全产品降价低至59元! 了解详情
写点什么

阿里 Qwen3-Coder 携 1M 上下文杀来!5 分钟生成网站,开发者狂欢:Claude Code 可以卸载了

  • 2025-07-24
    北京
  • 本文字数:2648 字

    阅读完需:约 9 分钟

阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了

7 月 23 日,阿里正式发布了其“迄今为止最具代理能力的代码模型” Qwen3-Coder。


Qwen3-Coder 有多个版本,其中 Qwen3-Coder-480B-A35B-Instruct 是一个有 480B 参数、35B 激活参数的 MoE 模型,原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。据悉,该模型支持 358 种编程语言,在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美。



与此同时,阿里还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。Qwen Code 是一个 CLI 工具,修改自 Gemini CLI,针对 Qwen3‑Coder 系列的模型增强了解析器和工具支持。据悉,Qwen Code 基于 Gemini Code 进行二次开发,但团队进行了 prompt 和工具调用协议适配,以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。另外,Qwen3-Coder 还可以和社区优秀的编程工具结合,如 Claude Code、Cline 等。


据介绍,借助 Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需 5 分钟。


目前,Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源,全球开发者都可以免费下载使用。截至发稿前,该模型已在 Github 上获得 5.1k stars。此外,Qwen3-Coder 很快将接入阿里的 AI 编程产品通义灵码,API 也已上线阿里云百炼。


相关地址:

https://github.com/QwenLM/Qwen3-Coder

https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

Qwen3-Coder 训练过程

预训练


据悉,这次团队从不同角度进行 Scaling,以提升 Qwen3-Coder 的代码能力:


  • 数据扩展:总计 7.5T(代码占比 70%),在保持通用与数学能力的同时,具备卓越的编程能力;

  • 上下文扩展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,专为仓库级和动态数据(如 Pull Request)优化;

  • 合成数据扩展:利用 Qwen2.5-Coder 对低质数据进行清洗与重写,来显著提升整体数据质量。

后训练


团队在更丰富的真实代码任务上进行了扩展 Code RL 训练。与当前社区普遍聚焦于竞赛类代码生成不同,团队认为所有的代码任务天然适合执行驱动的大规模强化学习。通过自动扩展测试样例,团队构造了大量高质量的训练实例,不仅显著提升了代码执行成功率,还对其他任务带来增益。



在真实世界的 Software Engneering Task,比如 SWE-Bench,模型需要在环境中不断交互,自主规划、选择工具调用、接受反馈不断做出新决策,这是一个典型的 Long-Horizon RL 任务。


团队在 Qwen3-Coder 的后训练阶段执行了 Agent RL,鼓励模型通过多轮交互的方式利用工具解决问题。据介绍,Agent RL 的主要挑战在于 Environment Scaling,团队实现了可验证环境的扩展系统,借助阿里云的基础设施,实现同时运行 20k 独立环境。这一套基础设施可以提供大规模的强化学习反馈和评测,最终我们在 SWE-bench Verified 上实现了开源模型 SOTA 的效果。

效果如何?


Qwen3-Coder 是社区期待已久的大模型之一。4 月底时候就有人提出,希望确保 Qwen3coder 使用最新 / 更新的高质量代码进行训练,尤其是针对系统编程语言的代码。还有开发者表示,希望 Qwen3-coder 能在 C 和 C++ 领域有更多涉猎。“现在的 AI 模型都针对 Web 和桌面开发进行了优化。但我们今天使用的很多技术仍然嵌入在智能设备中,而且由于对传统硬件组件的依赖,大多数公司无法切换到 Rust。”


Qwen3-Coder 发布后开发者们表现出了很大的热情。



SnapEdit 联合创始人兼首席执行官 Oscar Le 发推称,“Qwen 从来没有让我失望过。现在大家不用再每月花 200 美元购买 Claude Code 了。”



苹果研究员 Yufan Zhuang 也称赞 Qwen 正在推动开源人工智能研究。



Qwen3-Coder 是千问系列模型中首个采用混合专家 MoE 架构的代码模型。在浏览器调用(WebArena)、工具调用(BFCL)等 Agent 能力评测中,Qwen3-Coder 刷新开源模型纪录,超越 GPT4.1;在考察模型自主规划解决编程任务的 SWE-Bench 评测中,Qwen3-Coder 取得了开源最佳效果,媲美 Claude4。


据介绍,Qwen3-Coder 具备出色的 Agent 能力,尤为擅长解决多步骤的长任务,它能通观全局自主安排工作内容,支持 Agent 调用各种工具深入钻研,最终解决复杂编程任务。官方实测数据显示,在执行任务时,Qwen3-Coder 能够调用的工具数量比 Claude 多几倍,效果非常出色。


Qwen3-Coder 能帮助程序员完成基础的编程任务,比如写代码、补全代码、修 Bug 等,编程工作效率大幅提升,代码测试、查询生成等工作从人工编写的数小时骤降至数分钟。同时,Qwen3-Coder 也极大降低了普通人入门编程的门槛,比如一句话就能生成精妙复杂的 3D 物理模拟过程:


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    Qwen Chat Web Dev:

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      用一句名言测试你的 WPM:

      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        旋转超立方体中的弹跳球:

        00:00 / 00:00
          1.0x
          • 3.0x
          • 2.5x
          • 2.0x
          • 1.5x
          • 1.25x
          • 1.0x
          • 0.75x
          • 0.5x
          网页全屏
          全屏
          00:00


          太阳系模拟:

          00:00 / 00:00
            1.0x
            • 3.0x
            • 2.5x
            • 2.0x
            • 1.5x
            • 1.25x
            • 1.0x
            • 0.75x
            • 0.5x
            网页全屏
            全屏
            00:00


            DUET 游戏:

            00:00 / 00:00
              1.0x
              • 3.0x
              • 2.5x
              • 2.0x
              • 1.5x
              • 1.25x
              • 1.0x
              • 0.75x
              • 0.5x
              网页全屏
              全屏
              00:00


              “我测试了该基准测试的几个示例。默认基准测试使用的提示只要求回答问题。这意味着推理模型凭借其较长的 COT(参见 QwQ)具有巨大的优势。但当我更改提示词,要求模型逐步推理并考虑所有细微的上下文时,更新后的 Qwen3 235B 表现明显更好。”有开发者反馈道。


              还有做了测试的开发者表示“速度快得离谱”。不过,也有开发者遇到了一些问题:“我尝试让它进行一些基本操作,如用 MCP 工具读取一些文件,但即使我详细解释了如何操作,它还是失败了。”


              另外,有开发者找到了阿里云百炼上的价格:



              附:在 Claude Code 使用 Qwen3‑Coder 的方法


              官方给出了 Qwen3‑Coder 与 Claude Code 搭配使用的具体方法,具体提供了两种接入方式。


              方案 1:使用 dashscope 提供的代理  API


              只需要将 Anthropic 的 base url 替换成 dashscope 上提供的 endpoint 即可。


              export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxyexport ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey
              复制代码


              至此,可以直接输入 claude 开始使用 Qwen3-Coder & Claude Code


              方案 2:使用 claude-code-config 自定义路由


              claude-code-router 是一个第三方的路由工具,用于为 Claude Code 灵活地切换不同的后端 API。dashscope 平台提供了一个简单的扩展包 claude-code-config,可为 claude-code-router 生成包含 dashscope 支持的默认配置。


              npm install -g @musistudio/claude-code-routernpm install -g @dashscope-js/claude-code-config
              复制代码


              生成配置文件和插件目录:


              ccr-dashscope
              复制代码


              该命令会自动生成 ccr 所需的配置文件和插件目录。你也可以手动调整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/ 中的配置。最后,通过 ccr 开始使用 Claude Code:


              ccr code
              复制代码


              2025-07-24 09:441

              评论

              发布
              暂无评论

              登上 Github 趋势榜,iMove 原理技术大揭秘!

              阿里巴巴 开源 大前端 Web框架 逻辑编排

              OpenCV--基本的线条操作

              IT蜗壳-Tango

              七日更 2月春节不断更

              什么是防火墙?

              Kubernetes 原生 CI/CD 构建框架 Argo 详解!

              字节跳动 Kubernetes 云原生 CI/CD argo

              威联通(NAS)应用篇:自建OwnCloud网盘(百度网盘,拜拜~~~)

              BigYoung

              NAS 威联通 28天写作 2月春节不断更

              探寻内部类的奥秘(上)

              后台技术汇

              2月春节不断更

              机器学习笔记之:Matrix Matrix Multiplication

              Nydia

              因果迷境:为什么我们会问“为什么”?

              脑极体

              MyBatis专栏 - 进阶(引入外部配置文件, 类型参数设置)

              小马哥

              Java mybatis 七日更 2月春节不断更

              产品经理训练营第二章作业2

              阿波

              盘点:2021年最新、最全、最实用的Java岗面试真题,已收录GitHub

              Java 架构 面试

              iMove 基于 X6 + form-render 背后的思考

              阿里巴巴 开源 大前端 Web框架 逻辑编排

              Webpack | 提升构建速度和体积优化的N种方式

              梁龙先森

              大前端 webpack 2月春节不断更

              Spring Boot 微服务性能下降九成!使用 Arthas 定位根因

              Java架构师迁哥

              F2C能否让前端像运营配置一样开发?

              阿里巴巴 开源 大前端 Web框架 逻辑编排

              【LeetCode】尽可能使字符串相等

              Albert

              算法 LeetCode 2月春节不断更

              团队中的三种成员

              熊斌

              学习 管理 2月春节不断更

              容器&服务:开篇,压力与资源

              程序员架构进阶

              容器 服务 七日更 28天写作 2月春节不断更

              Linux Lab 进阶: Uboot 引导程序

              贾献华

              Linux bootloader Linux Kenel boot

              OpenCV简介及其工程应用-游戏色块检测

              行者AI

              OpenCV

              正点原子DS100拆解全过程-硬件工程师必备

              良知犹存

              嵌入式

              学习总结之HTML5剑指前端(建议收藏,图文并茂)

              我是哪吒

              学习 程序员 面试 大前端 2月春节不断更

              2021最新发布百度云面经总结:Java并发+Redis+数据库+分布式

              比伯

              Java 程序员 架构 面试 计算机

              2021年前端趋势预测

              阿里巴巴 开源 大前端 Web框架 逻辑编排

              Go Modules v2 及后续版本

              Rayjun

              Go 语言

              2 期架构师训练营 - 大作业(二)

              云飞扬

              架构师训练营第2期

              日记 2021年2月5日(周五)

              Changing Lin

              个人感悟 2月春节不断更

              所见即所得! iMove 在线执行代码探索

              阿里巴巴 开源 大前端 Web框架 逻辑编排

              从躬身入局到共生入境的做产品

              boshi

              产品经理 产品设计 七日更

              即使技术再精,面试时一问这个必挂!!

              冰河

              面试 类加载器 我要进大厂 Java类加载

              阿里新晋 CNCF TOC 委员张磊:“云原生”为什么对云计算生态充满吸引力?

              阿里巴巴云原生

              云计算 容器 微服务 云原生 cncf

              阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了_AI&大模型_褚杏娟_InfoQ精选文章