在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

阿里 Qwen3-Coder 携 1M 上下文杀来!5 分钟生成网站,开发者狂欢:Claude Code 可以卸载了

  • 2025-07-24
    北京
  • 本文字数:2648 字

    阅读完需:约 9 分钟

阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了

7 月 23 日,阿里正式发布了其“迄今为止最具代理能力的代码模型” Qwen3-Coder。


Qwen3-Coder 有多个版本,其中 Qwen3-Coder-480B-A35B-Instruct 是一个有 480B 参数、35B 激活参数的 MoE 模型,原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。据悉,该模型支持 358 种编程语言,在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美。



与此同时,阿里还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。Qwen Code 是一个 CLI 工具,修改自 Gemini CLI,针对 Qwen3‑Coder 系列的模型增强了解析器和工具支持。据悉,Qwen Code 基于 Gemini Code 进行二次开发,但团队进行了 prompt 和工具调用协议适配,以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。另外,Qwen3-Coder 还可以和社区优秀的编程工具结合,如 Claude Code、Cline 等。


据介绍,借助 Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需 5 分钟。


目前,Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源,全球开发者都可以免费下载使用。截至发稿前,该模型已在 Github 上获得 5.1k stars。此外,Qwen3-Coder 很快将接入阿里的 AI 编程产品通义灵码,API 也已上线阿里云百炼。


相关地址:

https://github.com/QwenLM/Qwen3-Coder

https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

Qwen3-Coder 训练过程

预训练


据悉,这次团队从不同角度进行 Scaling,以提升 Qwen3-Coder 的代码能力:


  • 数据扩展:总计 7.5T(代码占比 70%),在保持通用与数学能力的同时,具备卓越的编程能力;

  • 上下文扩展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,专为仓库级和动态数据(如 Pull Request)优化;

  • 合成数据扩展:利用 Qwen2.5-Coder 对低质数据进行清洗与重写,来显著提升整体数据质量。

后训练


团队在更丰富的真实代码任务上进行了扩展 Code RL 训练。与当前社区普遍聚焦于竞赛类代码生成不同,团队认为所有的代码任务天然适合执行驱动的大规模强化学习。通过自动扩展测试样例,团队构造了大量高质量的训练实例,不仅显著提升了代码执行成功率,还对其他任务带来增益。



在真实世界的 Software Engneering Task,比如 SWE-Bench,模型需要在环境中不断交互,自主规划、选择工具调用、接受反馈不断做出新决策,这是一个典型的 Long-Horizon RL 任务。


团队在 Qwen3-Coder 的后训练阶段执行了 Agent RL,鼓励模型通过多轮交互的方式利用工具解决问题。据介绍,Agent RL 的主要挑战在于 Environment Scaling,团队实现了可验证环境的扩展系统,借助阿里云的基础设施,实现同时运行 20k 独立环境。这一套基础设施可以提供大规模的强化学习反馈和评测,最终我们在 SWE-bench Verified 上实现了开源模型 SOTA 的效果。

效果如何?


Qwen3-Coder 是社区期待已久的大模型之一。4 月底时候就有人提出,希望确保 Qwen3coder 使用最新 / 更新的高质量代码进行训练,尤其是针对系统编程语言的代码。还有开发者表示,希望 Qwen3-coder 能在 C 和 C++ 领域有更多涉猎。“现在的 AI 模型都针对 Web 和桌面开发进行了优化。但我们今天使用的很多技术仍然嵌入在智能设备中,而且由于对传统硬件组件的依赖,大多数公司无法切换到 Rust。”


Qwen3-Coder 发布后开发者们表现出了很大的热情。



SnapEdit 联合创始人兼首席执行官 Oscar Le 发推称,“Qwen 从来没有让我失望过。现在大家不用再每月花 200 美元购买 Claude Code 了。”



苹果研究员 Yufan Zhuang 也称赞 Qwen 正在推动开源人工智能研究。



Qwen3-Coder 是千问系列模型中首个采用混合专家 MoE 架构的代码模型。在浏览器调用(WebArena)、工具调用(BFCL)等 Agent 能力评测中,Qwen3-Coder 刷新开源模型纪录,超越 GPT4.1;在考察模型自主规划解决编程任务的 SWE-Bench 评测中,Qwen3-Coder 取得了开源最佳效果,媲美 Claude4。


据介绍,Qwen3-Coder 具备出色的 Agent 能力,尤为擅长解决多步骤的长任务,它能通观全局自主安排工作内容,支持 Agent 调用各种工具深入钻研,最终解决复杂编程任务。官方实测数据显示,在执行任务时,Qwen3-Coder 能够调用的工具数量比 Claude 多几倍,效果非常出色。


Qwen3-Coder 能帮助程序员完成基础的编程任务,比如写代码、补全代码、修 Bug 等,编程工作效率大幅提升,代码测试、查询生成等工作从人工编写的数小时骤降至数分钟。同时,Qwen3-Coder 也极大降低了普通人入门编程的门槛,比如一句话就能生成精妙复杂的 3D 物理模拟过程:


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    Qwen Chat Web Dev:

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      用一句名言测试你的 WPM:

      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        旋转超立方体中的弹跳球:

        00:00 / 00:00
          1.0x
          • 3.0x
          • 2.5x
          • 2.0x
          • 1.5x
          • 1.25x
          • 1.0x
          • 0.75x
          • 0.5x
          网页全屏
          全屏
          00:00


          太阳系模拟:

          00:00 / 00:00
            1.0x
            • 3.0x
            • 2.5x
            • 2.0x
            • 1.5x
            • 1.25x
            • 1.0x
            • 0.75x
            • 0.5x
            网页全屏
            全屏
            00:00


            DUET 游戏:

            00:00 / 00:00
              1.0x
              • 3.0x
              • 2.5x
              • 2.0x
              • 1.5x
              • 1.25x
              • 1.0x
              • 0.75x
              • 0.5x
              网页全屏
              全屏
              00:00


              “我测试了该基准测试的几个示例。默认基准测试使用的提示只要求回答问题。这意味着推理模型凭借其较长的 COT(参见 QwQ)具有巨大的优势。但当我更改提示词,要求模型逐步推理并考虑所有细微的上下文时,更新后的 Qwen3 235B 表现明显更好。”有开发者反馈道。


              还有做了测试的开发者表示“速度快得离谱”。不过,也有开发者遇到了一些问题:“我尝试让它进行一些基本操作,如用 MCP 工具读取一些文件,但即使我详细解释了如何操作,它还是失败了。”


              另外,有开发者找到了阿里云百炼上的价格:



              附:在 Claude Code 使用 Qwen3‑Coder 的方法


              官方给出了 Qwen3‑Coder 与 Claude Code 搭配使用的具体方法,具体提供了两种接入方式。


              方案 1:使用 dashscope 提供的代理  API


              只需要将 Anthropic 的 base url 替换成 dashscope 上提供的 endpoint 即可。


              export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxyexport ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey
              复制代码


              至此,可以直接输入 claude 开始使用 Qwen3-Coder & Claude Code


              方案 2:使用 claude-code-config 自定义路由


              claude-code-router 是一个第三方的路由工具,用于为 Claude Code 灵活地切换不同的后端 API。dashscope 平台提供了一个简单的扩展包 claude-code-config,可为 claude-code-router 生成包含 dashscope 支持的默认配置。


              npm install -g @musistudio/claude-code-routernpm install -g @dashscope-js/claude-code-config
              复制代码


              生成配置文件和插件目录:


              ccr-dashscope
              复制代码


              该命令会自动生成 ccr 所需的配置文件和插件目录。你也可以手动调整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/ 中的配置。最后,通过 ccr 开始使用 Claude Code:


              ccr code
              复制代码


              2025-07-24 09:4410220

              评论

              发布
              暂无评论

              Seal AppManager发布:基于平台工程理念的全新应用部署管理体验

              SEAL安全

              应用部署 企业号 4 月 PK 榜 Seal软件 SealAppManager

              春风送暖,好久不见

              BinTools图尔兹

              版本发布

              GitHub程序调优「黑马」!阿里大牛的Java性能优化实战笔记已上线

              Java 面试 性能优化 性能调优

              火山引擎数智平台协助洞察美图类APP新增长 付费用户转化超过124%

              字节跳动数据平台

              大数据 增长 产品增长 企业号 4 月 PK 榜 美图

              数据开发提效有秘诀!离线开发BatchWorks 六大典型场景拆解

              袋鼠云数栈

              大数据 离线开发

              selenium源码通读·5 |webdriver/common/action_chains.py-ActionChains类分析

              Python 源码 测试 自动化测试 selenium

              OpenTelemetry 正在改变我们跟踪和设计应用的方式

              NGINX开源社区

              nginx 云原生

              GPTCache:LLM 应用必备的【省省省】利器

              Zilliz

              Milvus Zilliz ChatGPT LLM 语义检索

              自阿里P8爆出内部1031道java面试题后,在Boss直聘狂拿千份Offer

              Java java面试 Java八股文 Java面试题 Java面试八股文

              对标大厂的技术派方案设计,带你了解一个项目从0到1实现的全过程

              Java你猿哥

              Java 架构 ssm 项目设计

              博睿学院 | 本周四:OpenTelemetry技术在数据标准化中应用实践

              博睿数据

              可观测性 智能运维 博睿数据 前沿技术 博睿学院

              PC GWP-ASan方案原理 | 堆破坏问题排查实践

              字节跳动终端技术

              问题排查 PC

              面试官:说说MySQL主从复制原理

              Java永远的神

              MySQL 数据库 程序员 面试 主从复制

              看了我常用的IDEA插件,同事也开始悄悄安装了

              Java你猿哥

              Java 程序员 ssm IDEA 架构师

              selenium源码通读·4 |webdriver/common分析

              Python 源码 测试 自动化测试 selenium

              手把手教你,从零开始搭建Spring Cloud Alibaba!这份笔记太牛了

              Java你猿哥

              spring Spring Cloud ssm 架构师

              上线半天下载量破100W!美团大佬的Java性能调优实战手册,超详细

              Java你猿哥

              Java 数据库 JVM java编程 Java性能优化

              Netty服务开发及性能优化

              Java Netty

              从内核源码看 slab 内存池的创建初始化流程

              bin的技术小屋

              操作系统 内存管理 Linux Kenel 内核 动态内存池

              深度学习基础入门篇[四]:激活函数介绍:tanh、sigmoid、ReLU、PReLU、ELU、softplus、softmax、swish等

              汀丶人工智能

              人工智能 机器学习 深度学习 激活函数

              阿里内部热捧“Spring全线笔记”,不止是全家桶,太完整了

              Java你猿哥

              spring Spring Cloud Spring Boot Spring MVC

              商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此

              Openlab_cosmoplat

              开源社区 ChatGPT

              软件测试/测试开发丨ChatGPT训练营来,手把手带你玩转ChatGPT

              测试人

              软件测试 自动化测试 测试开发 ChatGPT

              历史性的时刻!OpenTiny 跨端、跨框架组件库正式升级 TypeScript,10 万行代码重获新生!

              华为云开源

              typescript Vue 组件库

              解决事务隔离产生问题的MVCC

              Java你猿哥

              Java ssm 架构师 MVCC

              MyBatis整合Springboot多数据源实现

              Java Spring Boot mybatis

              Spring全家桶思维笔记导图(Spring Boot+Cloud+IOC+AOP+MVC等)

              Java你猿哥

              spring Spring Cloud Spring Boot aop ioc

              重磅官宣,OpenHarmony开发者大会来了!

              OpenHarmony开发者

              OpenHarmony

              Flink CDC 在京东的探索与实践

              Apache Flink

              大数据 flink 实时计算

              一文弄懂访问者模式

              小小怪下士

              Java 程序员 设计模式

              解决事务隔离产生问题的MVCC

              阿里Qwen3-Coder携1M上下文杀来!5分钟生成网站,开发者狂欢:Claude Code可以卸载了_AI&大模型_褚杏娟_InfoQ精选文章