10 月 23 - 25 日,QCon 上海站即将召开,9折优惠最后2天 了解详情
写点什么

阿里通义旗舰模型 Qwen3-Max 亮相

  • 2025-09-24
    北京
  • 本文字数:730 字

    阅读完需:约 2 分钟

大小:387.01K时长:02:12
阿里通义旗舰模型Qwen3-Max亮相

9 月 24 日,2025 云栖大会开幕,阿里通义旗舰模型 Qwen3-Max 重磅亮相,性能超过 GPT5、Claude Opus 4 等,跻身全球前三。


Qwen3-Max 包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在 Chatbot Arena 排行榜上位列第三,正式版性可望再度实现突破。


Qwen3-Max 为通义千问家族中最大、最强的基础模型。该模型预训练数据量达 36T tokens,总参数超过万亿,拥有极强的 Coding 编程能力和 Agent 工具调用能力。


在大模型用 Coding 解决真实世界问题的 SWE-Bench Verified 测试中,Instruct 版本斩获 69.6 分,位列全球第一梯队;在聚焦 Agent 工具调用能力的 Tau2-Bench 测试中,Qwen3-Max 取得突破性的 74.8 分,超过 Claude Opus4 和 DeepSeek-V3.1。



【图说】:Qwen3-Max-Instrurct 测评分数


Qwen3-Max 的推理增强版本 Qwen3-Max-Thinking-Heavy 也展现出非凡性能,结合工具调用和并行推理技术,其推理能力创下新高,尤其在聚焦数学推理的 AIME 25 和 HMMT 测试中,均达到突破性的满分 100 分,为国内首次。Qwen3-Max 推理模型之所以能够取得优异成绩,原因在于大模型在解数学题时懂得调动工具,能够写代码做题,同时,增加测试时的计算资源,也让模型表现变得更好。


【图说】:Qwen3-Max-Thinking-Heavy 测评分数


大模型预训练原理 Scaling Law(规模化法则)认为,持续地增长数据和参数规模,是通向 AGI 的可能路径之一。由于自然数据的数量有限,当前有部分学者认为预训练的 Scaling Law 即将逼近上限,而 Qwen3-Max 的性能突破显示,继续增大数据、模型参数,依然能锻造出更强的模型,给予了大家更多的信心。


目前,通义千问系列模型已经实现从 0.5B 到超万亿的全尺寸覆盖,包含三百多个大模型,可满足不同场景的需求。


即日起,用户可在通义千问 QwenChat 上免费体验 Qwen3-Max,也可通过阿里云百炼平台调用 API 服务。

2025-09-24 11:4984

评论

发布
暂无评论

【数据结构与算法】粽子树?二叉树_关于堆你不知道的事情

Dream-Y.ocean

栈和队列 9月月更

面试突击87:说一下 Spring 事务传播机制?

王磊

Java 面试

设计消息队列存储消息数据的 MySQL 表格

张立奎

破解windows系统密码

吉师职业混子

9月月更

研发效能之技术治理&技术治理架构师

laofo

DevOps cicd 研发效能 持续交付 工程效率

2022-09-27:给定一个棵树, 树上每个节点都有自己的值,记录在数组nums里, 比如nums[4] = 10,表示4号点的值是10, 给定树上的每一条边,记录在二维数组edges里, 比如ed

福大大架构师每日一题

算法 rust 福大大

跟着卷卷龙一起学Camera--内存池浅析05

卷卷龙

ISP 9月月更

【Python实践】使用Python实时语音控制电脑全局音量

迷彩

人工智能 语音识别 9月月更 控制电脑 语音控制

千峰课程网安笔记(1)

吉师职业混子

9月月更

我也不想学之PHP系列(2)

吉师职业混子

9月月更

【数据结构与算法】LeetCode面试真题,带你领略算法思想

Dream-Y.ocean

面试 队列 9月月更

【数据结构与算法】“堆”还能这样用_堆的应用

Dream-Y.ocean

面试 9月月更

企业服务中出场率最高的活动目录AD到底是什么?本文带您好好了解一下!

wljslmz

AD 9月月更 活动目录

第一模块作业

lsf1227

「架构实战营」

Python之类和对象(2)

芯动大师

属性 9月月更 子类的定义

【docker】软链接迁移docker存储目录

非晓为骁

Docker 存储 迁移

大模型的禾下乘凉梦,百度自己来做试验田

脑极体

前端工程师在面试时经常被问的闭包到底是什么?我用打包礼物的例子让你秒懂

wljslmz

JavaScript 闭包 9月月更

Python语法之模块和包(1)

芯动大师

9月月更 Python语法 模块的创建

【数据结构与算法】一篇文章带你玩懂 “栈和队列”(增、删、查、改)的实现_【附源码、动图】

Dream-Y.ocean

队列 数据结构与算法 9月月更

【云原生 | 从零开始学Kubernetes】十一、k8s污点、容忍度和pod状态

泡泡

Docker 云计算 云原生 k8s 9月月更

车企如何完善车载小程序生态安全

Geek_99967b

小程序

Python语法之类和对象(1)

芯动大师

Python 9月月更 类与对象

从东南亚到中东,为什么社交类产品成为游戏出海的突破口?

融云 RongCloud

白皮书 社交网络 出海 社交娱乐

跟着卷卷龙一起学Camera--内存池浅析04

卷卷龙

ISP 9月月更

【编程实践】利用 Python 调用图灵机器人 API 实现实时语音聊天及自动回复

迷彩

Python 实时语音 实时聊天 9月月更

读书笔记|择一城以定财富,择一行以定发展

宇宙之一粟

读书笔记 职业 个人感悟 9月月更

跟着卷卷龙一起学Camera--内存池浅析06

卷卷龙

ISP 9月月更

【数据结构与算法】2道面试真题,带你领略算法思想【附思路、动图、源码】

Dream-Y.ocean

面试 链表 9月月更

这个C4D短片有点辣!热情起舞小金链尽显墨西哥黑帮气质

Renderbus瑞云渲染农场

影视制作 Renderbus瑞云渲染 3D电影制作

rust语言写的贪吃蛇游戏

福大大架构师每日一题

rust 贪吃蛇 福大大

阿里通义旗舰模型Qwen3-Max亮相_自然语言处理_木子_InfoQ精选文章