通义千问升级旗舰模型Qwen-Max，性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章



 写点什么

登录/注册



大小：204.13K时长：01:09

通义千问升级旗舰模型Qwen-Max，性能接近GPT-4o

9 月 19 日云栖大会，阿里云 CTO 周靖人宣布，通义旗舰模型 Qwen-Max 全方位升级，性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max，继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。

相比上一代模型，Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐，最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上，Qwen-Max 表现接近 GPT-4o，数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。

相比 2023 年 4 月的初代通义千问大模型，Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%，模型与人类偏好的对齐水平更是有了质的飞跃，提升了 700%以上。

评论

发布

暂无评论

特权账号管理系统简述

特权账号管理特权账号 PAM

出海 SaaS 企业增长修炼手册2：Kyligence 落地 PLG 是如何避坑的？

指标管理 SaaS 增长

如何制作二维码会议签到系统？

草料二维码

揭示Lombok的代码设计缺陷：探索封装问题

树上有只程序猿

lombok Java 开发

Op丨ARB链dapp代币合约质押项目系统开发

幸福里基于 Flink & Paimon 的流式数仓实践

字节跳动云原生计算

大模型在数据分析场景下的能力评测

数据分析 Kyligence Copilot

交易所开发 PancakeSwap DeFi 成功的秘密：您的 DEX 发展蓝图

区块链软件开发推广运营

交易所开发 dapp开发区块链开发链游开发 NFT开发

如何确定Apache Kafka的大小和规模

互联网工科生

多款国产操作系统安装数据库干货文档汇总（含Oracle/MySQL/国产数据库等）

MySQL 数据库 oracle 国产操作系统麒麟软件

协同发展，生态聚合丨1024程序员节暨「源聚一堂」开源技术沙龙（北京站）成功举办

开放原子开源基金会

焕新升级！新一代云原生可观测平台

华为云原生团队

云计算容器云原生边缘计算

关于数据库分片你需要知道的

遥遥知识库

Java 分布式数据库后端数据库分片关于XX你应该知道的

HarmonyOS多音频播放并发政策及音频管理解析

HarmonyOS开发者

博睿动态｜GOPS全球运维大会2023上海站即将开启！

战略牵手OXY精英设计、朗生、MPE美亚，小度合作生态重构再迎重要时刻

新消费日报

等保测评后还要花很多钱做等保整改吗？

等保等级保护等保测评等保2.0

1024程序员节|是时候，展示真正的实力了！

Openlab_cosmoplat

1024 1024程序员节

如何区分特权账号管理系统PAM和堡垒机

网络安全堡垒机特权账号管理

第11期 | GPTSecurity周报

1024 有奖征名｜来给矩阵起源办公室的新猫取名字呀~

1024 MatrixOrigin MatrixOne

挑战吧，HarmonyOS应用开发工程师

HarmonyOS开发者

如何为3D模型设置自发光材质？

材质纹理贴图

如何使用透明贴图实现火焰效果

材质纹理贴图