写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:297082

评论

发布
暂无评论
发现更多内容

AI Agent 的工程化被低估了

阿里巴巴云原生

寻疗微擎开源生态下的智慧医疗服务

微擎应用市场

DNS解析记录中的权重是什么意思?怎么配置权重?

国科云

XnViewMP for Mac 图片浏览查看器

晨光熹微

XnViewMP 下载 XnViewMP mac

NoETL 指标平台:语义驱动数据治理的升维战

Aloudata

数据分析 数据治理 数据开发 指标平台 智能问数

首度公开|网易伏羲:去中心化,从单智能体到群体智能的跃迁

网易伏羲

网易伏羲 数字游民 具身智能 群体智能 AOP编程

现场大屏幕微擎开源生态下的智能现场互动中枢

微擎应用市场

Print to PDF Pro for Mac v5.8.5 PDF文件打印软件 激活版

Rose

一键部署微软Office Office Tool Plus中文便携免费版

Rose

AI英语听力APP的开发

北京木奇移动技术有限公司

软件外包公司 AI听力 AI英语学习

工具分享-从ibd文件中恢复数据的神器ibd2sql

GreatSQL

Typinator for Mac v9.2 文本短语快速输入工具 激活版

Rose

专业级网络调试与抓包分析工具Proxyman Premium for Mac

Geek贝

AI 助手增强JetBrains PhpStorm 2025.1.2破解版及密钥下载 Mac/win

Rose

Kaleidoscope for Mac(图片和文本差异比较工具)

Geek贝

同城信息:微擎开源生态下的本地化生活服务

微擎应用市场

黑苹果必备驱动工具 Hackintool for Mac中文免费

Rose

xHistory for mac 终端记录管理工具

晨光熹微

七大技术路线解析:自动驾驶如何被数据重新定义

数据堂

人工智能 自动驾驶 AI 科普 训练数据

高效压缩解压缩软件Keka for Mac中文版

Geek贝

VoiceInk for mac (AI实时语音转文本)1.33(133) 免激活版

Rose

全面的采样器Native Instruments Maschine 音乐灵感源源不断

Rose

大数据-11-MapReduce JOIN 操作的Java实现 Driver Mapper Reducer具体实现逻辑 模拟SQL进行联表操作

武子康

Java 大数据 hadoop mapreduce hive

Muu 云小店微擎生态下的轻量化电商

微擎应用市场

用户通知服务,轻松实现应用与用户的多场景交互

HarmonyOS SDK

harmoyos

低成本、高回报:万界星空科技低代码MES系统,助力制造企业数字化“轻”升级

万界星空科技

低代码平台 mes 低代码云MES 制造业工厂 AI低代码MES

赛题解读|2025年度中国青年“揭榜挂帅”擂台赛·华为赛道

华为云开发者联盟

壹佰智慧餐厅微擎生态下的餐饮数字化全场景解决方案

微擎应用市场

大语言模型(LLM)如何让自动化测试效率直线提升?

测试人

TechSmith Snagit for Mac v2025.2.1 AI驱动的截屏软件 激活版

Rose

Bricsys BricsCAD 25 for mac 强大CAD绘图软件

晨光熹微

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章