写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:296991

评论

发布
暂无评论
发现更多内容

特权账号管理系统简述

尚思卓越

特权账号管理 特权账号 PAM

出海 SaaS 企业增长修炼手册2:Kyligence 落地 PLG 是如何避坑的?

Kyligence

指标管理 SaaS 增长

如何制作二维码会议签到系统?

草料二维码

揭示Lombok的代码设计缺陷:探索封装问题

树上有只程序猿

lombok Java 开发

Op丨ARB链dapp代币合约质押项目系统开发

l8l259l3365

幸福里基于 Flink & Paimon 的流式数仓实践

字节跳动云原生计算

flink paimon

大模型在数据分析场景下的能力评测

Kyligence

数据分析 Kyligence Copilot

​交易所开发 PancakeSwap DeFi 成功的秘密:您的 DEX 发展蓝图

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 NFT开发

如何确定Apache Kafka的大小和规模

互联网工科生

kafka

多款国产操作系统安装数据库干货文档汇总(含Oracle/MySQL/国产数据库等)

墨天轮

MySQL 数据库 oracle 国产操作系统 麒麟软件

协同发展,生态聚合丨1024程序员节暨「源聚一堂」开源技术沙龙(北京站)成功举办

开放原子开源基金会

焕新升级!新一代云原生可观测平台

华为云原生团队

云计算 容器 云原生 边缘计算

关于数据库分片你需要知道的

遥遥知识库

Java 分布式数据库 后端 数据库分片 关于XX你应该知道的

HarmonyOS多音频播放并发政策及音频管理解析

HarmonyOS开发者

HarmonyOS

博睿动态|GOPS全球运维大会2023上海站即将开启!

博睿数据

可观测性

战略牵手OXY精英设计、朗生、MPE美亚,小度合作生态重构再迎重要时刻

新消费日报

等保测评后还要花很多钱做等保整改吗?

行云管家

等保 等级保护 等保测评 等保2.0

1024程序员节|是时候,展示真正的实力了!

Openlab_cosmoplat

1024 1024程序员节

如何区分特权账号管理系统PAM和堡垒机

尚思卓越

网络安全 堡垒机 特权账号管理

第11期 | GPTSecurity周报

云起无垠

1024 有奖征名|来给矩阵起源办公室的新猫取名字呀~

MatrixOrigin

1024 MatrixOrigin MatrixOne

挑战吧,HarmonyOS应用开发工程师

HarmonyOS开发者

HarmonyOS

如何为3D模型设置自发光材质?

3D建模设计

材质 纹理 贴图

如何使用透明贴图实现火焰效果

3D建模设计

材质 纹理 贴图

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章