写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:296743

评论

发布
暂无评论
发现更多内容

火山引擎DataLeap如何解决SLA治理难题(二):申报签署流程与复盘详解

字节跳动数据平台

大数据 数据中台 数据研发

国赛线下开赛!全国智能车百度智慧交通创意组区域赛今日正式拉开帷幕!

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

认识高性能服务治理框架 Kmesh

openEuler

Linux 开源 操作系统 openEuler 服务网格

ChatGPT的探索与实践-业务应用篇 | 京东云技术团队

京东科技开发者

人工智能 ChatGPT 企业号 7 月 PK 榜

完成等保测评后有合格证书吗?是什么样的?

行云管家

等保测评 等保2.0 等级测评

高性能网络设计秘笈:深入剖析Linux网络IO与epoll

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 7 月 PK 榜

MobPush Android For Unity

MobTech袤博科技

开发者 前端 Unity Android; Java’

安装Ingress-Nginx

tiandizhiguai

云原生 k8s

引领AI变革,九章云极DataCanvas公司重磅发布AIFS+DataPilot

九章云极DataCanvas

直播软件源码开发搭建提高安全性方案——山东布谷科技创作

山东布谷科技

源码 软件 软件开发 直播 源码搭建

聊聊Spring注解@Transactional失效的那些事 | 京东云技术团队

京东科技开发者

spring Transactional @Transactional 企业号 7 月 PK 榜 注解失效

缕析条分Scroll属性 | 京东云技术团队

京东科技开发者

前端 DOM ScrollView ScrollView(滚动条) 企业号 7 月 PK 榜

Last Week in Milvus

Zilliz

Milvus Zilliz AIGC cvpstack

小动作牵动大文明,“大运空瓶行动”从你我做起

新消费日报

只有1%的人才知道的ChatGPT写作技巧

俞凡

人工智能 ChatGPT

ChatGPT赋能Scrum实践

俞凡

人工智能 Scrum 敏捷开发 ChatGPT

当你成为一个Tech Lead

码猿外

技术管理 Tech Lead

航空机场行业如何绘就全面预算降本增效新画卷?

用友BIP

全面预算

Brotli-压缩算法的潮流 | 社区征文

不叫猫先生

Brotli 压缩算法 年中技术盘点

亚信科技荣任「DBL电信行业工作组」副组长单位,AntDB数据库连年入选《中国数据库产品图谱》

亚信AntDB数据库

AntDB 数据库· AntDB数据库 企业号 7 月 PK 榜

DDD架构为什么应该首选六边形架构? | 京东云技术团队

京东科技开发者

分层架构 架构设计 企业号 7 月 PK 榜 六边形架构

LeetCode题解:2618. 检查是否是类的对象实例,使用instanceof

Lee Chen

JavaScript LeetCode

升级数智底座是数智化2.0时代的核心诉求

用友BIP

数智底座

Win11 搭建SD WebUI环境 | 社区征文

IT蜗壳-Tango

AIGC Stable Diffusion 年中技术盘点 SD

浅谈一下自动化运维优点和缺点,哪款工具好?

行云管家

自动化 IT运维 自动化运维

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章