AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:296836

评论

发布
暂无评论
发现更多内容

树莓派简介

IT蜗壳-Tango

IT蜗壳教学 4月日更

【死磕JVM】给同事讲了一遍GC后,他要去面试,年轻人,就是容易冲动!

牧小农

JVM 垃圾回收 垃圾收集 垃圾回收算法

从小白程序员到大厂高级技术专家我看过哪些书籍?

冰河

程序员 程序人生 冰河 推荐书单

架构训练营模块1作业-江哲

江哲

作业

Hive相关的总结

大数据技术指南

hive 4月日更

架构实战营-模块1-作业

泄矢的呼啦圈

架构实战营

Kafka又出问题了!

冰河

kafka 消息队列 消息中间件 异步编程

智慧公安重点人员管控系统搭建,助推公安智慧化发展

13828808769

区块链+ #区块链#

打完新冠疫苗后要注意的两件事

石云升

28天写作 新冠疫苗 4月日更

用 Sublime Text 编辑 Markdown

U2647

sublime-text markdown 4月日更

重点人员可视化管理平台搭建,公安指挥调度平台

智慧党建系统搭建,干部管理平台开发

Kafka的再平衡机制

五分钟学大数据

kafka 4月日更

聪明人的训练(三)

Changing Lin

4月日更

雄安区块链实验室副主任李军:把区块链植入数字雄安

CECBC

区块链

区块链技术推动自然资源领域信息化发展

13828808769

区块链+ #区块链#

区块链BaaS平台+BI大数据系统

电微13828808271

区块链+

区块链BaaS平台,创造不一样的服务

电微13828808271

区块链+

Linux chmod命令

一个大红包

4月日更

不想写代码偷懒之配置化

顿晓

大前端 配置化开发 4月日更

Python OpenCV 之图像乘除与像素的逻辑运算,图像处理取经之旅第 17 天

梦想橡皮擦

Python OpenCV 4月日更

大数据计算生态之数据计算(一)

小舰

4月日更

“圈粉”行业龙头 数字人民币搅动投资江湖

CECBC

数字人民币

Java一套拳法刷掉n个遍历树的问题 John 易筋 ARTS 打卡 Week 43

John(易筋)

ARTS活动

区块链赋能文化旅游,推动旅游行业转型升级

13828808769

区块链 #区块链#

制作颜色选择器(全)

空城机

JavaScript Vue 大前端 4月日更 颜色选择器

Redis split-brain 脑裂

escray

redis 学习 极客时间 Redis 核心技术与实战 4月日更

配置化开发是否可行?

顿晓

重构 配置化开发 4月日更

基于角色访问控制RBAC权限模型的动态资源访问权限管理实现

crudapi

spring security 权限 rbac crudapi 角色

重构: 自己挖的坑自己填

夏兮。

Java 重构 测试 单元测试

机器学习 | 数据缩放与转换方法(1)

披头

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章