写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:296935

评论

发布
暂无评论
发现更多内容

十大排序算法--希尔排序

Ayue、

排序算法 8月日更

【Git技术专题】如何使用git中的tag进行版本开发控制?

码界西柚

git 8月日更

企业需要拥有自己特色的DevOps

用友BIP

Docker 容器 DevOps 微服务

手撸二叉树之二叉搜索树的最近公共祖先

HelloWorld杰少

数据结构与算法 8月日更

积极重夺制造霸主地位,英特尔不玩“纳米游戏”了

E科讯

混合基础设施下,服务网格(Service Mesh)如何对应用进行统一管理

韩陆

我两年的坚持,值了!

程序员鱼皮

Java JavaScript 腾讯 职场 大前端

Java代码中,如何监控Mysql的binlog?

码农参上

Binlog 实战

【LeetCode】有效三角形的个数Java题解

Albert

算法 LeetCode 8月日更

LeetCode题解:173. 二叉搜索树迭代器,栈,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

「跨链网关的模块化进程」插件机制演化

趣链科技

【秋招面试专题解析】成功入职头条月薪35K

欢喜学安卓

android 程序员 面试 移动开发

华为云UGO:醒醒!你的异构数据库迁移难题有救了

华为云开发者联盟

数据库 迁移 华为云 异构数据库 UGO

springcloud 微服务日志写入kafka

Rubble

kafka Spring Cloud 8月日更

百度第25季黑客马拉松再秀“技术基因”,累计产生创意超7000个

科技热闻

软件架构模式之微服务架构

架构精进之路

架构 微服务 8月日更

JVM

ltc

JVM

如何用EasyRecovery恢复U盘内损坏的数据

淋雨

文件恢复 硬盘数据恢复 Easyrecivery

用微服务架构方式交付云服务产品

用友BIP

容器 微服务 专属云

手把手教你怎么导入Go语言第三方库「让我们一起Golang」

Regan Yue

后端 Go 语言 8月日更

体验有奖 | 1 分钟 Serverless 部署掌上游戏机,“一行命令”找回小时候的乐趣!

Serverless Devs

如何在渲染之前等待 Axios 数据?

吴脑的键客

大前端 React axios

面试官:展开说说,Spring中Bean对象是如何通过注解注入的?

小傅哥

spring 小傅哥 注解注入

架构实战营毕业设计

eoeoeo

架构实战营

经验之谈:程序员应该如何学好大数据技术

博文视点Broadview

24岁,月薪35k!全靠这份阿里P5-P9知识核心手册+10W字面试题总结

Java架构追梦

Java 阿里巴巴 架构 面试

上K8s,研发团队如何从容一点?

行云创新

容器 k8s

SLB 负载均衡实践

若尘

负载均衡 阿里云 弹性负载均衡 8月日更

这些智能合约漏洞,可能会影响你的账户安全!

华为云开发者联盟

区块链 智能合约 安全 形式化验证 华为区块链服务

CodeDay#8:支付宝都在用的容器技术了解一下

蚂蚁集团移动开发平台 mPaaS

小程序 支付宝小程序 支付宝 移动开发 mPaaS

ToastUtil实用封装

Changing Lin

8月日更

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章