写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:297231

评论

发布
暂无评论
发现更多内容

CNCC | 超强阵容!CCF-网易雷火联合基金研讨会嘉宾率先揭晓

网易伏羲

人工智能 网易伏羲 cncc

Excelize 开源基础库 2.9.0 版本正式发布

xuri

golang 开源 办公自动化 Excelize 办公软件

使用豆包MarsCode 来处理 Excel 的数据吧!

TRAE

人工智能 程序员 AI

Navicat Premium:数据库全能管家,管理无忧!

Rose

2024海南等保测评机构名单汇总

行云管家

等保 等保测评 海南

如何用支付宝实现靠脸吃饭

盐焗代码虾

支付宝 刷脸支付 一脸通行

用户的声音| 出色的表格解析能力!TextIn文档解析助力金融信息化企业数据底座建设

合合技术团队

金融 #科技

Adobe Creative Cloud 创意应用软件 可解决adobe安装过程中的大部分问题

Rose

强大的局域网远程播放 nPlayer for Mac v1.4.0中文激活版

Rose

基于开源IM即时通讯框架MobileIMSDK:RainbowChat v11.7版已发布

JackJiang

MobileIMSDK 即时通讯;IM;网络编程 RainbowChat

Sketch快捷键大全 附Sketch最新中文激活安装包

Rose

AlDente Pro:苹果电脑电池寿命延长工具

Rose

软件测试学习笔记丨人工智能 | mixtral大模型

测试人

人工智能 软件测试

淘宝商品评论API:获取商品升级迭代后的用户反馈

技术冰糖葫芦

API 接口 API 文档 API 测试 API 性能测试

GreatSQL 在SQL中使用 HINT 语法修改会话变量

GreatSQL

数据库

淘宝API关键词搜索商品列表:优化商家数据分析与策略制定

代码忍者

pinduoduo API API 性能测试

大模型时代的数据治理之道|StartDT Talk

奇点云

人工智能 大数据 AI 数据治理 大模型

RAG vs 长上下文 LLMs:谁主沉浮?

Baihai IDP

程序员 AI LLMs rag Baihai IDP

万亿狂奔背后的券商IT:重度量、做提效、稳扎稳打不要飘

思码逸研发效能

研发效能 金融科技 券商 效能度量 研发效能度量

基于Ascend C的Matmul算子性能优化最佳实践

华为云开发者联盟

人工智能 性能优化 算子 Ascend

在Abaqus中施加恒定载荷应选择静态还是动态分析步?

思茂信息

载荷 abaqus 有限元分析

火山引擎数智平台VeDI:A/B实验互斥域流量分配体系上线

字节跳动数据平台

ab测试

Caffeine学习笔记

京东科技开发者

Microsoft Office 2019永久破解补丁 Mac/win

Rose

Final Cut Pro:视频剪辑新纪元,创意无限!

Rose

免费BT资源下载利器 BitComet(比特彗星)

Rose

adobe ai 2021功能介绍 及破解安装教程(Mac/win)

Rose

哪里有Axure RP 10激活码? Axure RP 10 for mac永久授权码分享

Rose

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章