2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

通义千问升级旗舰模型 Qwen-Max,性能接近 GPT-4o

  • 2024-09-19
    北京
  • 本文字数:353 字

    阅读完需:约 1 分钟

大小:204.13K时长:01:09
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9 月 19 日云栖大会,阿里云 CTO 周靖人宣布,通义旗舰模型 Qwen-Max 全方位升级,性能接近 GPT-4o。通义官网和通义 APP 的后台模型均已切换为 Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用 Qwen-Max 的 API。



相比上一代模型,Qwen-Max 在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准上,Qwen-Max 表现接近 GPT-4o,数学能力、代码能力则超越了 GPT-4o。数学和代码所代表的推理能力是大模型智能水平的最重要体现。



相比 2023 年 4 月的初代通义千问大模型,Qwen-Max 的理解能力提升 46%、数学能力提升 75%、代码能力提升 102%、幻觉抵御能力提升 35%、指令遵循能力提升 105%,模型与人类偏好的对齐水平更是有了质的飞跃,提升了 700%以上。

2024-09-19 21:297638

评论

发布
暂无评论
发现更多内容

基于远程开发环境部署Django与开发者空间GaussDB的实践应用

华为云开发者联盟

华为开发者空间

迈出万物互联的一小步:仓颉版TCPGroupChat群聊实现

华为云开发者联盟

仓颉 华为开发者空间

DApp极速开发指南:7天搞定Solidity合约+React前端全栈实战

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 代币开发 交易所开发公链开发

评估LLM标注可靠性:人口偏见与模型解释

qife122

自然语言处理 可解释AI

技术文档 | 使用 Pulsar Functions 构建实时 AI Pipeline

AscentStream

Machine Learning pulsar

告别碎片化输入:TextIn xParse如何为RAG打造「零损耗」知识管道

合合技术团队

人工智能 算法 #大数据

直播预告 | 您的数据能喂给AI了吗?让GenAI读懂企业语言——产品分享会:矩阵起源MatrixOne Intelligence产品独家解析

MatrixOrigin

基于偏置图采样的关联产品推荐优化

qife122

图神经网络 数据采样

从v3.1到v4.3,OceanBase稳定支撑快手PB级核心业务场景

老纪的技术唠嗑局

运维 数据库设计 OceanBase 社区版 mysql'

混合开发范式重构:FinClip驱动Native+小程序跨端生态进化

xuyinyin

强化大型语言模型复杂指令推理能力的新方法

qife122

大型语言模型 指令跟随

DataKit 采集器敏感信息加密最佳实践

观测云

可观测性

基于开发者空间OpenGauss数据库的分区表项目实践

华为云开发者联盟

opengauss 华为开发者空间

FocalPO:通过聚焦正确偏好排序增强偏好优化技术

qife122

机器学习 偏好优化

基于华为开发者空间,仓颉宏实现语言集成查询LINQ

华为云开发者联盟

opengauss 华为开发者空间

海外舆情监测系统能帮企业做什么?

沃观Wovision

海外舆情监控 沃观Wovision 舆情监测系统

《AI-Assisted Programming》读后感

codists

Python

语音技术跨学科研究新趋势

qife122

语音识别 自然语言理解

Sunrun漏洞披露计划(VDP)正式上线 - 携手共建更安全的未来

qife122

漏洞赏金 漏洞披露

[鸿蒙征文]钢琴和弦小工具

大展红图

鸿蒙 音乐 HarmonyOS HarmonyOS NEXT 钢琴

知识蒸馏提升多任务学习收敛效果

qife122

机器学习 多任务学习

【IoTDB 线上小课 18】Apache 软件基金会是什么?开源世界的“超级孵化器”!

Apache IoTDB

使用DPO在SageMaker中定制Nova模型

qife122

人工智能 DPO优化

在Python代码中安全隔离依赖项的沙箱技术

qife122

Python安全 依赖隔离

今日立秋 | 夏尽秋来,万物从容

中烟创新

这个仓库堪称造轮子的鼻祖,建议看看!

Immerse

小样本学习在语言理解任务中的突破

qife122

自然语言处理 小样本学习

大模型训练故障恢复效率提升方案

qife122

机器学习 容错机制

Golang笔记之Redis

Hunter熊

golang redis 哈希 有序集合

合规交易所架构设计:冷热钱包隔离+zk-KYC方案

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o_生成式 AI_华卫_InfoQ精选文章