【锁定直播】字节、华为云、阿里云等技术专家讨论如何将大模型接入 AIOps 解决实际问题,戳>>> 了解详情
写点什么

腾讯“混元”AI 大模型刷新 CLUE 分类榜历史记录

  • 2022-04-29
  • 本文字数:755 字

    阅读完需:约 2 分钟

腾讯“混元”AI大模型刷新CLUE分类榜历史记录

4 月 29 日,腾讯“混元”AI 大模型在 CLUE(中文语言理解评测集合)分类榜中取得第一名,分数突破 80.888 分,接近人类语言理解能力,刷新该榜单历史记录。这是“混元”AI 大模型在斩获跨模态检索榜单大满贯后,取得的又一突破性进展,展现了该模型在自然语言处理上的实力。



随着国内人工智能技术的不断发展,NLP(自然语言处理),即如何实现人类和计算机之间的语言交互,成为预训练模型的核心能力之一。当前,越来越多的企业和组织投入到该领域的研究当中,在各大 AI 榜单上的竞争也非常激烈。

 

作为中文最具权威的自然语言理解榜单之一,CLUE 包括文本相似度、分类、自然语言理解、阅读理解等 9 项任务, 涵盖搜索、广告、推荐等业务场景,对预训练模型的通用理解能力及知识迁移能力要求都很高。

 

腾讯“混元”技术团队模拟“人”的学习习惯,首次提出“课程学习”的训练方法,有效提升模型性能。具体来说,就是让模型进行从小到大、从易到难的“渐进式”学习。这种方式不仅使得模型通用性和复用性更好,还能有效缩减训练成本,让大模型更快地学会更多的知识。

 

此次登顶 CLUE 分类榜榜首,一方面代表了“混元”AI 大模型在自然语言理解领域的实力得以验证,达到业内领先水平;另一方面也预示着混元正在通过技术创新实现更为全面的能力,能够为行业应用和学术研究带来更多长期价值。

 

据了解,“混元”AI 大模型同时具备自然语言理解、计算机视觉、多模态内容理解、文案生成、视觉生成等能力。同时,借助腾讯太极机器学习平台的 GPU 算力和训练加速框架,“混元”实现了稳定、高效的模型迭代。

 

目前,“混元“AI 大模型已经广泛应用于腾讯微信搜索、腾讯广告等业务场景,提升了搜索体验和广告推荐精准度。未来,随着研究的进一步完善和业务实践的不断深入,“混元”AI 大模型将赋能更多业务场景,帮助精准理解用户需求,更好地服务用户。

 

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2022-04-29 13:593301

评论

发布
暂无评论
发现更多内容

​太厉害了,终于有人把Spring条件注解讲明白了,送你上岸!

飞飞JAva

spring

A “word-wrap” functionality(一个字符串包裹函数)

HoneyMoose

BPF 之巅:洞悉 Linux 系统和应用性能

博文视点Broadview

鹅厂疯子整理了万字Java笔记!小白:硬核资源基础知识已入门

牛哄哄的java大师

Java Object

SpringCloud-技术专题-Feign组件基本使用(2)

洛神灬殇

springmvc SpringCloud Hystrix Fegin

了解代理服务器

进击的梦清

nginx Linux 运维 代理原理

fastadmin+xunsearch题库系统搭建教程

一颗小树

php thinkphp fastadmin xunsearch 题库系统

网络攻防学习笔记Day1

穿过生命散发芬芳

5月日更 网络攻防

已跪!Java全能笔记爆火,Java教程/Java包/Eclipse安装指南全有

牛哄哄的java大师

Java

InfoQ & 声网Agora 技术开放日邀请函

Jessie

音视频 声网

【LeetCode】员工的重要性Java题解

Albert

算法 LeetCode 5月日更

聆听极致 ——声网 Agora

cv君

算法 音视频 科技 声网 引航计划

万字长文讲述我是怎样保送清华的|寒门学子的奋斗史(四)

程序猿石头

程序员 码农 逆袭 大学总结 读书总结

技术探索系列 - 轻松带你掌握 JMM(1)

洛神灬殇

Java JVM JMM 并发 5月日更

Serverless的定义

刘宇

又一个免费良心的下载站,答应我:别再下到流氓软件了。

彭宏豪95

ios 效率 工具 下载 4月日更

高校软件IT专业大学生课外培训调查问卷

穿过生命散发芬芳

行业分析能力考核

手机屏幕投屏到桌面的离线方案

黄敏

北美亚特兰大一金融服务公司面试总结

HoneyMoose

你的烂代码终于有了解决方案

博文视点Broadview

Excel用户如何学习数据分析语言DAX?

博文视点Broadview

音频变速变调原理及soundtouch代码分析

floer rivor

音视频

IT 专业大学生被培训机构“渗透”情况调查

梦想橡皮擦

签约计划

本文标题不能描述本文内容

小天同学

读书 哲学 读后感 4月日更

当代软件IT大学生的技术学习之路

Nydia

签约计划

引入:从云计算到Serverless

刘宇

2021年十大突破性技术

石云升

读书笔记 5月日更

将本地文件/文章上传到 GitHub 的流程

彭宏豪95

git GitHub 效率 编程

【得物技术】网络优化——域名解析原理&实践

得物技术

网络 域名解析 域名 得物技术 实践

对于即将工作的IT大学生,该如何变强?

cv君

程序人生 IT 科技 问卷 有意义

面试:某云面试题目整理

程序员架构进阶

Java 面试 自我提升 28天写作 4月日更

腾讯“混元”AI大模型刷新CLUE分类榜历史记录_服务革新_赵钰莹_InfoQ精选文章