写点什么

比 BERT 提升近 10 个点!百度预训练模型 ERNIE 登顶 GLUE 榜单

  • 2019-12-11
  • 本文字数:1079 字

    阅读完需:约 4 分钟

比BERT提升近10个点!百度预训练模型ERNIE登顶GLUE榜单

北京时间 12 月 10 日,百度预训练模型界 ERNIE 在自然语言处理领域权威数据集 GLUE 中登上榜首,并以 9 个任务平均得分首次突破 90 大关刷新该榜单历史,其超越微软 MTDNN-SMART, 谷歌 T5、ALBERT 等一众国际顶级预训练模型的表现。



众所周知,通用语言理解评估基准 GLUE 是自然语言处理领域最权威的排行榜之一,由纽约大学、华盛顿大学、谷歌 DeepMind 等机构联合推出,以其涵盖大量不同类型的 NLP 任务,包括自然语言推断、语义相似度、问答匹配、情感分析等 9 大任务,成为衡量自然语言处理研究进展的行业标准。因此,吸引了谷歌、Facebook、微软等国际顶尖公司以及斯坦福大学、卡耐基·梅隆大学等顶尖大学参加。GLUE 排行榜的效果,在一定程度上成为了衡量各机构自然语言处理预训练技术水平最重要的指标之一。此次能够超越国际顶尖公司及高校荣登榜首,背后是百度 NLP 技术的长足积累。


2018 年底以来,以 BERT 为代表的预训练模型大幅提升了自然语言处理任务的基准效果,取得了显著技术突破,基于大规模数据的预训练技术在自然语言处理领域变得至关重要。众 AI 公司纷纷发力预训练领域,相继发布了 XLNet、RoBERTa、ALBERT、T5 等预训练模型。百度也先后发布了 ERNIE 1.0、ERNIE 2.0,在 16 个中英数据集上取得了当时的 SOTA。


从 GLUE 排行榜上来看,BERT 使用预训练加微调的方式,相对过往的基线成绩大幅提升各任务的效果,首次突破了 80 大关。XLNet、RoBERTa、T5、MT-DNN-SMART 等模型则分布在 88-89 分范围,人类水平则是 87.1。


百度 ERNIE 此次登顶,成为首个突破 90 大关的模型,并在 CoLA、SST-2、QQP、WNLI 等数据集上达到 SOTA。相对 BERT 的 80.5 的成绩,提升近 10 个点,取得了显著的效果突破。



百度 ERNIE 2.0 原理示意图


ERNIE 2.0 持续学习的语义理解框架, 支持增量引入不同角度的自定义预训练任务,通过多任务学习对模型进行训练更新,每当引入新任务时,该框架可在学习该任务的同时,不遗忘之前学到过的信息。


此次登顶的模型主要基于 ERNIE 2.0 持续学习语义理解框架下的系列优化。引入更多新预训练任务, 例如引入基于互信息的动态边界掩码算法。对预训练数据和模型结构也做了精细化调整。


同时,百度 ERNIE 2.0 的论文(https://arxiv.org/abs/1907.12412)已被国际人工智能顶级学术会议 AAAI-2020 收录,AAAI-2020 将于 2020 年 2 月 7 日-12 日在美国纽约举行, 届时百度的技术团队将会进一步展示近期的技术成果。


据悉,百度 ERNIE 预训练技术已广泛地应用于公司内外多个产品和技术场景,其在百度搜索、小度音箱、信息流推荐等一系列产品应用中提升技术效果和用户体验的同时也在逐步赋能各行各业。


2019-12-11 15:242439
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 589.9 次阅读, 收获喜欢 1981 次。

关注

评论

发布
暂无评论
发现更多内容

2021BAT大厂Android社招面试题,移动开发技术总结

android 面试 移动开发

海量数据,极速体验——TDSQL-A核心架构详解来了 ​

腾讯云数据库

数据库 tdsql

2021Android高级面试题汇总解答,阿里内部Android应届生就业宝典

android 面试 移动开发

微服务网关Gateway实战

Fox666

微服务 Gateway SpringCloud Gateway Spring Cloud Gateway

大天使之剑H5游戏超详细图文架设教程

echeverra

H5游戏 H5

2021一位Android中级程序员的跳槽面经,成功拿下大厂offer

android 面试 移动开发

2021Android面试真题精选干货整理,准备Android面试

android 面试 移动开发

2021Android面试题知识点总结,层层深入

android 面试 移动开发

SOA + 汽车智能硬件 = 无限可能

SOA开发者

软件 物联网 SOA 汽车

CSS中content属性的妙用

echeverra

CSS

Android技术分享| 一行代码实现安卓屏幕采集编码

anyRTC开发者

音视频 WebRTC 移动开发 Android技术分享 屏幕采集编码

2021Android进阶者的新篇章,移动开发框架

android 面试 移动开发

如何写好倒计时

echeverra

JavaScript

TDSQL-C的内核关键技术深入解读

腾讯云数据库

数据库 tdsql

拓路前行-TDSQL追求极致体验的这一路

腾讯云数据库

数据库 tdsql

腾讯云 CIF 工程效能峰会,10 月 19 - 20 日震撼来袭!

CODING DevOps

腾讯云 DevOps 云原生 云开发 CIF

Vite + Vue3 + OpenLayers 手动激活地图

德育处主任

大前端 地图 vite Vue3 openlayers

2021Android面试笔试总结,这操作真香

android 面试 移动开发

浅析可视化分析技术

郑州埃文科技

2021Android高级面试题总结,憋个大招

android 面试 移动开发

车路协同赋予交通感知,数字技术让管理透明可视

一只数据鲸鱼

车联网 数据可视化 智慧城市 智慧交通

2021Android高级面试题,零基础也能看得懂

android 面试 移动开发

博客被阮一峰引流后,我对“大数据”的分析与思考

echeverra

博客

2021Android面试心得,透彻解析

android 面试 移动开发

2021BAT大厂Android社招面试题,Android程序员校招蚂蚁金服

android 面试 移动开发

2021Android高级面试题及答案,30岁转行程序员

android 面试 移动开发

第 2 章 -《Linux 一学就会》- Linux 基本命令操作

学神来啦

Linux 运维 linux云计算

SOA + 汽车智能硬件 = 无限可能

SOA开发者平台

SOA 软件定义汽车

2021Android高级面试题及答案,2021最新Android面试题目

android Android面试

网站URL如何SEO优化

echeverra

SEO

2021Android面试心得,Android详解

android 面试 移动开发

比BERT提升近10个点!百度预训练模型ERNIE登顶GLUE榜单_AI&大模型_高高_InfoQ精选文章