写点什么

华为预训练语言模型技术与行业应用

  • 2020-02-12
  • 本文字数:1068 字

    阅读完需:约 4 分钟

华为预训练语言模型技术与行业应用

AICon 北京 2019 大会上,魏俊秋讲师做了《华为预训练语言模型技术与行业应用》主题演讲,主要内容如下。


演讲简介


Google 于 2018 年发布预训练语言模型 BERT ,并在 11 项自然语言处理(NLP)任务上取得最好成绩,OpenAI 也在前后不久的时间发布了 GPT 和 GPT2 ,在自然语言生成任务上带来了惊人表现,自此,预训练语言模型开始得到学术界和工业界的极大关注,被认为是开启了自然语言处理的新篇章。各个公司和高校的研究团队陆续推出了新的预训练语言模型,并不断刷新 NLP 任务上的记录,如近期 CMU 和 Google 推出的 XLnet ,Facebook AI 推出的 RoBERTa ,百度推出的 ERNIE 等。华为诺亚方舟实验室语音语义团队与海思图灵、云 BU 等团队合作,共同研究大规模预训练模型的训练技术,取得三项杰出研究成果,分别对应中文自然理解任务、生成任务以及模型小型化:1. 发布了自己的中文预训练语言模型“哪吒”,在中文自然语言理解任务上达到先进水平;2. 推出基于预训练语言模型的诗歌生成“乐府”,在中文诗歌生成任务上取得惊人表现;3. 预训练语言模型的小型化工作“TinyBERT”,在压缩 BERT 参数 8 倍的前提下,远超 BERT 的表现并且将推断加速 10 倍,此工作受到了 MIT Technology Review 的报道,并且已经成功应用在华为手机及合作运营商的多项业务上。


本次演讲将介绍华为在预训练语言模型的研究和实践的以上三项工作,以及预训练语言模型在华为业务成功落地的应用分享。


内容大纲


  1. 预训练语言模型背景介绍


1.1 模型简介


1.2 发展历程


1.3 最新进展


  1. 哪吒模型技术剖析


2.1 技术分享


2.2 效果展示


  1. 乐府模型介绍与效果展示


3.1 模型简介


3.2 云端落地案例


3.3 生成效果展示


  1. TinyBERT 的技术分享与案例展示


4.1 华为端侧需求分析


4.2 基于知识蒸馏和数据增强的压缩


4.3 落地案例分析


  1. 预训练语言模型在华为的落地应用


5.1 用户观点挖掘


5.2 序列化推荐


  1. 结论与展望


听众受益点


  1. 对预训练语言模型研究的最新进展有一个概观的认识,学习其中的关键技术

  2. 对预训练语言模型在自然语言理解和生成任务上的惊人表现有一个直观的认识

  3. 为大规模深度学习模型的研发和落地提供一些案例与经验分享


讲师介绍


魏俊秋,华为高级技术专家。


魏俊秋博士目前是华为诺亚方舟实验室语音语义组的研究员,博士毕业于香港科技大学计算机系,本科毕业于南京大学。长期从事时空数据分析、主题模型、预训练语言模型的研究,在国际顶级会议和期刊,如:SIGMOD、TKDE、ICDM、TKDD 发表论文数篇,并曾在国际知名会议,如:COLING、BIG DATA、BiGComp、PAKDD 担任程序委员会委员。












完整演讲 PPT 下载链接


https://aicon.infoq.cn/2019/beijing/schedule


2020-02-12 19:41856

评论

发布
暂无评论
发现更多内容

一文搞懂Flink rocksdb中的数据恢复

shengjk1

大数据 flink源码

致远互联A6+Cloud C位出道 赋能中小企业乘风破浪

爱极客侠

SpringBoot系列(二):如何灵活使用SpringBoot

xcbeyond

Java 微服务 springboot

普通工程师简史

郭华

我国开启“逆袭战”,区块链的盛夏来了?

CECBC

云计算 区块链技术

别让非理性思维毁了你的人生

看山

随笔杂谈 非理性 认知偏差 自控术

微软看上的Rust 语言,安全性真的很可靠吗

华为云开发者联盟

数据库 开源 rust 安全 代码

奋斗在一线大城市的年轻人的生活工作实录(工厂蓝领篇)

Learun

程序员 软件开发 故事 企业信息化 短片小说

LeetCode题解:88. 合并两个有序数组,for循环合并数组+sort排序,JavaScript,详细注释

Lee Chen

大前端 LeetCode

网站域名备案怎么做?有哪些快速备案的方法?

姜奋斗

网站 备案 网站搭建 域名解析 网站平台

SpringBoot 系列(一):SpringBoot项目搭建

xcbeyond

Java 微服务 springboot

《深度工作》学习笔记(6)

石云升

读书笔记 专注 深度工作

关于微服务架构的一些思考

俊俊哥

微服务

害怕

shengjk1

随笔杂谈

Django中的session的使用

BigYoung

django session Cookie

《深度工作》学习笔记(完)

石云升

读书笔记 时间管理 专注 深度工作

DSN 主流项目调研 2——Sia和SAFE Network

AIbot

区块链 分布式存储 分布式文件存储 Sia SAFENetwork

Cobra 命令自动补全指北

郭旭东

cobra Go 语言

低/零代码会让程序员失业吗?

代码制造者

程序员 低代码 零代码 信息化 编程开发

流媒体云时代的声与色,融云铺就的桥与路

脑极体

流量明星翻车的“直播卖房”,为什么众盟做成了?

脑极体

手抖了

shengjk1

随笔杂谈

熬得住,人生路

shengjk1

随笔杂谈

Windows AD日志分析告警平台—WatchAD安装教程

BigYoung

监控 windows 日志 AD 告警

SpringBoot系列(三):SpringBoot特性_SpringApplication类(自定义Banner)

xcbeyond

Java 微服务 springboot Banner

解析中美数字货币竞争战略 | 构建属于“人类命运共同体”的货币体系

CECBC

数字货币 人民币

DSN 主流项目调研 3——Orbit数据库的故事

AIbot

区块链 分布式存储 IPFS 分布式文件 Orbit

Django查看操作数据库的执行命令

BigYoung

数据库 django 操作

JAVA位运算

彭阿三

Java 位运算

易观CTO郭炜:如何构建企业级大数据Ad-hoc查询引擎

易观大数据

数据平台、大数据平台、数据中台……你确定能分得清吗?

华为云开发者联盟

大数据 数据中台 开发者 数据湖 数据

华为预训练语言模型技术与行业应用_AICon_魏俊秋_InfoQ精选文章