写点什么

微软开源 ONNX Runtime 模型以加速 Google BERT

  • 2020-01-22
  • 本文字数:979 字

    阅读完需:约 3 分钟

微软开源ONNX Runtime模型以加速Google BERT

微软人工智能研究院 1 月 21 日称计划开源 BERT 自然语言模型优化版本,该模型可以与 ONNX Runtime 推理引擎配合使用。在为 Bing 搜索引擎提供语言表达功能时,Microsoft 使用相同的模型来降低 BERT 的延迟。该模型“为 Bing 用户带来了最佳搜索体验” ,去年秋天发表的一篇论文中对该模型进行了详细介绍。



论文地址:https://azure.microsoft.com/en-us/blog/bing-delivers-its-largest-improvement-in-search-experience-using-azure-gpus/


公司发言人表示,这意味着开发人员可以使用 ONNX Runtime 和 Nvidia V100 GPU 大规模部署 BERT,而延迟只有 1.7 毫秒,这样的性能表现过去只能在大型科技公司中实现。


2017 年,微软与 Facebook 合作创建了 ONNX,以推动跨 AI 硬件(如半导体)和软件(如机器学习框架)之间的互操作性。BERT 优化工具增加了许多 ONNX Runtime 加速器,例如 Nvidia TensorRT 和英特尔 OpenVINO。使用 ONNX 标准意味着优化后的模型可以与 PyTorch,TensorFlow 和其他流行的机器学习模型一起运行,这种改善是得益于 Azure AI 与微软 AI 研究院的合作。


“由于 BERT 模型主要由堆叠 Transformer 单元组成,因此我们通过将多个基本运算符的关键子图融合到 CPU 和 GPU 的单个内核(包括自注意力层、LayerNormalization 和 Gelu 层)中来优化每个单元。微软高级项目经理 Emma Ning 在博客中称:“这大大减少了许多基本计算之间的内存复制。”



对于微软来说,这是其在自然语言领域取得的最新突破,但这并不是业界第一次尝试优化 BERT。大约一年前,Microsoft AI 研究人员还发布了 MT-DNN,一款基于 Transformer 提升 GLUE 语言模型性能基准的模型。


一位业内人士称,通过使用像 BERT 和 MT-DNN 等基于 Transformer 的模型,使自然语言模型在文本生成等任务中表现更优越,是 2019 年 AI 取得的最大成就之一。



微软在其他自然语言开发上也取得了一定进展。在 2019 年温哥华 NeurIPS 上,微软和浙江大学联合发布了语音合成系统 FastSpeech,与自回归的 Transformer TTS 相比,FastSpeech 将梅尔谱的生成速度提高了近 270 倍,将端到端语音合成速度提高了 38 倍,单 GPU 上的语音合成速度达到了实时语音速度的 30 倍。 在 2019 年夏季,微软还推出了会话 AI 助手工具包 Icecaps。


原文链接:


https://venturebeat.com/2020/01/21/microsoft-open-sources-onnx-runtime-model-to-speed-up-googles-bert/


2020-01-22 13:355362

评论

发布
暂无评论
发现更多内容

跟着卷卷龙一起学Camera--延迟01

卷卷龙

ISP camera 10月月更

大数据ELK(二十八):制作Dashboard

Lansonli

10月月更

深入理解 Go 语言的一等函数及其应用

宇宙之一粟

函数 Go 语言 10月月更 匿名函数

22道js输出顺序问题,你能做出几道

loveX001

JavaScript

华为云从入门到实战 | 云关系数据库备份、恢复及存储容灾服务

TiAmo

华为 华为云 云开发 10月月更

这几道const和iota的面试题你能做对吗?

王中阳Go

Go 面试题 const 10月月更 go基础

微信朋友圈的高性能复杂度分析

乖乖IvyShine

Java编程之方法重写

魏铁锤

后端 java 编程 10月月更

Docker Swarm从部署到基本操作

程序员欣宸

Docker Docker Swarm 10月月更

渲染农场是什么_云渲染农场优缺点有哪些?

Renderbus瑞云渲染农场

云渲染 云渲染农场 渲染农场 Renderbus瑞云渲染

Java核心之多态

魏铁锤

java 编程 10月月更

腾讯前端高频面试题合集

loveX001

JavaScript

一天梳理React面试高频知识点

beifeng1996

React

美团前端vue面试题(边面边更)

bb_xiaxia1998

Vue

架构实战训练营模块 2 作业

Geek_b35d92

跟着卷卷龙一起学Camera--延迟03

卷卷龙

ISP camera 10月月更

CorelDRAW 2019 软件应用项目(三)

张立梵

设计师 CorelDRAW 2022 10月月更

模块二作业:微信朋友圈复杂度分析

愚人夜行者

React-Hooks怎样封装防抖和节流-面试真题

beifeng1996

React

java之字节型文件流笔记

魏铁锤

java 编程 10月月更

80%的前端开发都答不上来的js异步面试题

loveX001

JavaScript

Qt|QListWidget实现自定义Item效果

中国好公民st

c++ qt 10月月更

架构实战训练营模块 2 作业

atcgnu

架构实战训练营模块 2 作业

Geek_b35d92

$nextTick的原理是什么-vue面试进阶

bb_xiaxia1998

Vue

面试官:深度不够,建议回去深挖

小傅哥

Java 程序员 面试 小傅哥 招聘

Vue是怎样监听数组的变化的?

bb_xiaxia1998

Vue

微信朋友圈的高性能复杂度分析

Louis

跟着卷卷龙一起学Camera--延迟02

卷卷龙

ISP camera 10月月更

TLS加密远程连接Docker

程序员欣宸

Docker 容器安全 10月月更

React-hooks面试考察知识点汇总

beifeng1996

React

微软开源ONNX Runtime模型以加速Google BERT_文化 & 方法_KHARI JOHNSON_InfoQ精选文章