写点什么

微软开源 ONNX Runtime 模型以加速 Google BERT

  • 2020-01-22
  • 本文字数:979 字

    阅读完需:约 3 分钟

微软开源ONNX Runtime模型以加速Google BERT

微软人工智能研究院 1 月 21 日称计划开源 BERT 自然语言模型优化版本,该模型可以与 ONNX Runtime 推理引擎配合使用。在为 Bing 搜索引擎提供语言表达功能时,Microsoft 使用相同的模型来降低 BERT 的延迟。该模型“为 Bing 用户带来了最佳搜索体验” ,去年秋天发表的一篇论文中对该模型进行了详细介绍。



论文地址:https://azure.microsoft.com/en-us/blog/bing-delivers-its-largest-improvement-in-search-experience-using-azure-gpus/


公司发言人表示,这意味着开发人员可以使用 ONNX Runtime 和 Nvidia V100 GPU 大规模部署 BERT,而延迟只有 1.7 毫秒,这样的性能表现过去只能在大型科技公司中实现。


2017 年,微软与 Facebook 合作创建了 ONNX,以推动跨 AI 硬件(如半导体)和软件(如机器学习框架)之间的互操作性。BERT 优化工具增加了许多 ONNX Runtime 加速器,例如 Nvidia TensorRT 和英特尔 OpenVINO。使用 ONNX 标准意味着优化后的模型可以与 PyTorch,TensorFlow 和其他流行的机器学习模型一起运行,这种改善是得益于 Azure AI 与微软 AI 研究院的合作。


“由于 BERT 模型主要由堆叠 Transformer 单元组成,因此我们通过将多个基本运算符的关键子图融合到 CPU 和 GPU 的单个内核(包括自注意力层、LayerNormalization 和 Gelu 层)中来优化每个单元。微软高级项目经理 Emma Ning 在博客中称:“这大大减少了许多基本计算之间的内存复制。”



对于微软来说,这是其在自然语言领域取得的最新突破,但这并不是业界第一次尝试优化 BERT。大约一年前,Microsoft AI 研究人员还发布了 MT-DNN,一款基于 Transformer 提升 GLUE 语言模型性能基准的模型。


一位业内人士称,通过使用像 BERT 和 MT-DNN 等基于 Transformer 的模型,使自然语言模型在文本生成等任务中表现更优越,是 2019 年 AI 取得的最大成就之一。



微软在其他自然语言开发上也取得了一定进展。在 2019 年温哥华 NeurIPS 上,微软和浙江大学联合发布了语音合成系统 FastSpeech,与自回归的 Transformer TTS 相比,FastSpeech 将梅尔谱的生成速度提高了近 270 倍,将端到端语音合成速度提高了 38 倍,单 GPU 上的语音合成速度达到了实时语音速度的 30 倍。 在 2019 年夏季,微软还推出了会话 AI 助手工具包 Icecaps。


原文链接:


https://venturebeat.com/2020/01/21/microsoft-open-sources-onnx-runtime-model-to-speed-up-googles-bert/


2020-01-22 13:355298

评论

发布
暂无评论
发现更多内容

springboot整合工作常用框架中间件

恩爸编程

缓存 spring-cloud spring-boot 数据库、 消息列队

如何识别和管理项目干系人?实用指导与技巧

爱吃小舅的鱼

干系人识别 干系人分类 干系人需求

鸿蒙NEXT开发案例:计数器

zhongcx

鸿蒙应用示例:字体的使用和注意事项记录

zhongcx

鸿蒙

企业必备:8 款团队项目管理软件对比与推荐

易成研发中心

在Python中如何捕获HTTP请求的响应体

代码忍者

精选8款文档管理平台,口碑推荐

易成研发中心

不同团队如何实现登录系统 (just for fun)

八苦-瞿昙

just for fun

项目管理软件哪个好?8款热门推荐

爱吃小舅的鱼

鸿蒙 NEXT 开发案例:指尖抓阄

zhongcx

鸿蒙

从空投到OG NFT:全方位解读Lumoz主网上线前的活动

石头财经

一文读懂Lumoz主网上线前的活动红利:从空投到OG NFT

股市老人

一文读懂Lumoz主网上线前的活动红利:从空投到OG NFT

加密眼界

一文读懂Lumoz主网上线前的活动红利:从空投到OG NFT

大瞿科技

鸿蒙NEXT开发案例:抽奖

zhongcx

鸿蒙

项目管理系统软件对比测评:9 款工具优缺点一览

易成研发中心

Final Cut Pro X for Mac专业视频编辑软件

Mac相关知识分享

Visual Studio Code for Mac(微软代码编辑器)

Mac相关知识分享

探索《Crypto Rumble》游戏:核心玩法篇

股市老人

一文读懂Lumoz主网上线前的活动红利:从空投到OG NFT

BlockChain先知

每日一题(源码+文档+部署+讲解)

深圳亥时科技

智慧政协系统(源码+文档+部署+讲解)

深圳亥时科技

Sketch for mac(专业矢量绘图设计软件)

Mac相关知识分享

Navicat Premium 15 for Mac(数据库开发工具)中文版

Mac相关知识分享

AlDente Pro for Mac(电池最大充电限制软件)

Mac相关知识分享

从此告别代码泄露!提高Python性能的必备技巧

LLLibra146

Python 加密 代码保护 Cython

微软开源ONNX Runtime模型以加速Google BERT_文化 & 方法_KHARI JOHNSON_InfoQ精选文章