2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

微软开源 ONNX Runtime 模型以加速 Google BERT

  • 2020-01-22
  • 本文字数:979 字

    阅读完需:约 3 分钟

微软开源ONNX Runtime模型以加速Google BERT

微软人工智能研究院 1 月 21 日称计划开源 BERT 自然语言模型优化版本,该模型可以与 ONNX Runtime 推理引擎配合使用。在为 Bing 搜索引擎提供语言表达功能时,Microsoft 使用相同的模型来降低 BERT 的延迟。该模型“为 Bing 用户带来了最佳搜索体验” ,去年秋天发表的一篇论文中对该模型进行了详细介绍。



论文地址:https://azure.microsoft.com/en-us/blog/bing-delivers-its-largest-improvement-in-search-experience-using-azure-gpus/


公司发言人表示,这意味着开发人员可以使用 ONNX Runtime 和 Nvidia V100 GPU 大规模部署 BERT,而延迟只有 1.7 毫秒,这样的性能表现过去只能在大型科技公司中实现。


2017 年,微软与 Facebook 合作创建了 ONNX,以推动跨 AI 硬件(如半导体)和软件(如机器学习框架)之间的互操作性。BERT 优化工具增加了许多 ONNX Runtime 加速器,例如 Nvidia TensorRT 和英特尔 OpenVINO。使用 ONNX 标准意味着优化后的模型可以与 PyTorch,TensorFlow 和其他流行的机器学习模型一起运行,这种改善是得益于 Azure AI 与微软 AI 研究院的合作。


“由于 BERT 模型主要由堆叠 Transformer 单元组成,因此我们通过将多个基本运算符的关键子图融合到 CPU 和 GPU 的单个内核(包括自注意力层、LayerNormalization 和 Gelu 层)中来优化每个单元。微软高级项目经理 Emma Ning 在博客中称:“这大大减少了许多基本计算之间的内存复制。”



对于微软来说,这是其在自然语言领域取得的最新突破,但这并不是业界第一次尝试优化 BERT。大约一年前,Microsoft AI 研究人员还发布了 MT-DNN,一款基于 Transformer 提升 GLUE 语言模型性能基准的模型。


一位业内人士称,通过使用像 BERT 和 MT-DNN 等基于 Transformer 的模型,使自然语言模型在文本生成等任务中表现更优越,是 2019 年 AI 取得的最大成就之一。



微软在其他自然语言开发上也取得了一定进展。在 2019 年温哥华 NeurIPS 上,微软和浙江大学联合发布了语音合成系统 FastSpeech,与自回归的 Transformer TTS 相比,FastSpeech 将梅尔谱的生成速度提高了近 270 倍,将端到端语音合成速度提高了 38 倍,单 GPU 上的语音合成速度达到了实时语音速度的 30 倍。 在 2019 年夏季,微软还推出了会话 AI 助手工具包 Icecaps。


原文链接:


https://venturebeat.com/2020/01/21/microsoft-open-sources-onnx-runtime-model-to-speed-up-googles-bert/


2020-01-22 13:355604

评论

发布
暂无评论
发现更多内容

误操作后快速恢复数据 binlog 解析为反向 SQL

GreatSQL

分享一个 ProHub 风格 logo 生成器

Immerse

Manus“撤退”,Fabarta“补位”!你的专属智能助手来了!

Fabarta

人工智能 专属智能体

第十三章 SEO结构化数据与SERP

溪抱鱼

SEO SEO 优化

WebGL开发数字孪生项目

北京木奇移动技术有限公司

软件外包公司 webgl开发 webgl外包

待办事项列表:团队组织有序的秘密

俞凡

生产力

MyEMS开源能源管理系统核心代码解读015

开源能源管理系统

开源 代码解读 能源管理系统

【跨国数仓迁移最佳实践2】MaxCompute SQL执行引擎对复杂类型处理全面重构,保障客户从BigQuery平滑迁移

阿里云大数据AI技术

人工智能 大数据 数据处理 数据迁移

简单聊聊区块链定义以及行业是否需要用到堡垒机

行云管家

区块链 网络安全 堡垒机

App开发者:如何打造一条不“堵车”的高效开发流水线?

FinFish

APP开发 小程序容器 敏捷迭代 小程序技术 热更新技术

目前马鞍山正规等保测评公司叫什么?在哪里?

行云管家

等保 等保评测

零售业AI遍地开花?小心踩中“伪AI”的坑!

第七在线

融资近10亿元,“众擎机器人”连续完成Pre-A++与A1轮融资,京东领投

财见

MyEMS开源能源管理系统核心代码解读016

开源能源管理系统

开源 代码解读 能源管理系统

数字化转型的 4+1 种典型组织结构:怎么选才对?

优秀

数字化转型 数字化

等保测评对互联网企业的重要作用和影响

等保测评

黑龙江地区等保测评中常用的安全产品

等保测评

烟草行业专卖人员画像与队伍考评系统(信创版)上线运行

中烟创新

区块链 Web3 项目的开发方案

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

AI口语App的开发方案

北京木奇移动技术有限公司

软件外包公司 AI口语练习 AI英语学习

电力行业新助力:RFID智能工具车助力电力设备盘点与维护

斯科信息

RFID解决方案 斯科信息 RFID技术

客户为纲,万目皆张——中烟创新致烟草客户的一封信

中烟创新

为什么越来越多的出海企业开始重视海外舆情监测?

沃观Wovision

出海企业 舆情监测 海外舆情监控 沃观Wovision 舆情监测系统

浙江省科学技术厅印发《浙江省加快推动“人工智能+科学”创新发展行动计划(2025-2027年)》

ModelWhale

政策 科学智能 浙江省科学技术厅

[大厂实践] Netflix 键值数据抽象层实践

俞凡

架构 大厂实践

彩讯做客InfoQ直播间:AI原生思想驱动Agent平台开发

彩讯股份300634

鸿蒙一夏|暑期出行问问小艺,解锁亲子游新“享”法

新消费日报

WebGL开发3D展览馆

北京木奇移动技术有限公司

软件外包公司 webgl开发 webgl外包

如何打造 App 的差异化竞争优势?别再卷功能了!

Speedoooo

APP开发 小程序容器 小程序技术 app生态共建

爆款预测模型:如何用淘宝店铺API数据识别潜力商品?

tbapi

淘宝API 天猫API 淘宝店铺所有商品API 天猫店铺所有商品API

微软开源ONNX Runtime模型以加速Google BERT_文化 & 方法_KHARI JOHNSON_InfoQ精选文章