Facebook发布部署在CPU上的高效、实时文本转语音系统,速度提高160倍

2020 年 5 月 21 日

Facebook发布部署在CPU上的高效、实时文本转语音系统,速度提高160倍

实时文本语音转换通常要在 GPU 或其他专用硬件上实现,但现在,在 CPU 上也可以实现。

近日,Facebook AI 宣布已经在 CPU 服务器是上创建和部署了一款实时神经网络文本转语音系统,音频质量能达到人类水平。以前的系统通常依赖于 GPU 或其他专用硬件来实时生成高质量的语音,但通过将模型进行广泛地优化,该系统可以将合成速度比基准速度提高 160 倍,且能够在 500 毫秒内在 CPU 上生成一秒钟的音频。据介绍,该系统已经部署在了 Facebook 的视频通话设备 Portal 上,并可以在 Facebook 多个应用程序上使用,包括支持视障人士阅读和 VR 体验。

当前的文本语音转换系统(TTS)在利用神经网络模拟人类语音方面已经做过很多尝试,为了生成类人音频,一秒钟的音频需要 TTS 系统输出 2.4 万个样本,有时甚至更多。高质量模型的体量和复杂性要求系统进行大量计算,而这些计算通常需要在 GPU 或其他专用硬件上运行。

接下来,Facebook AI 对该系统如何解决核心效率挑战来实现大规模部署的问题进行了详细介绍。

基于神经网络的 TTS 管道

FacebookAI 设计了一个管道,该管道将四个组件(每个组件专注于语音的不同方面)有效地组合成一个强大而灵活的系统,四个组件包括:

原文链接:【 https://www.infoq.cn/article/xpH2L6hvsoEAGXcll8aL 】。未经作者许可,禁止转载。

登录后可解锁全站优质内容

免费畅享技术公开课、顶尖技术团队访谈、一线互联网大厂技术实践

文章
视频
电子书
研究报告
立即登录
2020 年 5 月 21 日 14:23 837
用户头像

发布了 136 篇内容,共 309 次阅读,收获喜欢 1 次。

关注

评论 1 条评论

发布
用户头像
Facebook在改进语音交互系统方面不断地进行着尝试。
2020 年 05 月 21 日 14:29
回复
没有更多评论了
发现更多内容

《Java并发编程的艺术》读书笔记1:说说并发编程

Jason

多线程 并发

热潮-区块链的价值能够体现在哪些方面?

CECBC区块链专委会

区块链技术 标准化 应用价值

面试这么撩准拿offer,HashMap深度学习,扰动函数、负载因子、扩容拆分,原理和实践验证,让懂了就是真的懂!

小傅哥

Java 面试 hashmap 负载因子 扰动函数

品质网络的迭变之路,以及运营商的未来之匙

脑极体

如何让区块链技术能够更好赋能数字社会建设

CECBC区块链专委会

区块链 数字经济

十年一梦,小米的原罪得到救赎了吗?

脑极体

【API进阶之路】帮公司省下20万调研费!如何巧用情感分析API实现用户偏好调研

华为云开发者社区

反馈 API 华为云 API Explorer平台 用户调研

ARTS 打卡(20.07.20-20.07.26)

小王同学

程序的机器级表示-控制

引花眠

计算机基础

ARTS打卡 第11周

引花眠

ARTS 打卡计划

关于 Bash 的 10 个常见误解

柴锋

bash Linux DevOps Shell

学了那么多技术,为何依然成不了架构师

菜根老谭

架构设计原则

边云协同!EM-BOX视频分析盒加速安全生产场景落地AI应用

百度大脑

人工智能 人脸识别 图像识别 百度大脑 人体识别

Suricata-流的处理

Phantasm

网络安全 suricata flow

设计模式之——JDK动态代理的源码分析

诸葛小猿

动态代理 cglib 代理模式 Proxy

微服务、DDD

chenzt

Java 常见的几种 OOM

hepingfly

OOM java;

ARTS打卡Week 10

teoking

那些不可貌相的代码规范

双儿么么哒

代码质量

当实证资产定价遇上机器学习

分析101

人工智能 机器学习 金融科技 金融 资产定价

吃灰的旧显示器别扔!

Sicolas Flamel

学习方法 随笔杂谈

图文讲解 AQS ,一起看看 AQS 的源码……(图文较长)

liuzhihang

AQS jdk源码 源码阅读 java 并发

应用开发基础之-并发编程

superman

一次好的聊天可以超过自己努力啃几周的书籍

良知犹存

程序人生

Requests模块基本操作

骆俊

十多位全球技术专家,为你献上近十个小时的.Net微服务介绍

newbe36524

微服务 .net core netcore 容器化

计算机网络基础(十六)---传输层-可靠传输的基本原理

书旅

计算机网络 网络 协议族 网络层

ARTS-WEEK10

一周思进

ARTS 打卡计划

深化区块链技术的应用 体现其价值产业发展良机

CECBC区块链专委会

区块链技术 数字经济

BGP、OSPF、MPLS路由协议RFC分享

Phantasm

求刚好大于当前数组组合,Code Review最佳实践,JVM框架原理,JVM垃圾回收原理 John 易筋 ARTS 打卡 Week 12

John(易筋)

Code Review ARTS 打卡计划 JVM虚拟机原理 JVM垃圾回收原理 Array算法

Facebook发布部署在CPU上的高效、实时文本转语音系统,速度提高160倍-InfoQ