

 写点什么

语音识别技术架构

收录了语音识别技术架构频道下的 50 篇内容

打破国外垄断，出门问问主导研发的端到端语音识别开源框架 WeNet 实践之路

端到端语音识别技术，如何更好的落地？

作者 : 刘燕

2021-10-20

将 BERT 用于语音识别！滴滴提出新无监督预训练框架，中文识别性能提升 10%

论文结果显示，通过简单的无监督预训练，中文语音识别任务能得到10%以上的性能提升。

作者 : AI前线小组策划: 刘燕

2019-11-01

2571

Facebook 开源低延迟在线自动语音识别框架：速度更快，错误率更低

Facebook发布低延迟在线语音识别框架wav2letter@anywhere，吞吐量是ASR三倍

作者 : KHARI JOHNSON 译者: 李冬梅

2020-01-14

1468

端到端语音识别时代来临：网易杭州研究院的智能语音探索之路

近些年，伴随着深度学习技术的发展，语音识别技术经历了革命性的变化。

作者 : 蔡芳芳

2019-12-17

3223

年终解读：2017 年的语音识别，路只走了一半

这一年的人工智能大潮，无疑让更多人关注科大讯飞，关心在这样的潮流里，一家深耕语音识别的公司如何能获得更多业务和利润，如何能去迎合AI上升的趋势，从而满足人们对人工智能的所有期望。其实这一年，技术的进程还是和往年一样。

作者 : Tina

2018-01-09

3121

从算法到应用：滴滴端到端语音 AI 技术实践

本文介绍滴滴端到端语音AI技术实践经验。

作者 : DataFunTalk

2020-02-05

779

声网一站式智能语音识别方案升级语音审核“快准省”

近日，我们的“一站式智能语音识别方案”将实现升级。

作者 : 声网

2020-04-10

Kaldi 之父 Daniel Povey：我为什么选择在小米开发下一代 Kaldi？

Kaldi之父Daniel Povey认为，当前语音识别系统的高精准度仅针对特定语音类型。

作者 : 李冬梅

2020-03-30

1994

解读智能语音技术的 2020：跨语种语音技术成高频关键词，商业化“加速度”落地

智能语音技术在2020年的发展是“加速度”的，在突破性的技术创新之外，很多之前还在研究阶段的语音技术也已经在商业系统中得到落地。

作者 : 刘燕

2021-01-04

智能语音技术，让我们“动口不动手”

语音识别技术在百度早已纳入需求向服务转变的进程中，其实百度语音技术就在我们身边：搜索、地图、应用、音乐、浏览器等领域无处不彰显语音技术的风采，也是它让我们进入了“动口不动手”的时代。

作者 : Xue Liang

2015-11-02

1377

百度技术沙龙第 36 期回顾：语音技术现状与趋势（含资料下载）

在3月16日由@百度主办、@InfoQ负责策划组织和实施的第36期百度技术沙龙活动上，百度多媒体部门的语音技术研发工作的负责人贾磊和IBM中国研究院信息和用户技术（IUT）部的高级经理秦勇分享了在语音技术的的经验与实践，话题涉及“语音技术的发展与应用”，以及“利用数据做聪明的决定”等。本文将对他们各自的分享做下简单的回顾，同时提供相关资料的下载。

作者 : 水羽哲

2013-03-18

2342

科大讯飞在 AI 源头技术上的突破，实现系统性创新

科大讯飞高级副总裁胡国平在1024开发者节上介绍，如何在AI的技术层面进行源头技术突破和多技术融合，以此来推动实现系统性创新。

作者 : Xue Liang

2021-11-07

奇富科技推出智能语音模型 Qifusion，语音识别准确率可达 93% 以上

奇富科技引入了全自研Qifusion框架模型，并将其集成到智能营销及贷后提醒等业务场景中。

作者 : 赵明华

2024-07-10

滴滴披露语音识别新进展：基于 Attention 显著提升中文识别率

近期，滴滴的一篇论文被低调提交到了预印版论文平台 arXiv。在这篇名为《A comparable study of modeling units for end-to-end Mandarin speech recognition》的论文中，滴滴公布了其在基于 attention 的端对端中文语音识别技术上取得的最新研究成果。论文中，滴滴 attention 中文语音识别系统直接以常用的 5000 多中文汉字作为建模单元，实现了语言信息和声学信息的联合建模。AI 前线第 33 篇论文导读，将为你带来这篇论文的精彩解读。

作者 : 蔡芳芳

2018-05-28

1630

智能语音技术在字节跳动内容平台的演进和应用实践

AI 技术正在成为辅助内容生产和传播的“利器”。

作者 : 刘燕

2021-09-08

做好语音翻译无捷径：语音识别是前提，实时翻译亟待攻破

语音翻译已经不是一个新鲜词汇，但仍具有巨大的应用潜力等待挖掘

作者 : 陈利鑫

2019-05-10

3885

Deep Speech：百度硅谷人工智能实验室利用单学习算法实现英语和汉语识别

据Inside Bigdata网站12月27日报道，百度研究院(baidu research)宣布硅谷人工智能实验室 (SVAIL)已经开发出了一种新型语音识别系统——深度语音识别系统(Deep Speech 2)。该系统能通过简单学习算法准确的识别英语和汉语。Deep Speech通过使用一个单一的学习算法具备准确识别英语和汉语的能力。成果已经发表在相关论文中：Deep Speech 2: End-to-End Speech Recognition in English and Mandarin。

作者 : 张天雷

2016-01-05

3066