阿里、蚂蚁、晟腾、中科加禾精彩分享 AI 基础设施洞见,现购票可享受 9 折优惠 |AICon 了解详情
写点什么

语音识别技术架构

收录了 语音识别技术架构 频道下的 50 篇内容

打破国外垄断,出门问问主导研发的端到端语音识别开源框架WeNet实践之路
打破国外垄断,出门问问主导研发的端到端语音识别开源框架 WeNet 实践之路

端到端语音识别技术,如何更好的落地?

将BERT用于语音识别!滴滴提出新无监督预训练框架,中文识别性能提升10%
将 BERT 用于语音识别!滴滴提出新无监督预训练框架,中文识别性能提升 10%

论文结果显示,通过简单的无监督预训练,中文语音识别任务能得到10%以上的性能提升。

Facebook开源低延迟在线自动语音识别框架:速度更快,错误率更低
Facebook 开源低延迟在线自动语音识别框架:速度更快,错误率更低

Facebook发布低延迟在线语音识别框架wav2letter@anywhere,吞吐量是ASR三倍

端到端语音识别时代来临:网易杭州研究院的智能语音探索之路
端到端语音识别时代来临:网易杭州研究院的智能语音探索之路

近些年,伴随着深度学习技术的发展,语音识别技术经历了革命性的变化。

年终解读:2017 年的语音识别,路只走了一半

这一年的人工智能大潮,无疑让更多人关注科大讯飞,关心在这样的潮流里,一家深耕语音识别的公司如何能获得更多业务和利润,如何能去迎合AI上升的趋势,从而满足人们对人工智能的所有期望。 其实这一年,技术的进程还是和往年一样。

从算法到应用:滴滴端到端语音AI技术实践
从算法到应用:滴滴端到端语音 AI 技术实践

本文介绍滴滴端到端语音AI技术实践经验。

声网一站式智能语音识别方案升级 语音审核“快准省”
声网一站式智能语音识别方案升级 语音审核“快准省”

近日,我们的“一站式智能语音识别方案”将实现升级。

Kaldi之父Daniel Povey:我为什么选择在小米开发下一代Kaldi?
Kaldi 之父 Daniel Povey:我为什么选择在小米开发下一代 Kaldi?

Kaldi之父Daniel Povey认为,当前语音识别系统的高精准度仅针对特定语音类型。

解读智能语音技术的2020:跨语种语音技术成高频关键词,商业化“加速度”落地
解读智能语音技术的 2020:跨语种语音技术成高频关键词,商业化“加速度”落地

智能语音技术在2020年的发展是“加速度”的,在突破性的技术创新之外,很多之前还在研究阶段的语音技术也已经在商业系统中得到落地。

智能语音技术,让我们“动口不动手”

语音识别技术在百度早已纳入需求向服务转变的进程中,其实百度语音技术就在我们身边:搜索、地图、应用、音乐、浏览器等领域无处不彰显语音技术的风采,也是它让我们进入了“动口不动手”的时代。

百度技术沙龙第 36 期回顾:语音技术现状与趋势(含资料下载)

在3月16日由@百度主办、@InfoQ负责策划组织和实施的第36期百度技术沙龙活动上,百度多媒体部门的语音技术研发工作的负责人贾磊和IBM中国研究院信息和用户技术(IUT)部的高级经理秦勇分享了在语音技术的的经验与实践,话题涉及“语音技术的发展与应用”,以及“利用数据做聪明的决定”等。本文将对他们各自的分享做下简单的回顾,同时提供相关资料的下载。

科大讯飞在AI源头技术上的突破,实现系统性创新
科大讯飞在 AI 源头技术上的突破,实现系统性创新

科大讯飞高级副总裁胡国平在1024开发者节上介绍,如何在AI的技术层面进行源头技术突破和多技术融合,以此来推动实现系统性创新。

滴滴披露语音识别新进展:基于 Attention 显著提升中文识别率

近期,滴滴的一篇论文被低调提交到了预印版论文平台 arXiv。在这篇名为《A comparable study of modeling units for end-to-end Mandarin speech recognition》的论文中,滴滴公布了其在基于 attention 的端对端中文语音识别技术上取得的最新研究成果。论文中,滴滴 attention 中文语音识别系统直接以常用的 5000 多中文汉字作为建模单元,实现了语言信息和声学信息的联合建模。AI 前线第 33 篇论文导读,将为你带来这篇论文的精彩解读。

智能语音技术在字节跳动内容平台的演进和应用实践
智能语音技术在字节跳动内容平台的演进和应用实践

AI 技术正在成为辅助内容生产和传播的“利器”。

做好语音翻译无捷径:语音识别是前提,实时翻译亟待攻破
做好语音翻译无捷径:语音识别是前提,实时翻译亟待攻破

语音翻译已经不是一个新鲜词汇,但仍具有巨大的应用潜力等待挖掘

Deep Speech:百度硅谷人工智能实验室利用单学习算法实现英语和汉语识别

据Inside Bigdata网站12月27日报道,百度研究院(baidu research)宣布硅谷人工智能实验室 (SVAIL)已经开发出了一种新型语音识别系统——深度语音识别系统(Deep Speech 2)。该系统能通过简单学习算法准确的识别英语和汉语。Deep Speech通过使用一个单一的学习算法具备准确识别英语和汉语的能力。成果已经发表在相关论文中:Deep Speech 2: End-to-End Speech Recognition in English and Mandarin。

国内首款基于FPGA平台的语音识别加速解决方案登陆华为云
国内首款基于 FPGA 平台的语音识别加速解决方案登陆华为云

该方案以语音识别为应用载体,对AI类应用推理计算进行全面加速。

Facebook AI 提出改进跨语言迁移学习的新方法,以实现端到端语音识别
Facebook AI 提出改进跨语言迁移学习的新方法,以实现端到端语音识别

该方法通过语音到文本翻译作为中间步骤,改进了针对端到端自动语音识别的跨语言迁移学习。它使学习迁移成为一个两步过程,提高了模型的性能。

新一代Kaldi技术细节揭秘:K2是核心部分
新一代 Kaldi 技术细节揭秘:K2 是核心部分

小米在积极拥抱开源的路上又进了一步。

作业帮中英文混合语音识别系统研发实践
作业帮中英文混合语音识别系统研发实践

随着语音技术开始渗透到人类生活的方方面面,混合语言的现象受到越来越多的关注。因此,开发用于中英文混合语言的自动语音识别(CSSR)系统尤为重要。

语音识别技术架构专题_资料-InfoQ中文网