收录了 语音识别技术架构 频道下的 50 篇内容
端到端语音识别技术,如何更好的落地?
论文结果显示,通过简单的无监督预训练,中文语音识别任务能得到10%以上的性能提升。
Facebook发布低延迟在线语音识别框架wav2letter@anywhere,吞吐量是ASR三倍
近些年,伴随着深度学习技术的发展,语音识别技术经历了革命性的变化。
这一年的人工智能大潮,无疑让更多人关注科大讯飞,关心在这样的潮流里,一家深耕语音识别的公司如何能获得更多业务和利润,如何能去迎合AI上升的趋势,从而满足人们对人工智能的所有期望。 其实这一年,技术的进程还是和往年一样。
本文介绍滴滴端到端语音AI技术实践经验。
近日,我们的“一站式智能语音识别方案”将实现升级。
Kaldi之父Daniel Povey认为,当前语音识别系统的高精准度仅针对特定语音类型。
智能语音技术在2020年的发展是“加速度”的,在突破性的技术创新之外,很多之前还在研究阶段的语音技术也已经在商业系统中得到落地。
语音识别技术在百度早已纳入需求向服务转变的进程中,其实百度语音技术就在我们身边:搜索、地图、应用、音乐、浏览器等领域无处不彰显语音技术的风采,也是它让我们进入了“动口不动手”的时代。
在3月16日由@百度主办、@InfoQ负责策划组织和实施的第36期百度技术沙龙活动上,百度多媒体部门的语音技术研发工作的负责人贾磊和IBM中国研究院信息和用户技术(IUT)部的高级经理秦勇分享了在语音技术的的经验与实践,话题涉及“语音技术的发展与应用”,以及“利用数据做聪明的决定”等。本文将对他们各自的分享做下简单的回顾,同时提供相关资料的下载。
科大讯飞高级副总裁胡国平在1024开发者节上介绍,如何在AI的技术层面进行源头技术突破和多技术融合,以此来推动实现系统性创新。
奇富科技引入了全自研Qifusion框架模型,并将其集成到智能营销及贷后提醒等业务场景中。
近期,滴滴的一篇论文被低调提交到了预印版论文平台 arXiv。在这篇名为《A comparable study of modeling units for end-to-end Mandarin speech recognition》的论文中,滴滴公布了其在基于 attention 的端对端中文语音识别技术上取得的最新研究成果。论文中,滴滴 attention 中文语音识别系统直接以常用的 5000 多中文汉字作为建模单元,实现了语言信息和声学信息的联合建模。AI 前线第 33 篇论文导读,将为你带来这篇论文的精彩解读。
AI 技术正在成为辅助内容生产和传播的“利器”。
语音翻译已经不是一个新鲜词汇,但仍具有巨大的应用潜力等待挖掘
据Inside Bigdata网站12月27日报道,百度研究院(baidu research)宣布硅谷人工智能实验室 (SVAIL)已经开发出了一种新型语音识别系统——深度语音识别系统(Deep Speech 2)。该系统能通过简单学习算法准确的识别英语和汉语。Deep Speech通过使用一个单一的学习算法具备准确识别英语和汉语的能力。成果已经发表在相关论文中:Deep Speech 2: End-to-End Speech Recognition in English and Mandarin。
该方案以语音识别为应用载体,对AI类应用推理计算进行全面加速。
该方法通过语音到文本翻译作为中间步骤,改进了针对端到端自动语音识别的跨语言迁移学习。它使学习迁移成为一个两步过程,提高了模型的性能。
小米在积极拥抱开源的路上又进了一步。