收录了 语音识别技术架构图 频道下的 50 篇内容
近日,我们的“一站式智能语音识别方案”将实现升级。
语音识别技术在百度早已纳入需求向服务转变的进程中,其实百度语音技术就在我们身边:搜索、地图、应用、音乐、浏览器等领域无处不彰显语音技术的风采,也是它让我们进入了“动口不动手”的时代。
该方案以语音识别为应用载体,对AI类应用推理计算进行全面加速。
本文介绍滴滴端到端语音AI技术实践经验。
近期,滴滴的一篇论文被低调提交到了预印版论文平台 arXiv。在这篇名为《A comparable study of modeling units for end-to-end Mandarin speech recognition》的论文中,滴滴公布了其在基于 attention 的端对端中文语音识别技术上取得的最新研究成果。论文中,滴滴 attention 中文语音识别系统直接以常用的 5000 多中文汉字作为建模单元,实现了语言信息和声学信息的联合建模。AI 前线第 33 篇论文导读,将为你带来这篇论文的精彩解读。
智能语音技术在2020年的发展是“加速度”的,在突破性的技术创新之外,很多之前还在研究阶段的语音技术也已经在商业系统中得到落地。
在3月16日由@百度主办、@InfoQ负责策划组织和实施的第36期百度技术沙龙活动上,百度多媒体部门的语音技术研发工作的负责人贾磊和IBM中国研究院信息和用户技术(IUT)部的高级经理秦勇分享了在语音技术的的经验与实践,话题涉及“语音技术的发展与应用”,以及“利用数据做聪明的决定”等。本文将对他们各自的分享做下简单的回顾,同时提供相关资料的下载。
语音翻译已经不是一个新鲜词汇,但仍具有巨大的应用潜力等待挖掘
论文结果显示,通过简单的无监督预训练,中文语音识别任务能得到10%以上的性能提升。
AI 技术正在成为辅助内容生产和传播的“利器”。
视频直播、语音聊天、音乐社交,这些与“声音”有关的社交场景在近两年来越来越热,也吸引了很多内容创作者和用户。
科大讯飞高级副总裁胡国平在1024开发者节上介绍,如何在AI的技术层面进行源头技术突破和多技术融合,以此来推动实现系统性创新。
随着语音技术开始渗透到人类生活的方方面面,混合语言的现象受到越来越多的关注。因此,开发用于中英文混合语言的自动语音识别(CSSR)系统尤为重要。
2019版自动语音识别方案指南。
本次分享介绍如何利用AI技术和大数据,在移动输入场景中实现全、准、快的移动输入方式。
在最近由百度开发者中心主办、极客邦科技承办的74期百度技术沙龙上,百度理解与交互技术UNIT技术负责人孙珂分享了有关《UNIT:语言理解与交互技术》的演讲。除他之外,百度AI技术生态部高级运营顾问张扬、百度语音技术部架构师李超、百度AI技术生态部高级产品经理吴延宇,也分别从语音和语义理解应用实践、远场语音识别方案、百度开放平台使用指南这几个维度,对百度智能交互技术进行全方位解读。
搜狗、科大讯飞、百度等国内巨头公司在语音输入上,从技术到产品行业应用,都做了很多探索。那么,如何从技术上理能语音输入?智能语音给日常生活带来了怎样的影响? InfoQ在10月份的时候联系了搜狗公司桌面事业部高级总监,桌面研究部和语音交互技术中心负责人,王砚峰。他同时负责搜狗智能语音业务,带领语音和语义技术团队实现了业内顶尖的语音交互能力,目前致力于智能语音技术的产品化创新。本文由采访资料整理而来。
早已从曾经的天马行空变得触手可及。也成了很多公司未来的核心战略,并应用到了产品中。领域亦是如此。领域中的热门话题超分辨率。
本文系统介绍计算机视觉的基础知识,如何利用这些识别算法实现一个应用,同时进行部署、推广这一整套流程。
本文介绍58同城人机语音对话机器人的完整解决方案。