收录了 语音识别技术架构图 频道下的 50 篇内容
近日,我们的“一站式智能语音识别方案”将实现升级。
语音识别技术在百度早已纳入需求向服务转变的进程中,其实百度语音技术就在我们身边:搜索、地图、应用、音乐、浏览器等领域无处不彰显语音技术的风采,也是它让我们进入了“动口不动手”的时代。
本文介绍滴滴端到端语音AI技术实践经验。
智能语音技术在2020年的发展是“加速度”的,在突破性的技术创新之外,很多之前还在研究阶段的语音技术也已经在商业系统中得到落地。
在3月16日由@百度主办、@InfoQ负责策划组织和实施的第36期百度技术沙龙活动上,百度多媒体部门的语音技术研发工作的负责人贾磊和IBM中国研究院信息和用户技术(IUT)部的高级经理秦勇分享了在语音技术的的经验与实践,话题涉及“语音技术的发展与应用”,以及“利用数据做聪明的决定”等。本文将对他们各自的分享做下简单的回顾,同时提供相关资料的下载。
科大讯飞高级副总裁胡国平在1024开发者节上介绍,如何在AI的技术层面进行源头技术突破和多技术融合,以此来推动实现系统性创新。
AI 技术正在成为辅助内容生产和传播的“利器”。
近期,滴滴的一篇论文被低调提交到了预印版论文平台 arXiv。在这篇名为《A comparable study of modeling units for end-to-end Mandarin speech recognition》的论文中,滴滴公布了其在基于 attention 的端对端中文语音识别技术上取得的最新研究成果。论文中,滴滴 attention 中文语音识别系统直接以常用的 5000 多中文汉字作为建模单元,实现了语言信息和声学信息的联合建模。AI 前线第 33 篇论文导读,将为你带来这篇论文的精彩解读。
该方案以语音识别为应用载体,对AI类应用推理计算进行全面加速。
语音翻译已经不是一个新鲜词汇,但仍具有巨大的应用潜力等待挖掘
论文结果显示,通过简单的无监督预训练,中文语音识别任务能得到10%以上的性能提升。
早已从曾经的天马行空变得触手可及。也成了很多公司未来的核心战略,并应用到了产品中。领域亦是如此。领域中的热门话题超分辨率。
6月23日,讯飞开放平台乐享A.I.技术沙龙“A.I.虚拟人多模态创新交互”专场在成都圆满落幕。
随着语音技术开始渗透到人类生活的方方面面,混合语言的现象受到越来越多的关注。因此,开发用于中英文混合语言的自动语音识别(CSSR)系统尤为重要。
10月20日,人工智能创业公司出门问问宣布获得谷歌投资,具体投资金额不详。出门问问于2012年10月成立,创始人李志飞在此之前任职谷歌美国总部,是自然语言处理和人工智能方面的专家。据路透社报道,目前出门问问的累计融资金额已达7500万美元,根据之前的相关融资情况推断,谷歌这次的投资金额大约为5000万美元。投资之后,谷歌将获得少部分股权,出门问问还将继续保持单独运营。目前出门问问的估值已达3亿美金。
本文介绍58同城人机语音对话机器人的完整解决方案。
视频直播、语音聊天、音乐社交,这些与“声音”有关的社交场景在近两年来越来越热,也吸引了很多内容创作者和用户。
随着智能时代的来临,越来越多的人工智能已然走入人们的日常生活,为衣食住行带来意想不到的便利。
本次分享介绍如何利用AI技术和大数据,在移动输入场景中实现全、准、快的移动输入方式。
在最近由百度开发者中心主办、极客邦科技承办的74期百度技术沙龙上,百度理解与交互技术UNIT技术负责人孙珂分享了有关《UNIT:语言理解与交互技术》的演讲。除他之外,百度AI技术生态部高级运营顾问张扬、百度语音技术部架构师李超、百度AI技术生态部高级产品经理吴延宇,也分别从语音和语义理解应用实践、远场语音识别方案、百度开放平台使用指南这几个维度,对百度智能交互技术进行全方位解读。