写点什么

语音识别技术架构图

收录了 语音识别技术架构图 频道下的 50 篇内容

声网一站式智能语音识别方案升级 语音审核“快准省”
声网一站式智能语音识别方案升级 语音审核“快准省”

近日,我们的“一站式智能语音识别方案”将实现升级。

智能语音技术,让我们“动口不动手”

语音识别技术在百度早已纳入需求向服务转变的进程中,其实百度语音技术就在我们身边:搜索、地图、应用、音乐、浏览器等领域无处不彰显语音技术的风采,也是它让我们进入了“动口不动手”的时代。

从算法到应用:滴滴端到端语音AI技术实践
从算法到应用:滴滴端到端语音 AI 技术实践

本文介绍滴滴端到端语音AI技术实践经验。

解读智能语音技术的2020:跨语种语音技术成高频关键词,商业化“加速度”落地
解读智能语音技术的 2020:跨语种语音技术成高频关键词,商业化“加速度”落地

智能语音技术在2020年的发展是“加速度”的,在突破性的技术创新之外,很多之前还在研究阶段的语音技术也已经在商业系统中得到落地。

百度技术沙龙第 36 期回顾:语音技术现状与趋势(含资料下载)

在3月16日由@百度主办、@InfoQ负责策划组织和实施的第36期百度技术沙龙活动上,百度多媒体部门的语音技术研发工作的负责人贾磊和IBM中国研究院信息和用户技术(IUT)部的高级经理秦勇分享了在语音技术的的经验与实践,话题涉及“语音技术的发展与应用”,以及“利用数据做聪明的决定”等。本文将对他们各自的分享做下简单的回顾,同时提供相关资料的下载。

科大讯飞在AI源头技术上的突破,实现系统性创新
科大讯飞在 AI 源头技术上的突破,实现系统性创新

科大讯飞高级副总裁胡国平在1024开发者节上介绍,如何在AI的技术层面进行源头技术突破和多技术融合,以此来推动实现系统性创新。

智能语音技术在字节跳动内容平台的演进和应用实践
智能语音技术在字节跳动内容平台的演进和应用实践

AI 技术正在成为辅助内容生产和传播的“利器”。

滴滴披露语音识别新进展:基于 Attention 显著提升中文识别率

近期,滴滴的一篇论文被低调提交到了预印版论文平台 arXiv。在这篇名为《A comparable study of modeling units for end-to-end Mandarin speech recognition》的论文中,滴滴公布了其在基于 attention 的端对端中文语音识别技术上取得的最新研究成果。论文中,滴滴 attention 中文语音识别系统直接以常用的 5000 多中文汉字作为建模单元,实现了语言信息和声学信息的联合建模。AI 前线第 33 篇论文导读,将为你带来这篇论文的精彩解读。

国内首款基于FPGA平台的语音识别加速解决方案登陆华为云
国内首款基于 FPGA 平台的语音识别加速解决方案登陆华为云

该方案以语音识别为应用载体,对AI类应用推理计算进行全面加速。

做好语音翻译无捷径:语音识别是前提,实时翻译亟待攻破
做好语音翻译无捷径:语音识别是前提,实时翻译亟待攻破

语音翻译已经不是一个新鲜词汇,但仍具有巨大的应用潜力等待挖掘

将BERT用于语音识别!滴滴提出新无监督预训练框架,中文识别性能提升10%
将 BERT 用于语音识别!滴滴提出新无监督预训练框架,中文识别性能提升 10%

论文结果显示,通过简单的无监督预训练,中文语音识别任务能得到10%以上的性能提升。

AI 在 RTC 中的四大技术应用方向
AI 在 RTC 中的四大技术应用方向

早已从曾经的天马行空变得触手可及。也成了很多公司未来的核心战略,并应用到了产品中。领域亦是如此。领域中的热门话题超分辨率。

AI虚拟人多模态交互落地难题如何破解?我们在乐享A.I.技术沙龙成都站找到了答案
AI 虚拟人多模态交互落地难题如何破解?我们在乐享 A.I. 技术沙龙成都站找到了答案

6月23日,讯飞开放平台乐享A.I.技术沙龙“A.I.虚拟人多模态创新交互”专场在成都圆满落幕。

作业帮中英文混合语音识别系统研发实践
作业帮中英文混合语音识别系统研发实践

随着语音技术开始渗透到人类生活的方方面面,混合语言的现象受到越来越多的关注。因此,开发用于中英文混合语言的自动语音识别(CSSR)系统尤为重要。

相信技术的力量,出门问问获谷歌投资

10月20日,人工智能创业公司出门问问宣布获得谷歌投资,具体投资金额不详。出门问问于2012年10月成立,创始人李志飞在此之前任职谷歌美国总部,是自然语言处理和人工智能方面的专家。据路透社报道,目前出门问问的累计融资金额已达7500万美元,根据之前的相关融资情况推断,谷歌这次的投资金额大约为5000万美元。投资之后,谷歌将获得少部分股权,出门问问还将继续保持单独运营。目前出门问问的估值已达3亿美金。

人机语音对话技术在58同城的应用实践
人机语音对话技术在 58 同城的应用实践

本文介绍58同城人机语音对话机器人的完整解决方案。

声网 Agora 一站式智能语音识别方案:内容审核,快速接入
声网 Agora 一站式智能语音识别方案:内容审核,快速接入

视频直播、语音聊天、音乐社交,这些与“声音”有关的社交场景在近两年来越来越热,也吸引了很多内容创作者和用户。

刷脸支付“牛”在哪里?这3大技术是关键
刷脸支付“牛”在哪里?这 3 大技术是关键

随着智能时代的来临,越来越多的人工智能已然走入人们的日常生活,为衣食住行带来意想不到的便利。

AI驱动下的移动输入革新之路
AI 驱动下的移动输入革新之路

本次分享介绍如何利用AI技术和大数据,在移动输入场景中实现全、准、快的移动输入方式。

小团队怎么跟百人研发团队 PK 智能交互?这份秘籍可以告诉你

在最近由百度开发者中心主办、极客邦科技承办的74期百度技术沙龙上,百度理解与交互技术UNIT技术负责人孙珂分享了有关《UNIT:语言理解与交互技术》的演讲。除他之外,百度AI技术生态部高级运营顾问张扬、百度语音技术部架构师李超、百度AI技术生态部高级产品经理吴延宇,也分别从语音和语义理解应用实践、远场语音识别方案、百度开放平台使用指南这几个维度,对百度智能交互技术进行全方位解读。

语音识别技术架构图专题_资料-InfoQ中文网