收录了 语音识别库 频道下的 50 篇内容
小米在积极拥抱开源的路上又进了一步。
IBM Watson 和 Raspberry Pi 建立情感分析机器人;面向 IoT 软件工程的关键抽;Arduino 打造操作板风格 "Hurry, Doctor!" 电子板的儿童游戏;哈曼卡顿Cortana智能蓝牙音箱Invoke面向少部分用户提前测试;小米AI智能音箱发布 299元再次执行小米价;中国电信推12款物联网入库模块,NB-IoT/Cat.1平分;Mozilla基金会正筹建众包式语音识别库项目Common Voice。
你可以通过这些有趣但也具有挑战性的项目来增强 Python 编程技能。
软银收购ARM加强物联网战略布局;华为与GE建立战略合作伙伴关系,加速工业物联网联合创新;AT&T与IBM整合物联网平台。
这一年的人工智能大潮,无疑让更多人关注科大讯飞,关心在这样的潮流里,一家深耕语音识别的公司如何能获得更多业务和利润,如何能去迎合AI上升的趋势,从而满足人们对人工智能的所有期望。 其实这一年,技术的进程还是和往年一样。
本文介绍滴滴端到端语音AI技术实践经验。
Mozilla开源语音识别项目 “Common Voice”,用户可以捐献语音或帮助验证语音转换结果。
该方法通过语音到文本翻译作为中间步骤,改进了针对端到端自动语音识别的跨语言迁移学习。它使学习迁移成为一个两步过程,提高了模型的性能。
Kaldi之父Daniel Povey认为,当前语音识别系统的高精准度仅针对特定语音类型。
近期,滴滴的一篇论文被低调提交到了预印版论文平台 arXiv。在这篇名为《A comparable study of modeling units for end-to-end Mandarin speech recognition》的论文中,滴滴公布了其在基于 attention 的端对端中文语音识别技术上取得的最新研究成果。论文中,滴滴 attention 中文语音识别系统直接以常用的 5000 多中文汉字作为建模单元,实现了语言信息和声学信息的联合建模。AI 前线第 33 篇论文导读,将为你带来这篇论文的精彩解读。
论文结果显示,通过简单的无监督预训练,中文语音识别任务能得到10%以上的性能提升。
最近,IBM的一个研究团队宣布他们在语音识别上创造了一个新的业界纪录,在使用SWITCHBOARD语料库的情况下词错误率为5.5%,接近于人类的错误率5.1%。为达成这一里程碑,他们使用了深度学习技术和声学模型。
实验证明,Blockformer模型在中文普通话测试集(AISHELL-1)上,不使用语言模型的情况下实现了4.35%的CER,使用语言模型时达到了4.10%的CER。
苹果揭秘Siri背后的AI技术。
科大讯飞高级副总裁胡国平在1024开发者节上介绍,如何在AI的技术层面进行源头技术突破和多技术融合,以此来推动实现系统性创新。
Facebook发布低延迟在线语音识别框架wav2letter@anywhere,吞吐量是ASR三倍
2019版自动语音识别方案指南。
SoundHound Inc.---全世界领先的语音识别和声音搜索技术提供商,近日宣布与NVIDIA合作共同开发基于深度学习的大词汇量、混合语音和自然语言理解的车载信息系统。
今天,外媒再次揭露了亚马逊、苹果、谷歌、微软和三星等公司对用户语音数据的常用处理手法。这不禁让人疑问:为什么这些公司一定要手动处理用户语音数据?难道没有一种办法可以及保护用户数据隐私,又能保证数据用于模型训练吗?
本文介绍58同城人机语音对话机器人的完整解决方案。