【ArchSummit架构师峰会】基于大模型的基础框架、中台、应用层等专题全覆盖 >>> 了解详情
写点什么

语音识别库

收录了 语音识别库 频道下的 50 篇内容

新一代Kaldi技术细节揭秘:K2是核心部分
新一代 Kaldi 技术细节揭秘:K2 是核心部分

小米在积极拥抱开源的路上又进了一步。

物联网技术周报第 100 期: IBM Watson 和 Raspberry Pi 建立情感分析机器人

IBM Watson 和 Raspberry Pi 建立情感分析机器人;面向 IoT 软件工程的关键抽;Arduino 打造操作板风格 "Hurry, Doctor!" 电子板的儿童游戏;哈曼卡顿Cortana智能蓝牙音箱Invoke面向少部分用户提前测试;小米AI智能音箱发布 299元再次执行小米价;中国电信推12款物联网入库模块,NB-IoT/Cat.1平分;Mozilla基金会正筹建众包式语音识别库项目Common Voice。

针对Python开发人员的10个“疯狂”的项目构想
针对 Python 开发人员的 10 个“疯狂”的项目构想

你可以通过这些有趣但也具有挑战性的项目来增强 Python 编程技能。

物联网技术周报第 53 期: 构建 Raspberry Pi 驱动的 LoRaWAN 基站

软银收购ARM加强物联网战略布局;华为与GE建立战略合作伙伴关系,加速工业物联网联合创新;AT&T与IBM整合物联网平台。

年终解读:2017 年的语音识别,路只走了一半

这一年的人工智能大潮,无疑让更多人关注科大讯飞,关心在这样的潮流里,一家深耕语音识别的公司如何能获得更多业务和利润,如何能去迎合AI上升的趋势,从而满足人们对人工智能的所有期望。 其实这一年,技术的进程还是和往年一样。

从算法到应用:滴滴端到端语音AI技术实践
从算法到应用:滴滴端到端语音 AI 技术实践

本文介绍滴滴端到端语音AI技术实践经验。

Mozilla “Common Voice” 开源语音识别项目

Mozilla开源语音识别项目 “Common Voice”,用户可以捐献语音或帮助验证语音转换结果。

Facebook AI 提出改进跨语言迁移学习的新方法,以实现端到端语音识别
Facebook AI 提出改进跨语言迁移学习的新方法,以实现端到端语音识别

该方法通过语音到文本翻译作为中间步骤,改进了针对端到端自动语音识别的跨语言迁移学习。它使学习迁移成为一个两步过程,提高了模型的性能。

Kaldi之父Daniel Povey:我为什么选择在小米开发下一代Kaldi?
Kaldi 之父 Daniel Povey:我为什么选择在小米开发下一代 Kaldi?

Kaldi之父Daniel Povey认为,当前语音识别系统的高精准度仅针对特定语音类型。

滴滴披露语音识别新进展:基于 Attention 显著提升中文识别率

近期,滴滴的一篇论文被低调提交到了预印版论文平台 arXiv。在这篇名为《A comparable study of modeling units for end-to-end Mandarin speech recognition》的论文中,滴滴公布了其在基于 attention 的端对端中文语音识别技术上取得的最新研究成果。论文中,滴滴 attention 中文语音识别系统直接以常用的 5000 多中文汉字作为建模单元,实现了语言信息和声学信息的联合建模。AI 前线第 33 篇论文导读,将为你带来这篇论文的精彩解读。

将BERT用于语音识别!滴滴提出新无监督预训练框架,中文识别性能提升10%
将 BERT 用于语音识别!滴滴提出新无监督预训练框架,中文识别性能提升 10%

论文结果显示,通过简单的无监督预训练,中文语音识别任务能得到10%以上的性能提升。

创新性应用深度学习,IBM 在语音识别领域取得了里程碑式突破

最近,IBM的一个研究团队宣布他们在语音识别上创造了一个新的业界纪录,在使用SWITCHBOARD语料库的情况下词错误率为5.5%,接近于人类的错误率5.1%。为达成这一里程碑,他们使用了深度学习技术和声学模型。

明略科技Blockformer语音识别模型在AISHELL-1测试集上取得SOTA结果
明略科技 Blockformer 语音识别模型在 AISHELL-1 测试集上取得 SOTA 结果

实验证明,Blockformer模型在中文普通话测试集(AISHELL-1)上,不使用语言模型的情况下实现了4.35%的CER,使用语言模型时达到了4.10%的CER。

苹果AI技术新突破:Siri可识别热门单词和多语种说话者
苹果 AI 技术新突破:Siri 可识别热门单词和多语种说话者

苹果揭秘Siri背后的AI技术。

科大讯飞在AI源头技术上的突破,实现系统性创新
科大讯飞在 AI 源头技术上的突破,实现系统性创新

科大讯飞高级副总裁胡国平在1024开发者节上介绍,如何在AI的技术层面进行源头技术突破和多技术融合,以此来推动实现系统性创新。

Facebook开源低延迟在线自动语音识别框架:速度更快,错误率更低
Facebook 开源低延迟在线自动语音识别框架:速度更快,错误率更低

Facebook发布低延迟在线语音识别框架wav2letter@anywhere,吞吐量是ASR三倍

2019年,这8款自动语音识别方案你应该了解!
2019 年,这 8 款自动语音识别方案你应该了解!

2019版自动语音识别方案指南。

SoundHound Inc. 与 NVIDIA 合作,共同开发基于深度学习的车载自然语言理解系统

SoundHound Inc.---全世界领先的语音识别和声音搜索技术提供商,近日宣布与NVIDIA合作共同开发基于深度学习的大词汇量、混合语音和自然语言理解的车载信息系统。

亚马逊、谷歌、苹果、微软、三星如何处理你的语音数据?
亚马逊、谷歌、苹果、微软、三星如何处理你的语音数据?

今天,外媒再次揭露了亚马逊、苹果、谷歌、微软和三星等公司对用户语音数据的常用处理手法。这不禁让人疑问:为什么这些公司一定要手动处理用户语音数据?难道没有一种办法可以及保护用户数据隐私,又能保证数据用于模型训练吗?

人机语音对话技术在58同城的应用实践
人机语音对话技术在 58 同城的应用实践

本文介绍58同城人机语音对话机器人的完整解决方案。

语音识别库专题_资料-InfoQ中文网