写点什么

奇富科技推出智能语音模型 Qifusion,语音识别准确率可达 93% 以上

  • 2024-07-10
    北京
  • 本文字数:778 字

    阅读完需:约 3 分钟

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上

近日,奇富科技智能语音团队论文《Qifusion-Net:基于特征融合的流式/非流式端到端语音识别框架》(Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition)被全球语音与声学顶级会议 INTERSPEECH 2024 收录。



我国地域广阔,方言种类繁多,其语法和语音特征存在显著差异。同时,由于噪声的干扰、方言的混杂现象、主观感知在标注过程中的偏差,以及人力标注工作的复杂性和系统性不足,语音识别技术的准确性和智能化水平受到了一定程度的限制。


在金融服务领域,现有的通用语音识别技术在处理方言时往往难以达到理想的效果,不仅影响了人机交互的准确性和智能化水平,也对服务的效率和质量产生了负面影响。


奇富科技引入了全自研 Qifusion 框架模型,并将其集成到智能营销及贷后提醒等业务场景中。在应用上,Qifusion 框架模型能够提升智能营销、贷后提醒、风险控制业务应用场景识别准确率,帮助解决以上问题。并且在复杂的通话环境中,Qifusion 的语音识别准确率达到了 93%以上,意图识别准确率超过 95%。


  • 方言种类丰富:凭借丰富的数据样本,Qifusion 框架模型在原有东北官话、胶辽官话、北京官话、冀鲁官话、中原官话、江淮官话、兰银官话和西南官话等国内八种主流方言的基础上,强化了四川、重庆、山东、河南、贵州、广东、吉林、辽宁、黑龙江等用户密集地区的方言识别能力。


  • 方言识别准确:Qifusion 框架模型具备自动识别不同口音的能力,并能在时间维度上对解码结果进行口音信息修正,使方言口音的语音识别误差率降低了 30%以上,整体语音识别字错率降低了 16%以上,提升了用户体验。


  • 方言识别高效:Qifusion 框架采用了创新的层自适应融合结构,能通过共享信息编码模块,更高效的提取方言信息。同时,该框架模型还支持即说即译功能,能在无需知晓额外方言信息的前提下,对不同方言口音的音频进行实时解码,实现精准的识别和转译。



2024-07-10 11:083745

评论

发布
暂无评论
发现更多内容

犬类癌症检测(CANDiD)研究:使用独立测试集对1000多只犬进行基于高通量测序的多癌种早期检测"液体活检"血液测试的临床验证

INSVAST

生信服务 液体活检 生信分析 Sentieon 变异检测

阿里妈妈公布NeurIPS比赛结果并开源AuctionNet

新消费日报

仓库存储管理系统-综合管理系统(源码+文档+部署+讲解)

深圳亥时科技

OCTC发布《BMC开放固件产业报告》,加速多元算力OpenBMC创新落地

财见

WebGL开发中的代码优化

北京木奇移动技术有限公司

WebGL 数字孪生 软件外包公司

深入理解 HTTP 协议:从基础到实践全解析

不在线第一只蜗牛

网络协议 HTTP

《深入浅出Apache Spark》系列⑤:Spark SQL的表达式优化

数新网络官方账号

sql

为什么某些 batch size 会突然导致性能下降?

Baihai IDP

人工智能 深度学习 AI LLMs

反向代购新风尚:创业者出海的新蓝海

代码忍者

代购系统 跨境独立站 反向淘宝代购集运系统

NFTScan | 12.09~12.15 NFT 市场热点汇总

NFT Research

NFT #Web3

7个指标看本轮加密货币牛市走到哪一步

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 代币开发 链游开发公链开发

淘宝天猫API接口深度解析:如何高效利用商品详情与关键词搜索商品列表功能

代码忍者

API 接口 pinduoduo API

去哪儿秒级监控预警落地实践

Qunar技术沙龙

后端 预警监控

重磅首发!网易伏羲具身智能解决方案推动人形机器人产业新发展

网易伏羲

解决方案 网易伏羲 人形机器人 具身智能

又遇百度,能否 hold 住?

王中阳Go

Go 面试

SPICE协议浅析

天翼云开发者社区

云计算 远程控制

2024年用户喜爱的Top5云电脑排名!没想到黑马是这家

小喵子

云电脑 云游戏 ToDesk云电脑 云电竞 网易云游戏电脑

以太坊项目日渐冷门:以太坊链项目开发的现状与未来

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

容器与虚拟机的区别与关系

天翼云开发者社区

云计算 容器 虚拟机

英伟达视角下的 2025:AI智能体元年

GPU算力

英伟达 AI Agent AI 智能体 Swarm magentic-one

QT客户端开发的代码优化

北京木奇移动技术有限公司

软件外包公司 QT外包开发 QT开发公司

mes在造纸工厂数字化转型中的应用

万界星空科技

mes 万界星空科技 造纸行业 造纸mes 造纸厂

揭秘南京大学人工智能通识教育,和鲸Heywhale上线人工智能通识课一体化解决方案

ModelWhale

Python 人工智能 大数据 教改

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上_AI&大模型_赵明华_InfoQ精选文章