写点什么

奇富科技推出智能语音模型 Qifusion,语音识别准确率可达 93% 以上

  • 2024-07-10
    北京
  • 本文字数:778 字

    阅读完需:约 3 分钟

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上

近日,奇富科技智能语音团队论文《Qifusion-Net:基于特征融合的流式/非流式端到端语音识别框架》(Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition)被全球语音与声学顶级会议 INTERSPEECH 2024 收录。



我国地域广阔,方言种类繁多,其语法和语音特征存在显著差异。同时,由于噪声的干扰、方言的混杂现象、主观感知在标注过程中的偏差,以及人力标注工作的复杂性和系统性不足,语音识别技术的准确性和智能化水平受到了一定程度的限制。


在金融服务领域,现有的通用语音识别技术在处理方言时往往难以达到理想的效果,不仅影响了人机交互的准确性和智能化水平,也对服务的效率和质量产生了负面影响。


奇富科技引入了全自研 Qifusion 框架模型,并将其集成到智能营销及贷后提醒等业务场景中。在应用上,Qifusion 框架模型能够提升智能营销、贷后提醒、风险控制业务应用场景识别准确率,帮助解决以上问题。并且在复杂的通话环境中,Qifusion 的语音识别准确率达到了 93%以上,意图识别准确率超过 95%。


  • 方言种类丰富:凭借丰富的数据样本,Qifusion 框架模型在原有东北官话、胶辽官话、北京官话、冀鲁官话、中原官话、江淮官话、兰银官话和西南官话等国内八种主流方言的基础上,强化了四川、重庆、山东、河南、贵州、广东、吉林、辽宁、黑龙江等用户密集地区的方言识别能力。


  • 方言识别准确:Qifusion 框架模型具备自动识别不同口音的能力,并能在时间维度上对解码结果进行口音信息修正,使方言口音的语音识别误差率降低了 30%以上,整体语音识别字错率降低了 16%以上,提升了用户体验。


  • 方言识别高效:Qifusion 框架采用了创新的层自适应融合结构,能通过共享信息编码模块,更高效的提取方言信息。同时,该框架模型还支持即说即译功能,能在无需知晓额外方言信息的前提下,对不同方言口音的音频进行实时解码,实现精准的识别和转译。



2024-07-10 11:084012

评论

发布
暂无评论
发现更多内容

说说前端经常考的手写题

helloworld1024fd

JavaScript

React组件之间的通信方式总结(下)

beifeng1996

React

React组件之间的通信方式总结(上)

beifeng1996

React

React源码分析2-深入理解fiber

goClient1992

React

一大波vue面试题及答案精心整理

bb_xiaxia1998

Vue

vue组件通信6种方式总结(常问知识点)

bb_xiaxia1998

Vue

百度前端react面试题总结

beifeng1996

React

前端必会面试题总结

loveX001

JavaScript

React源码分析4-深度理解diff算法

goClient1992

React

从零到一手写迷你版Vue

helloworld1024fd

JavaScript

chrome调试工具之Sources

格斗家不爱在外太空沉思

浏览器 浏览器测试 11月月更

一步步实现React-Hooks核心原理

helloworld1024fd

JavaScript

年前端react面试打怪升级之路

beifeng1996

React

React源码解读之React Fiber

flyzz177

React

通俗易懂的React事件系统工作原理

夏天的味道123

React

这可能是你需要的React实战技巧

夏天的味道123

React

华为云从入门到实战 | 云速建站服务与企业主机安全服务

TiAmo

华为 华为云 11月月更

从纯函数讲起,一窥最深刻的函子 Monad

掘金安东尼

前端 11月月更

vue组件通信方式有哪些?

bb_xiaxia1998

Vue

ReactDOM.render在react源码中执行之后发生了什么?

flyzz177

React

chrome调试工具之Elements

格斗家不爱在外太空沉思

浏览器 11月月更 elements

数据中台的最后一公里:数据服务

元年技术洞察

数据中台 中台 DaaS

Spring Boot 实现接口幂等性的 4 种方案

小小怪下士

Java spring springboot

决策树-泰坦尼克号幸存者预测

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

React源码分析3-render阶段(穿插scheduler和reconciler)

goClient1992

React

计算机网络:数据链路层功能

timerring

计算机网络 11月月更 数据链路层

高频js笔试题看这一篇就够了

helloworld1024fd

JavaScript

ElasticSearch这些坑记得避开

Java 架构

React Context源码是怎么实现的呢

flyzz177

React

chrome调试工具之Console

格斗家不爱在外太空沉思

浏览器 浏览器测试 11月月更

详解React的Transition工作原理原理

夏天的味道123

React

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上_AI&大模型_赵明华_InfoQ精选文章