硬核干货——《中小企业 AI 实战指南》免费下载! 了解详情
写点什么

奇富科技推出智能语音模型 Qifusion,语音识别准确率可达 93% 以上

  • 2024-07-10
    北京
  • 本文字数:778 字

    阅读完需:约 3 分钟

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上

近日,奇富科技智能语音团队论文《Qifusion-Net:基于特征融合的流式/非流式端到端语音识别框架》(Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition)被全球语音与声学顶级会议 INTERSPEECH 2024 收录。



我国地域广阔,方言种类繁多,其语法和语音特征存在显著差异。同时,由于噪声的干扰、方言的混杂现象、主观感知在标注过程中的偏差,以及人力标注工作的复杂性和系统性不足,语音识别技术的准确性和智能化水平受到了一定程度的限制。


在金融服务领域,现有的通用语音识别技术在处理方言时往往难以达到理想的效果,不仅影响了人机交互的准确性和智能化水平,也对服务的效率和质量产生了负面影响。


奇富科技引入了全自研 Qifusion 框架模型,并将其集成到智能营销及贷后提醒等业务场景中。在应用上,Qifusion 框架模型能够提升智能营销、贷后提醒、风险控制业务应用场景识别准确率,帮助解决以上问题。并且在复杂的通话环境中,Qifusion 的语音识别准确率达到了 93%以上,意图识别准确率超过 95%。


  • 方言种类丰富:凭借丰富的数据样本,Qifusion 框架模型在原有东北官话、胶辽官话、北京官话、冀鲁官话、中原官话、江淮官话、兰银官话和西南官话等国内八种主流方言的基础上,强化了四川、重庆、山东、河南、贵州、广东、吉林、辽宁、黑龙江等用户密集地区的方言识别能力。


  • 方言识别准确:Qifusion 框架模型具备自动识别不同口音的能力,并能在时间维度上对解码结果进行口音信息修正,使方言口音的语音识别误差率降低了 30%以上,整体语音识别字错率降低了 16%以上,提升了用户体验。


  • 方言识别高效:Qifusion 框架采用了创新的层自适应融合结构,能通过共享信息编码模块,更高效的提取方言信息。同时,该框架模型还支持即说即译功能,能在无需知晓额外方言信息的前提下,对不同方言口音的音频进行实时解码,实现精准的识别和转译。



2024-07-10 11:083950

评论

发布
暂无评论
发现更多内容

软件测试/测试开发丨Windows系统chromedriver安装与环境变量配置

测试人

软件测试 windows 环境变量 测试开发 chromedriver

Region Failover在GreptimeDB 集群中的实现

Greptime 格睿科技

时序数据库 云原生数据库 failover region datanode

六月更新 | MeetingOps:让有效协作与高效会议共同发生在云端

CODING DevOps

率先布局 RWA 赛道,PoseiSwap 成为最具先进性的 DEX

BlockChain先知

Last Week in Milvus

Zilliz

云服务 非结构化数据 Milvus Zilliz zillizcloud

API全场景零码测试机器人——ATGen带来“超自动化”测试模式

云计算 华为云 华为开发者大会2023

国家电投江西公司与特斯联设立合资公司 发掘资本在新能源行业的潜在投资机遇

TE智库

率先布局 RWA 赛道,PoseiSwap 成为最具先进性的 DEX

鳄鱼视界

MySQL:我的从库竟是我自己!?

爱可生开源社区

StoneDB 开源社区月刊 | 202303期

StoneDB

MySQL 数据库 StoneDB

率先布局 RWA 赛道,PoseiSwap 成为最具先进性的 DEX

股市老人

从零开始的知识图谱生活,构建一个百科知识图谱,完成基于Deepdive的知识抽取、基于ES的简单语义搜索、基于 REfO 的简单KBQA

汀丶人工智能

人工智能 自然语言处理 深度学习 知识图谱 智能搜索

低代码平台实用吗?有哪些大型企业在用低代码?

优秀

低代码

Gluten + Celeborn: 让 Native Spark 拥抱 Cloud Native

阿里云大数据AI技术

后端 企业号 7 月 PK 榜 Push Shuffle

2023-07-10:Kafka如何做到消息不丢失?

福大大架构师每日一题

福大大架构师每日一题

面向大模型的存储加速方案设计和实践

Baidu AICLOUD

数据湖 大模型 并行文件系统 缓存加速

领域知识图谱-中式菜谱知识图谱:实现知识图谱可视化和知识库智能问答系统(KBQA)

汀丶人工智能

人工智能 深度学习 nlp 知识图谱 智能问答

【HDC.Cloud 2023】华为云区块链分论坛内容值得再读!

云计算 软件开发 华为云 华为开发者大会2023

MySQL生态的下一代HTAP数据库创新与实践 | StoneDB邀您参加第12届数据技术嘉年华(2023 DTC)

StoneDB

MySQL 数据库 StoneDB

春分将至,发版当时:StoneDB-5.7-v1.0.3版本正式发布!优化主备能力,提高主从同步性能,众多细节优化,快来体验~

StoneDB

版本更新 StoneDB

数智浪潮!低代码开发平台扬帆迈向智慧诊疗领域新纪元!

不在线第一只蜗牛

人工智能 低代码 数智化 医疗健康

神州数码:我们和阿里云是市场和技术的共同体

新云力量

云计算 阿里云 神州数码

超级App快速开发的一种创新模式

FinFish

小程序 小程序生态 超级app 小程序化

消除企业信息孤岛的低代码开发平台

力软低代码开发平台

低代码平台之流程自动化测试

鲸品堂

低代码 企业号 7 月 PK 榜

活动回顾 | StoneDB亮相2023数据技术嘉年华:增强AP、升级TP、信创替换,让万千DBA用得更省心,企业用得更省钱

StoneDB

数据技术 StoneDB 数据技术嘉年华

OpenTiny 前端组件库正式开源啦!面向未来,为开发者而生

OpenTiny社区

开源 前端 UI组件库

奇富科技推出智能语音模型Qifusion,语音识别准确率可达93%以上_AI&大模型_赵明华_InfoQ精选文章