科大讯飞研发总监王磊磊将在AICon 上海分享多模态降噪技术的实践与应用_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章



 写点什么

登录/注册



大小：584.76K时长：03:19

科大讯飞研发总监王磊磊将在AICon 上海分享多模态降噪技术的实践与应用

5 月 23 日-24 日，AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地，围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题，呈现技术与应用融合的最新趋势。

科大讯飞研发总监王磊磊已确认出席 AICon 上海并将在智能硬件落地实践专题发表题为《复杂场景下的语音交互，多模态降噪技术的实践与应用》的主题分享。在智能硬件快速发展的今天，嘈杂环境下的语音采集问题已成为制约用户体验的关键瓶颈。传统降噪技术主要依赖单模态信号处理（如麦克风阵列或数字信号处理算法），但在面对突发性噪音、多声源混叠以及动态场景时，其性能往往难以满足需求。为解决这一难题，本次演讲将重点介绍基于多模态融合的降噪技术体系。该技术通过整合麦克风阵列、摄像头视觉分析以及其他传感器数据，结合深度学习模型，实现了对复杂场景下目标声源的精准提取和背景噪音的有效抑制。

目前，这项技术已成功应用于多种智能硬件产品中，包括大屏一体机、人形机器人、智能音箱等。通过硬件与软件的深度协同，多模态降噪技术不仅显著提升了设备在嘈杂环境中的语音识别能力，还为智能硬件的交互体验带来了质的飞跃。本次演讲将从技术原理、应用场景及未来发展方向等方面，全面解析多模态降噪技术如何应用于下一代智能硬件中。

科大讯飞研发总监王磊磊，先后在科技创新 2030“新一代人工智能”重大项目中的多语种智能语音关键技术及产业化项目、2022 年安徽省科技攻关计划中的面向物联网的开放式云端人机自然交互系统、2019 年新一代人工智能产业创新重点任务揭榜工作下的语音交互系统 iFLYOS、2017 年安徽省战略性项目 AIUI 人工智能交互解决方案研发等重大项目中担当技术核心。他在本次会议的详细演讲内容如下：

演讲提纲：
1. 多模态简介
2. 多模态降噪技术介绍
单模态降噪介绍
单模态降噪的优缺点
多模态降噪介绍
3. 多模态降噪技术应用实践
4. 未来的工作

听众收益：
了解如何解决嘈杂环境的收音问题
了解麦克风阵列降噪的优缺点
了解多模态降噪的原理和应用

除此之外，本次大会还策划了AI Agent 构建及多元应用、多模态大模型创新实践、AI for Data，数据管理与价值挖掘实践、大模型推理性能优化策略、AI 产品设计的创新思维、智能硬件与大模型的融合探索、金融领域大模型应用实践、大模型助力业务提效实践等专题，届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。

现在报名即可以享受 9 折优惠，单张门票立省 580 元，详情可扫码或联系票务经理 13269078023 咨询。

评论

发布

暂无评论

迅雷不及掩耳盗铃

生活记录 8月日更搜房记

中国法定数字货币（DCEP）全面启航！全国普及势在必行

大数据实战训练营-sparkcore作业

阿里专家分享的SpringCloudNginx高并发核心文档

公众号_愿天堂没有BUG

Java 编程程序员架构面试

微信架构图设计&“学生管理系统”毕设架构

搭建太阳系3D可视化平台，科普宇宙的未知奥秘

一只数据鲸鱼

科普数据可视化智慧宇宙太空

Golang高并发：生产者消费者模型

Go 语言 8月日更生产者消费者模型

烂大街的Spring循环依赖该如何回答？

Java spring 程序员架构面试

spring-boot 2.5.4，nacos 作为配置、服务发现中心，Cloud Native Buildpacks 打包镜像，GitLab CI/CD

gitlab nacos CI/CD spring-boot 2.5.4 CNB

手把手教你15分钟搭建人脸戴口罩识别软硬件系统

人工智能 EasyDL

Linux内核源码分析方法—程序员进阶必备

Linux服务器开发

操作系统 Linux内核内核源码底层原理内核开发

2021 年 8 月国产数据库排行榜：秋日胜春朝

数据库 TiDB oceanbase 国产数据库达梦

小米和网易两位资深工程师联合编写的HBASE原理与实践PDF

公众号_愿天堂没有BUG

Java 编程程序员架构面试

膜拜！终于拿到了美团大佬分享的Netty源码剖析与应用PDF

公众号_愿天堂没有BUG

Java 编程程序员架构面试

80W美团架构师整理分享出了Spring5企业级开发实战文档

公众号_愿天堂没有BUG

Java 编程程序员架构面试

小布助手在面向中文短文本的实体链指比赛中的实践应用

OPPO小布助手

人工智能算法模型训练智能助手短文本

iOS SDK 架构解析

神策技术社区

程序员数据埋点

写作——开启技术成长之路

神策技术社区

程序员写作日志

Android SDK 之用户路径采集

神策技术社区

数据路径规划分析行为数据

其实TCP聪明得很！详解TCP常见的五个异常处理场景

Java 编程架构程序人生架构师

新思科技推出Rapid Scan新功能帮助开发团队在编写云原生应用的同时确保安全性

InfoQ_434670063458

新思科技静态应用安全

MySQL information_schema 系统库介绍

ipfs投资者靠什么赚钱？投资ipfs要多少钱？

投资ipfs要多少钱 ipfs投资者靠什么赚钱

LVS 学习： netfilter 与 ipvs 无秘密

Linux 负载均衡 LVS Netfilter IPVS

神策分析 Web JS SDK 功能介绍

神策技术社区

程序员代码埋点

TronChain波场链智能合约开发详情|智能合约DAPP搭建

量化系统19942438797

智能合约波场链

微信小程序图片流&本地图片转base64处理方案

页面仔小杨

微信小程序

4轮技术面+1轮HR面，成功拿到腾讯40k*16的Offer ，详解面试流程和真题解析

Java 程序员架构面试

“人人皆可成为AI开发者”！百度世界大会官宣百度松果学堂成立

阿里专家分享内部绝密RocketMQ核心原理与最佳实践PDF

公众号_愿天堂没有BUG

Java 编程程序员架构面试

python通过Matplotlib绘制常见的几种图形

Python研究者