10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

科大讯飞研发总监王磊磊将在 AICon 上海分享多模态降噪技术的实践与应用

  • 2025-04-30
    北京
  • 本文字数:1068 字

    阅读完需:约 4 分钟

大小:584.76K时长:03:19
科大讯飞研发总监王磊磊将在AICon 上海分享多模态降噪技术的实践与应用

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


科大讯飞研发总监王磊磊已确认出席 AICon 上海并将在智能硬件落地实践专题发表题为《复杂场景下的语音交互,多模态降噪技术的实践与应用》的主题分享。在智能硬件快速发展的今天,嘈杂环境下的语音采集问题已成为制约用户体验的关键瓶颈。传统降噪技术主要依赖单模态信号处理(如麦克风阵列或数字信号处理算法),但在面对突发性噪音、多声源混叠以及动态场景时,其性能往往难以满足需求。为解决这一难题,本次演讲将重点介绍基于多模态融合的降噪技术体系。该技术通过整合麦克风阵列、摄像头视觉分析以及其他传感器数据,结合深度学习模型,实现了对复杂场景下目标声源的精准提取和背景噪音的有效抑制。


目前,这项技术已成功应用于多种智能硬件产品中,包括大屏一体机、人形机器人、智能音箱等。通过硬件与软件的深度协同,多模态降噪技术不仅显著提升了设备在嘈杂环境中的语音识别能力,还为智能硬件的交互体验带来了质的飞跃。本次演讲将从技术原理、应用场景及未来发展方向等方面,全面解析多模态降噪技术如何应用于下一代智能硬件中。


科大讯飞研发总监王磊磊,先后在科技创新 2030“新一代人工智能”重大项目中的多语种智能语音关键技术及产业化项目、2022 年安徽省科技攻关计划中的面向物联网的开放式云端人机自然交互系统、2019 年新一代人工智能产业创新重点任务揭榜工作下的语音交互系统 iFLYOS、2017 年安徽省战略性项目 AIUI 人工智能交互解决方案研发等重大项目中担当技术核心。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 多模态简介

2. 多模态降噪技术介绍

  • 单模态降噪介绍

  • 单模态降噪的优缺点

  • 多模态降噪介绍

3. 多模态降噪技术应用实践

4. 未来的工作


听众收益:

  • 了解如何解决嘈杂环境的收音问题

  • 了解麦克风阵列降噪的优缺点

  • 了解多模态降噪的原理和应用


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-30 14:0010694

评论

发布
暂无评论

中间件头部厂商加入,龙蜥社区携手东方通共创开源新生态

OpenAnolis小助手

Linux 开源

使用 electron-builder 打包 Electron 程序

编程三昧

Electron electron实战 1月月更

SSH 端口转发与 SOCKS 代理

CRMEB

【等保小知识】等保二级是否需要做密评?什么是密评?

行云管家

网络安全 等级保护 等保2.0 等保二级

第三节:SpringBoot中web项目推荐目录结构

入门小站

springboot java 编程

BigDecimal 被拼多多的"砍一刀"应用到了极致

恒生LIGHT云社区

Java 拼多多 Java中精确小数计算

科技为驱,创新为翼——鲸鲮科技喜获“2021北京软件核心竞争力企业”评价

鲸鲮JingOS

操作系统 创新 信创 信息化 科技企业

开源实践 | OceanBase 在红象云腾大数据场景下的实践与思考

OceanBase 数据库

OceanBase 开源 客户案例 开源实践

大数据开发之Flink sql 的基础用法

@零度

flink sql 大数据开发

从零开发区块链应用(五)--golang网络请求

杰哥的技术杂货铺

golang 区块链 HTTP post GET

Redis持久化RDB和AOF区别

编程江湖

redis'

AI 收藏夹 Vol.004:Waifu Lab 火了,AI 是如何创作的?

Zilliz

前端开发之React调度算法的迭代过程

@零度

前端开发 React

面对 Log4j2 漏洞,安全人都做了什么?

华为云开发者联盟

Java 漏洞 Apache Log4j2 Log4j2 漏洞 漏洞防护

Spock框架Mock静态资源经验汇总

FunTester

Mockito powermock Mock spock FunTester

不会使用Spring的配置文件,赶紧把这个甩给他

华为云开发者联盟

Java spring API bean 配置文件

干掉大小流切换 I 帧!阿里云 RTC QoS 及视频编码联合优化之切流编码

阿里云CloudImagine

阿里云 WebRTC 直播 RTC 视频编码

Java Spring Beans.xml里的Bean定义是如何被解析出来的

汪子熙

Java Spring Boot Spring Java 1月月更

提效赋能:当企业在谈论数字化时,我们在谈论什么?

优秀

管理工具

深入剖析 HDFS 3.x 新特性-纠删码

五分钟学大数据

hdfs 1月月更

译文|借助 Pulsar Functions 迁移到无服务应用程序

Apache Pulsar

Java 开源 架构 云原生 Apache Pulsar

等保2.0基本要求是什么?跟等保1.0一样吗?

行云管家

网络安全 等保 等级保护 等保2.0

飞瓜数据发布2021年抖音短视频直播营销报告(年度版)

极客天地

Flume简介和架构安装配置详解

编程江湖

一个BPMN流程示例带你认识项目中流程的生命周期

华为云开发者联盟

工作流 项目 BPM BPMN Activiti框架

Promise 异步流程控制

编程江湖

Hive底层 explain 执行计划详解

五分钟学大数据

hive 1月月更

尚硅谷JavaWeb新版视频教程发布

@零度

javaWeb

引领中国分布式数据库企业技术创新力,平凯星辰获得赛迪顾问报告推荐

PingCAP

火山引擎边缘计算节点通过 EC Ready 边缘云首批评测

火山引擎边缘云

云原生 边缘计算 测评

java开发之SpringBoot+flowable实现工作流

@零度

Java springboot

科大讯飞研发总监王磊磊将在AICon 上海分享多模态降噪技术的实践与应用_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章