写点什么

科大讯飞研发总监王磊磊将在 AICon 上海分享多模态降噪技术的实践与应用

  • 2025-04-30
    北京
  • 本文字数:1068 字

    阅读完需:约 4 分钟

大小:584.76K时长:03:19
科大讯飞研发总监王磊磊将在AICon 上海分享多模态降噪技术的实践与应用

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


科大讯飞研发总监王磊磊已确认出席 AICon 上海并将在智能硬件落地实践专题发表题为《复杂场景下的语音交互,多模态降噪技术的实践与应用》的主题分享。在智能硬件快速发展的今天,嘈杂环境下的语音采集问题已成为制约用户体验的关键瓶颈。传统降噪技术主要依赖单模态信号处理(如麦克风阵列或数字信号处理算法),但在面对突发性噪音、多声源混叠以及动态场景时,其性能往往难以满足需求。为解决这一难题,本次演讲将重点介绍基于多模态融合的降噪技术体系。该技术通过整合麦克风阵列、摄像头视觉分析以及其他传感器数据,结合深度学习模型,实现了对复杂场景下目标声源的精准提取和背景噪音的有效抑制。


目前,这项技术已成功应用于多种智能硬件产品中,包括大屏一体机、人形机器人、智能音箱等。通过硬件与软件的深度协同,多模态降噪技术不仅显著提升了设备在嘈杂环境中的语音识别能力,还为智能硬件的交互体验带来了质的飞跃。本次演讲将从技术原理、应用场景及未来发展方向等方面,全面解析多模态降噪技术如何应用于下一代智能硬件中。


科大讯飞研发总监王磊磊,先后在科技创新 2030“新一代人工智能”重大项目中的多语种智能语音关键技术及产业化项目、2022 年安徽省科技攻关计划中的面向物联网的开放式云端人机自然交互系统、2019 年新一代人工智能产业创新重点任务揭榜工作下的语音交互系统 iFLYOS、2017 年安徽省战略性项目 AIUI 人工智能交互解决方案研发等重大项目中担当技术核心。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 多模态简介

2. 多模态降噪技术介绍

  • 单模态降噪介绍

  • 单模态降噪的优缺点

  • 多模态降噪介绍

3. 多模态降噪技术应用实践

4. 未来的工作


听众收益:

  • 了解如何解决嘈杂环境的收音问题

  • 了解麦克风阵列降噪的优缺点

  • 了解多模态降噪的原理和应用


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-30 14:0010774

评论

发布
暂无评论

基于 MinIO 对象存储保障 Rancher 数据

Rancher

Kubernetes k8s rancher

这50道Java面试题看完,想不进大厂都难

王小凡

Java 程序员 面试 面试题 大厂面试

分布式 hdfs-over-ftp 工具实现方案

移动云大数据

我秃了!唯一索引、普通索引我该选谁?

程序员啊叶

Java 编程 程序员 架构 java面试

TDengine 助力西门子轻量级数字化解决方案

TDengine

数据库 tdengine 时序数据库

什么是SpringMVC?工作流程是什么?九大组件有哪些?

程序员啊叶

Java 编程 程序员 架构 java面试

看了就会的 Rainbond 入门教程

北京好雨科技有限公司

Kubernetes 云原生

10次面试9次被刷?吃透这500道大厂Java高频面试题后,怒斩offer

程序员啊叶

Java 编程 程序员 架构 java面试

如何有效进行回顾会议(上)?

敏捷开发

敏捷 回顾会 项目开发

面试官:ThreadLocal使用场景有哪些?内存泄露问题如何避免?

程序员啊叶

Java 编程 程序员 架构 java面试

兆骑科创创业大赛平台,活动路演,投融资对接

兆骑科创凤阁

牛皮了!阿里面试官终于分享出了2022年最新的java面试题及答案

程序员啊叶

Java 编程 程序员 架构 java面试

你面试十家java开发才能总结出来的面试题(建议收藏)

程序员啊叶

Java 编程 程序员 架构 java面试

【微服务测试教程】使用Python测试gRPC接口案例

和牛

测试

详解Kafka分区副本分配的Bug

石臻臻的杂货铺

7月月更 签约计划第三季

35道MySQL面试必问题图解,这样也太好理解了吧

程序员啊叶

Java 编程 程序员 架构 java面试

融云实时社区解决方案

融云 RongCloud

完完整整地看完这个故事,你敢说还不懂Docker?

程序员啊叶

Java 编程 程序员 架构 java面试

58子站安居,经纪人营销管理平台登录接口加密逆向

梦想橡皮擦

Python 爬虫 7月月更

有奖活动分享:使用WordPress搭建一个专属自己的博客后最高可领取iPhone13

云端explorer

Wordpress 博客部署

语音社交系统——完善有声系统产业链

开源直播系统源码

开源源码 语音直播系统源码 语音直播系统 语音直播系统连麦

ApacheCon Asia 2022 启动!7场阿里云大数据+AI议题分享等你围观

阿里云大数据AI技术

人工智能 大数据

如何在 TiDB Cloud 上使用 Databricks 进行数据分析 | TiDB Cloud 使用指南

PingCAP

TiDB

一文读懂如何部署具有外部数据库的高可用 K3s

Rancher

Kubernetes k8s rancher

数牍 X Rust,那些不得不说的事

Jessica@数牍

联邦学习 隐私计算 数牍科技 rust开发者大会 分布式计算框架

蓝海大脑高性能气象大数据平台为气象局掌握风云变幻提供助力

GPU算力

一些企业数据平台建设的思考

Bright

数据平台 大数据平台

围绕新市民金融聚焦差异化产品设计、智能技术提效及素养教育

易观分析

新市民金融 差异化产品设计 素养教育

NFTScan 与 NFTPlay 在 NFT 数据领域达成战略合作

NFT Research

区块链 大数据 NFT 合作 Web3.0

活动速递| Apache Doris 性能优化实战系列直播课程初公开,诚邀您来参加!

SelectDB

数据库 性能优化 数据仓库 OLAP Doris

科大讯飞研发总监王磊磊将在AICon 上海分享多模态降噪技术的实践与应用_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章