
5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。
科大讯飞研发总监王磊磊已确认出席 AICon 上海并将在智能硬件落地实践专题发表题为《复杂场景下的语音交互,多模态降噪技术的实践与应用》的主题分享。在智能硬件快速发展的今天,嘈杂环境下的语音采集问题已成为制约用户体验的关键瓶颈。传统降噪技术主要依赖单模态信号处理(如麦克风阵列或数字信号处理算法),但在面对突发性噪音、多声源混叠以及动态场景时,其性能往往难以满足需求。为解决这一难题,本次演讲将重点介绍基于多模态融合的降噪技术体系。该技术通过整合麦克风阵列、摄像头视觉分析以及其他传感器数据,结合深度学习模型,实现了对复杂场景下目标声源的精准提取和背景噪音的有效抑制。
目前,这项技术已成功应用于多种智能硬件产品中,包括大屏一体机、人形机器人、智能音箱等。通过硬件与软件的深度协同,多模态降噪技术不仅显著提升了设备在嘈杂环境中的语音识别能力,还为智能硬件的交互体验带来了质的飞跃。本次演讲将从技术原理、应用场景及未来发展方向等方面,全面解析多模态降噪技术如何应用于下一代智能硬件中。
科大讯飞研发总监王磊磊,先后在科技创新 2030“新一代人工智能”重大项目中的多语种智能语音关键技术及产业化项目、2022 年安徽省科技攻关计划中的面向物联网的开放式云端人机自然交互系统、2019 年新一代人工智能产业创新重点任务揭榜工作下的语音交互系统 iFLYOS、2017 年安徽省战略性项目 AIUI 人工智能交互解决方案研发等重大项目中担当技术核心。他在本次会议的详细演讲内容如下:
演讲提纲:
1. 多模态简介
2. 多模态降噪技术介绍
单模态降噪介绍
单模态降噪的优缺点
多模态降噪介绍
3. 多模态降噪技术应用实践
4. 未来的工作
听众收益:
了解如何解决嘈杂环境的收音问题
了解麦克风阵列降噪的优缺点
了解多模态降噪的原理和应用
除此之外,本次大会还策划了AI Agent 构建及多元应用、多模态大模型创新实践、AI for Data,数据管理与价值挖掘实践、大模型推理性能优化策略、AI 产品设计的创新思维、智能硬件与大模型的融合探索、金融领域大模型应用实践、大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。
现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。

评论