50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

从稳定到共情:对话式 AI 与硬件交互的技术探索|QCon 上海

  • 2025-10-13
    北京
  • 本文字数:1798 字

    阅读完需:约 6 分钟

大小:980.27K时长:05:34
从稳定到共情:对话式 AI 与硬件交互的技术探索|QCon 上海

QCon 上海站开幕倒计时!如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


网易云信资深音视频和智能硬件开发工程师陈策已确认出席并发表题为从稳定到共情:对话式 AI 与硬件交互的技术探索的主题分享。在智能硬件交互面临体验瓶颈的当下,网易云信通过多模态融合与认知计算技术,推动设备从“机械应答”向“情感共鸣”演进。本次分享将解析远场降噪麦克风阵列实现 8 米精准拾音、TOF 视觉模组捕捉微表情与肢体动作的多模态感知系统,以及声纹与情绪参数的实时联合输入机制;揭秘分层式用户画像库如何动态存储长期偏好与短期场景,并利用时序注意力机制保障对话连贯性;同时展示情感化响应生成模型在儿童教育机器人、智能座舱等场景的落地效果,实现从“能听会看”到“懂情绪、有记忆”的交互跃迁。听众将获得多模态感知工程化、情感化交互设计及大模型硬件适配的实战经验。



陈策,网易云信资深音视频和智能硬件开发工程师,深耕音视频传输与实时交互技术领域十余年,主要负责 WebRTC 协议栈深度优化、边缘计算在实时互动中的应用等方向研究。主导开发了 "基于 AI 预测的动态码率适配算法",将复杂网络环境下音视频传输延迟降低 40%,相关成果被纳入行业技术白皮书;针对智能硬件多设备协同场景,提出 "分布式媒体流同步机制",解决跨终端音画不同步难题,获 3 项发明专利。在智能硬件领域,其提出的 "分层编码 + 选择性重传" 方案已成为行业主流实践标准,并持续推动实时互动技术向高稳定性、低资源消耗方向突破。他在本次会议的详细演讲内容如下:


演讲提纲

1. 智能硬件市场概况

  • 市场规模与需求:全球出货量及家居、穿戴等细分领域占比,用户需求

  • 技术现状与痛点:交互碎片化、记忆缺失、情感响应同质化

2. 网易云信对话式 AI 技术架构

  • 核心技术架构

  • RTC 实时传输:低延迟,弱网自适应

  • "LLM+ASR+TTS" 三段式:高精准语音处理与多情感音色

  • LLM real-time 混合模式:平衡响应速度与理解深度

3. 多模态交互技术

  • 记忆系统、归纳遗忘、人格定制

  • 多模态交互增强:声纹锁定、轮次判断、智能打断、云端 AEC

  • 情感与内容理解:语音识别与视觉识别-辅助情感理解

4. MCP 生态与开发

  • MCP 生态架构:标准化接口与 SDK/API,可视化工具链

  • 开发难点解决:轻量化模型适配低算力设备与数据安全合规

5. 典型案例

  • 陪伴场景:玩具的个性化服务与情感响应

  • 教育场景:学习设备的个性化辅导

  • 养老场景:陪伴机器人的状态判断与关怀

5. 未来展望

  • 持续优化多模态交互效率

  • 完善 MCP 开发生态

  • 垂直场景深度适配

演讲亮点

  • 全链路技术突破:解析弱网环境下 RTC 传输延迟控制及远场降噪方案,解决智能硬件交互稳定性问题。

  • 混合式 LLM 架构揭秘:详解终端轻量化模型与云端大模型的实时协同机制,平衡响应速度与上下文处理能力,破解算力受限设备的 AI 推理难题。

  • 情感交互技术栈拆解:剖析融合语音与文本特征的情绪识别系统及多维度情感调制的 TTS 引擎,展示智能硬件情感化的实现路径。

  • 低算力适配方案:分享模型压缩与功耗优化经验,以及对低端架构的移植技术,如何实现轻量化落地。

  • 技术开放路线图:下一代端云协同技术进展,预告轻量化模型开源计划,为开发者提供明确接入方向。

听众收益

  • 了解智能硬件行业的现状

  • 了解智能硬件的开发门槛

  • 了解目前尖端的对话式 AI 技术细节


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,更多详情可联系票务经理 18514549229 咨询。



2025-10-13 11:3310

评论

发布
暂无评论

限量独家!濒危动物数字藏品免费发放!

百度开发者中心

百度希壤元宇宙平台上线首个汽车数字展厅,领克探索汽车营销新方式

百度开发者中心

一文来了解关于分布式锁的那些事儿

Linux服务器开发

redis 分布式 分布式锁 Linux服务器开发 Linux后台开发

跑马灯带你深入浅出TextView的源码世界

vivo互联网技术

android 源码分析 TextView

译文《Java并发编程之volatile》

潘大壮

并发编程 volatile 后端 Java EE

电路模型和电路定律 (Ⅲ)

謓泽

3月月更

两会“数字经济”高频出位,博睿数据为企业数字转型提供有力引擎

博睿数据

融云直播 SDK 升级,让直播「PK」起来

融云 RongCloud

直播 IM 场景化

Gartner发布中国IaaS PaaS市场服务报告,天翼云强势入选

天翼云开发者社区

Rust 用于移动开发的几种方式

非凸科技

Java c++ Python rust 量化

内存之旅——如何提升CMA利用率?

OpenHarmony开发者

内存 OpenHarmony

QoS 设计:车联网平台消息传输质量保障|车联网平台搭建从入门到精通 04

EMQ映云科技

物联网 IoT mqtt coap emq

开学季 | 飞桨AI Studio课程学习,小白也可以成为一名优秀的算法工程师!

百度开发者中心

长连接网关技术专题(七):小米小爱单机120万长连接接入层的架构演进

JackJiang

网络编程 websocket 即时通讯 网关 长连接

保姆级SpringBoot+Vue图片上传到阿里云OSS教程

沉默王二

Spring Boot

多场景推进 服务网格在联通的落地实践(下)

百度开发者中心

以太坊的扩容革命:ETH2.0

不登山的小鲁

以太坊 扩容 Ethereum eth eth2.0

VuePress 博客之 SEO 优化(六)站长工具

冴羽

Vue 前端 vuepress SEO 博客搭建

如何理解基础服务和通用服务

Im胡子

基础服务 通用服务 基础服务边界

公有云市场百舸争流!天翼云稳居第一梯队,进入领导者象限

天翼云开发者社区

企业在线产品宣传册应该如何设计?

小炮

产品宣传手册

信通院推出数字化赋能者新标准天翼云获评数字化转型赋能服务集体

天翼云开发者社区

Docker Build时的安全问题

火线安全

Docker 云原生 云安全 docker build

DevOps落地思考

火线安全

DevOps 云原生 云安全 DevOps认证

融云互联网通信安全揭秘之链路安全

融云 RongCloud

网络安全

春分耕种时,AI“现身”田间地头

百度开发者中心

雄安新区设立四周年,看天翼云以数字底座托起未来之城

天翼云开发者社区

中台和多云管理是伪问题?运维要集体下岗了吗?

火线安全

DevOps 云原生 云安全

2022年最热门的招聘技术技能是什么,您绝对想不到

禅道项目管理

项目管理 开发技能

阿里巴巴云原生大数据运维平台 SREWorks 正式开源

阿里云大数据AI技术

大数据 自动化运维 大规模网络运维

天翼云成为首个加入openGauss社区的运营商云

天翼云开发者社区

从稳定到共情:对话式 AI 与硬件交互的技术探索|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章