
QCon 上海站开幕倒计时!如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!
10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!
Speech Graphics 联合创始人 & CEO Gregor Hofer 博士已确认出席并发表题为《The Rise of Visual Conversational AI》的主题分享。人工智能的下一波浪潮将语言、行为和具身化整合到一个集声音、个性与存在感于一体的界面中。随着人工智能从文本生成向具备情感响应能力的多模态系统演进,视觉对话式人工智能正蓄势待发,重新定义我们的工作、学习与互动方式。本次分享将深入探讨支撑逼真虚拟形象的底层技术(如实时行为建模),以及这些技术如何推动人工智能从静态对话机器人向能够以逼真方式进行听说互动的全交互式数字 “生命体” 转变。
Gregor Hofer,Speech Graphics 联合创始人 & CEO,拥有深厚的行业经验和扎实的学术背景,持有爱丁堡大学信息学博士学位。在联合创办 Speech Graphics 公司之前,他曾担任维也纳电信研究中心高级研究员及信息学院研究员。同期,他研发了文本转语音人工智能技术,并将一款原型产品商业化,该产品目前已应用于多个平台。
2010 年,Gregor Hofer 与 Michael Berger 以及游戏行业资深人士 Colin Macdonald 共同创办了 Speech Graphics,致力于将声控面部动画技术商业化。自成立以来,该公司斩获多项荣誉,包括表彰创新成就的约翰・洛吉・贝尔德奖以及 2022-2023 年度 TIGA 最佳技术供应商奖。
2024 年,Gregor Hofer 在 Speech Graphics 的业务基础上推出了 Rapport,旨在专注于研发具备情感智能的虚拟交互形象。除了在 Speech Graphics 担任全职工作外,格雷戈尔同时也是 System Industrie Electronic Holding AG 的监事会成员。他在本次会议的详细演讲内容如下:
演讲提纲
1. 人工智能的下一波浪潮 —— 从文本到多模态交互
为何视觉对话式人工智能如今至关重要
从机器人到 “生命体”—— 人机交互的转变
2. 逼真虚拟形象背后的核心技术
实时行为建模
语音合成与情感韵律
面部动画与肢体动作
3. 具身化的力量 —— 声音、个性与存在感
4. 人工智能中的情感响应能力
5. 改变工作、学习与参与方式的应用案例
6. 信任因素 —— 为何逼真交互能带来更好的结果
7. 挑战与考量 —— 延迟、真实感、技术专业性
8. 未来是交互式的 —— 视觉对话式人工智能的愿景
演讲亮点
AI 正从文本交互迈向融合语音、表情等的多模态交互,技术让虚拟形象更逼真,改变人机互动模式。
视觉对话式 AI 在工作、学习等场景作用显著,能通过情感响应和个性展现提升信任与效果。
AI 未来前景广阔,如何解决延迟、真实感及技术门槛等挑战。
听众收益
能了解 AI 从文本交互到多模态交互的发展趋势,以及让虚拟形象更逼真的核心技术。
可掌握视觉对话式 AI 在工作、学.。习等场景的实际应用价值,以及它如何提升交互效果。
能清晰了解视觉 AI 的未来前景和当前面临的挑战,并对它的发展有更全面的认知。
除此之外,本次大会还策划了多模态融合技术与创新应用、混沌工程与全链路压测实践、Data Infra for AI、Agentic AI、加速与反哺:AI 时代的可观测实践、Vibe Coding、端侧大模型的创新与应用、大模型推理的工程实践、AI 搜索技术的深水区、模型训练与微调、具身智能:当 AI 学会“动手思考”、大模型驱动的制造革命、AI4SE:软件研发提质增效实践、AI 重塑视觉创作体验、从“炫技”走向“实用”的 AI 产品、大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。
目前,所有大会演讲嘉宾已结集完毕,更多详情可联系票务经理 18514549229 咨询。

评论