
8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!
快手高级算法专家文彬已确认出席并发表题为《Keye-VL在多模态思维链领域的探索》的主题分享,探讨传统多模态模型在动态视频理解与复杂推理场景面临严峻挑战。快手开源的 Keye-VL 模型在多模态思维链技术实现突破,具备独特的 auto-think(自动思考决策)、agentic-think(代理工具思考) 等先进能力,在视频理解领域,尤其是短视频理解方面,展现出业界领先的性能。
本次演讲将从多模态思维链技术出发,解析 Keye-VL 多模态大模型的核心技术,并分享 Keye-VL 在快手短视频社区的落地应用。

文彬现任快手高级算法专家,负责 Keye-VL 多模态大模型后训练阶段的研发。研究方向涵盖多模态大模型监督微调(SFT)、人类偏好对齐(RLHF)、多模态思维链以及强化学习等领域,相关学术成果在 CVPR、ICML、ICLR 以及 NeurIPS 等 CCF-A 类会议上发表。作为核心贡献者参与的 Keye-VL-8B-Preview 模型开源项目获得业界高度关注,在 Hugging Face 平台模型下载量已突破 30,000 次。他在本次会议的详细演讲内容如下:
演讲提纲
多模态思维链的技术革新意义
Keye-VL 的多模态思维链核心技术解析
多模态思维链在快手社区的落地应用
成效验证与未来方向
您的演讲有哪些前沿亮点?
多模态场景下的 Agentic Think 能力
多模态强化学习范式
多模态场景下的自动思考
听众收益
了解多模态思维链技术
从效率和效果两个维度考量多模态思维链技术
了解多模态思维链技术在短视频社区如何落地
除此之外,本次大会还策划了AI Infra、AI 产品研发与商业落地探索、Agent 应用新范式与 MCP 生态实践、AI 驱动业务重塑与提效、智能硬件与具身智能创新实践、AI 原生时代的卓越架构治理、、多模态与空间智能技术创新、Agent + Data 落地探索、AI 赋能研发体系变革、Agent 核心技术与系统架构创新、大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。
目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情可扫码或联系票务经理 13269078023 咨询。

评论