内容介绍

2024 是 AIGC 爆发的一年。自年初 OpenAI 的 Sora 概念推出以来,各家互联网公司争相进入文生视频的赛道,AI 创作出的视频愈加真实且具有美感,满足了更多影视创作和专业用户的需求。同时,生成式的搜索和推荐也逐渐进入各家电商和短视频平台的事业,将用户画像建模和意图理解准确性提升到新的高度。多模态理解技术在这些 AI 原生应用背后承担着支撑性的作用,显著提升了 AIGC 的可控性。

本次分享将从国内外多模态理解技术的发展脉络出发,首先介绍行业的几个重点流派。随后将结合快手中的实际需求场景,讲述在技术落地过程中对疑难关键问题的思考和处理方案。同时,多模态大模型训练过程中的规模效应、模型选择、数据构造、训练范式等方面的探索也会被介绍。最后,结合短视频社交平台业务属性和创作者生态的主要关注目标,本次分享中将讨论未来多模态理解数据的发展方向和更多的应用前景。

大会推荐

6 月 27~28 日的 AICon 北京站将继续聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent 构建、多模态应用、大模型推理性能优化、数据智能实践、AI 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 AI 应用的无限可能!

多模态理解在 AIGC 场景中的主要应用

评论

发布
暂无评论