微博多模态 AI 应用实践分享|QCon 北京

  • 2025-03-17
    北京
  • 本文字数:1364 字

    阅读完需:约 4 分钟

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京盛大召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。

微博增值业务研发中心总经理吴侃已确认出席本次大会,并在「多模态大模型及应用」专题论坛分享《以微驭博:从多模态感知到数智化转型》。在当前数智化转型的浪潮中,企业普遍面临着成本与收益难以平衡的困境,传统模式也难以兼顾规模化和个性化需求。而多模态 AI 技术凭借对多源数据的综合处理能力,为提升业务效率带来了新的可能,大模型能力的提升更是降低了 AI 应用门槛。吴侃此次演讲将结合微博及其他行业的实际应用案例,深入探讨如何借助多模态 AI 技术为传统业务注入创新活力,提升企业数据的综合利用价值,同时还会分析如何平衡大模型技术优势与实际应用中的成本和风险,确保企业获得可持续的投资回报。

吴侃在行业内经验丰富,曾任职于硅谷,随后深度参与了微博从创立至今长达十六年的发展历程。他一直专注于技术落地、商业模式以及创新应用的实践,还参与了国家十四五项目和国家自然科学基金项目,在相关领域积累了深厚的见解。本次会议中,他的详细演讲内容如下:

演讲提纲

1. 多模态大模型技术的发展脉络与趋势

  • 从单模态的感知到跨模态的综合理解,反映了 AI 技术在认知层面的深刻变革

  • AI 正逐步实现从简单信号识别、规则到深层语义理解、意图感知和决策的本质飞跃

  • 多模态的边云结合的计算协同协作优化 

2. 多模态 AI 赋能企业数智化转型的路径与实践

  • 多模态内容理解在微博的部分应用:整合文本、图像、视频和音频等多模态数据,实现舆情监测与内容智能管理

  • 分类整理微博多模态素材,构建个人知识库以提升信息管理使用效率

  • 图像与视频分析理解图像内容与事件的“坑” 

3. 融合多模态生成式 UI 与 SaaS+AI 创新交付模式

  • 从传统的图形用户界面(GUI)与对话式界面(CUI)逐渐转向融合交互界面的发展趋势

  • 通过融合生成式 UI 快速实现与现有业务系统之间的整合,显著提升用户操作体验与业务效率

  • 建立在多个智能体实时协作与通信的基础之上的数据共享、任务分配和协作机制

您认为,这样的技术在实践过程中有哪些痛点?

  • 数智化转型时面临技术与实际业务需求脱节的问题,对于实际业务的 knowhow 不够深入,导致方案无法落地

  • 商业角度考虑大模型落地往往是投入大,收益甚微,“大炮打蚊子”

  • 商业项目和企业落地要求确定性,而大模型“幻觉”造成方案达不到预期指标

演讲亮点

  • 全新视角看待多模态大模型技术落地如何寻找场景,平衡精度与成本

  • Agent 协同融合,数据共享机制拓展应用生态

听众收益

  • 理解企业如何以多模态大模型为抓手,在规模化落地过程中有效权衡模型准确性与幻觉风险之间的实践经验与心得

  • 了解新时代交互界面的最新实践,帮助企业高效、低门槛地实现业务系统的智能化升级与融合

  • 获得企业数字化转型过程中结合自身业务特点科学规划多模态多 Agent AI 落地路径的方法论和实操经验,有效避免数据治理、成本控制等方面的常见“坑”

此外,本次大会还精心策划了AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有 100 多位资深专家现场分享前沿技术洞察和一线实践经验。现在报名可享 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。