在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

多模态数据驱动的 RAG 增强实践|QCon 北京

  • 2025-03-22
    北京
  • 本文字数:1359 字

    阅读完需:约 4 分钟

多模态数据驱动的 RAG 增强实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


明略科技技术专家董振兴已确认出席并发表题为多模态数据驱动的 RAG 增强实践的主题分享。随着生成式大模型技术的飞速发展,企业 AI 搜索需求呈现爆发式增长。纯文本 RAG 虽然在处理文本数据方面表现出色,但难以应对企业内部复杂多样的数据类型。多模态 RAG 技术通过整合文本、图像和音频等多种数据形式,实现了更全面的信息检索和利用,显著提升了生成内容的准确性和时效性,并有效降低了大模型产生幻觉的风险。


本次演讲将聚焦于 RAG 在多模态数据场景下的实践应用和技术挑战。具体将探讨多模态数据的向量化策略,深入剖析检索增强和生成增强的关键技术与解决方案,包括如何有效进行跨模态数据处理、检索和问答,以在海量异构数据中精准定位信息。此外,还将探讨借助 Agentic RAG 等前沿技术,通过大模型的推理和反馈机制,处理复杂搜索查询,提升检索的智能化和精准度。通过对这些核心技术的深入解析,旨在为听众提供构建高效、智能的多模态 RAG 增强系统的全面思路。


董振兴于 2018 年入职明略科技,主要负责 RAG 能力的增强及调优,从 0 到 1 构建了明略多模态 RAG 并持续迭代优化。本次会议中,他的详细演讲内容如下:


演讲提纲

1. 智能时代对多模态搜索的需求

  • 当前 AI 搜索的发展趋势,以及对更智能信息检索的需求

  • 企业内部数据的多样性和复杂性对传统文本 RAG 的挑战

2. 多模态数据的解析与向量化

  • 企业中常见的多模态数据类型(文本、图像、音频等)及其特点

  • 针对不同模态数据的向量化策略

3. 多模态信息的检索增强

  • 多模态数据检索策略

  • 如何将检索到的多模态信息有效地融入生成过程,提升生成内容的质量

  • 多模态场景下基于 Agentic RAG 的复杂查询处理与智能检索

4. 总结和展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 多模态数据处理的复杂性与难度。不同模态的数据拥有各自特有的存储格式和编码方式,需要进行复杂的预处理、转换、解析才能统一处理

  • 多模态数据的对齐问题。例如一段文本描述了一张图片的内容,如何将这两者在语义上对齐是一个挑战

  • Agentic RAG 的鲁棒性与可解释性差,且调试困难。如何保证 Agent 在各种复杂的场景下都能稳定运行,并且其决策过程具有一定的可解释性,是实际应用中需要考虑的问题


演讲亮点

  • 聚焦多模态数据:深入探讨如何处理和利用文本、图像、音频等多种数据形式进行 RAG

  • 强调实践性:结合实际开发和调优经验,分享关键技术和解决方案

  • 提供全面的思路:从数据处理、检索增强到生成增强,提供构建高效智能多模态 RAG 系统的完整框架


听众收益

  • 深入了解多模态 RAG 系统的核心技术和应用场景

  • 学习如何针对不同模态的数据进行向量化和检索

  • 掌握多模态 RAG 系统的开发流程和关键优化策略

  • 了解当前领域的技术挑战和未来发展方向


除此之外,本次大会还设置了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-22 15:055415

评论

发布
暂无评论

一键自动化博客发布工具,用过的人都说好(segmentfault篇)

程序那些事

人工智能 工具 程序那些事 openai 自动化工具

Flink物理分区概念与分类详解

木南曌

flink 实时计算

AI 数据观 | TapData Cloud + MongoDB Atlas:大模型与 RAG 技术有机结合,落地实时工单处理智能化解决方案

tapdata

Tapdata Cloud 工单处理 大型语言模型LLM 检索增强技术RAG MongoDB Atlas

SOL链DApp智能合约代币质押挖矿分红系统开发

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

软件测试学习笔记丨测试用例基础概念

测试人

软件测试

ETL如何执行Java脚本

谷云科技RestCloud

Java 脚本 ETL 数据集成工具

【深入浅出Spring原理及实战】「开发实战系列」重新回顾一下异常重试框架Spring Retry的功能指南和实战

码界西柚

spring Spring retry 重试机制 spring-retry

【深入浅出Spring原理及实战】「开发实战系列」Spring-Cache扩展自定义(注解失效时间+主动刷新缓存)

码界西柚

spring Spring Cache 缓存控制 缓存能力

docker攻略,希望能帮助到大家对docker的理解

阿里云天池

Docker 镜像

【参赛总结】第二届云原生编程挑战赛-冷热读写场景的RocketMQ存储系统设计 - Nico

阿里云天池

RocketMQ 云原生

苹果挖走大量谷歌人才,建立神秘人工智能实验室;李飞飞创业成立「空间智能」公司丨 RTE 开发者日报 Vol.197

RTE开发者社区

MES生产管理系统:私有云、公有云与本地化部署的比较分析

万界星空科技

服务器 云服务 私有云 mes 万界星空科技

企业选择MES系统是选择现成的OR定制开发?

万界星空科技

生产管理系统 mes 万界星空科技 定制开发MES

Web3 游戏周报(4.28 - 5.04)

Footprint Analytics

gamefi web3

【深入浅出Spring原理及实战】「工作实战专题」叫你如何使用另类操作去实现Spring容器注入Bean对象 (1)

码界西柚

Java spring 框架 Bean处理

Java模块化系统:引领代码革命与性能飞跃

伤感汤姆布利柏

技术分享 | 弹窗开发中,如何使用 Hook 封装 el-dialog?

LigaAI

前端 弹窗 对话框 代码简洁

云原生专栏丨基于K8s集群网络策略的应用访问控制技术

inBuilder低代码平台

云原生 #k8s

首届云原生编程挑战赛总决赛亚军比赛攻略(ONE PIECE团队)

阿里云天池

Serverless 云原生

价值创造未来:财务规划与资源管理

智达方通

企业管理 资源管理 全面预算

直播预告|第一批 Vision Pro 开发者开始弃坑了吗? 本周六一起听听三位 XR 开发者的真实想法!

RTE开发者社区

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)

汀丶人工智能

langchain 智能问答 rag 检索式增强

江苏气象AI算法挑战赛亚军比赛攻略_DontMind队

阿里云天池

阿里云 AI 算法

品高虚拟化后端存储的发展演进

品高云计算

多模态数据驱动的 RAG 增强实践|QCon 北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章