写点什么

多模态数据驱动的 RAG 增强实践|QCon 北京

  • 2025-03-22
    北京
  • 本文字数:1359 字

    阅读完需:约 4 分钟

多模态数据驱动的 RAG 增强实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


明略科技技术专家董振兴已确认出席并发表题为多模态数据驱动的 RAG 增强实践的主题分享。随着生成式大模型技术的飞速发展,企业 AI 搜索需求呈现爆发式增长。纯文本 RAG 虽然在处理文本数据方面表现出色,但难以应对企业内部复杂多样的数据类型。多模态 RAG 技术通过整合文本、图像和音频等多种数据形式,实现了更全面的信息检索和利用,显著提升了生成内容的准确性和时效性,并有效降低了大模型产生幻觉的风险。


本次演讲将聚焦于 RAG 在多模态数据场景下的实践应用和技术挑战。具体将探讨多模态数据的向量化策略,深入剖析检索增强和生成增强的关键技术与解决方案,包括如何有效进行跨模态数据处理、检索和问答,以在海量异构数据中精准定位信息。此外,还将探讨借助 Agentic RAG 等前沿技术,通过大模型的推理和反馈机制,处理复杂搜索查询,提升检索的智能化和精准度。通过对这些核心技术的深入解析,旨在为听众提供构建高效、智能的多模态 RAG 增强系统的全面思路。


董振兴于 2018 年入职明略科技,主要负责 RAG 能力的增强及调优,从 0 到 1 构建了明略多模态 RAG 并持续迭代优化。本次会议中,他的详细演讲内容如下:


演讲提纲

1. 智能时代对多模态搜索的需求

  • 当前 AI 搜索的发展趋势,以及对更智能信息检索的需求

  • 企业内部数据的多样性和复杂性对传统文本 RAG 的挑战

2. 多模态数据的解析与向量化

  • 企业中常见的多模态数据类型(文本、图像、音频等)及其特点

  • 针对不同模态数据的向量化策略

3. 多模态信息的检索增强

  • 多模态数据检索策略

  • 如何将检索到的多模态信息有效地融入生成过程,提升生成内容的质量

  • 多模态场景下基于 Agentic RAG 的复杂查询处理与智能检索

4. 总结和展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 多模态数据处理的复杂性与难度。不同模态的数据拥有各自特有的存储格式和编码方式,需要进行复杂的预处理、转换、解析才能统一处理

  • 多模态数据的对齐问题。例如一段文本描述了一张图片的内容,如何将这两者在语义上对齐是一个挑战

  • Agentic RAG 的鲁棒性与可解释性差,且调试困难。如何保证 Agent 在各种复杂的场景下都能稳定运行,并且其决策过程具有一定的可解释性,是实际应用中需要考虑的问题


演讲亮点

  • 聚焦多模态数据:深入探讨如何处理和利用文本、图像、音频等多种数据形式进行 RAG

  • 强调实践性:结合实际开发和调优经验,分享关键技术和解决方案

  • 提供全面的思路:从数据处理、检索增强到生成增强,提供构建高效智能多模态 RAG 系统的完整框架


听众收益

  • 深入了解多模态 RAG 系统的核心技术和应用场景

  • 学习如何针对不同模态的数据进行向量化和检索

  • 掌握多模态 RAG 系统的开发流程和关键优化策略

  • 了解当前领域的技术挑战和未来发展方向


除此之外,本次大会还设置了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-22 15:055091

评论

发布
暂无评论

什么是区块链dapp开发?它能做什么?

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

交易所功能设计的核心架构与创新实践

区块链软件开发推广运营

交易所开发 链游开发 链游开发dapp开发 代币开发 代币开发公链开发

破解RL训练崩溃难题,快手联合中科院、清华、南大提出多模态奖励模型R1-Reward!

快手技术

人工智能 大模型

应对亚马逊面试的有效方法

Nackydeng

程序员面试 大厂求职 北美求职 亚马逊面试 亚马逊面经

VMware ESXi 8.0U3e macOS Unlocker & OEM BIOS 集成驱动版,新增 12 款 I219 网卡驱动

sysin

esxi

等保测评:五级等保系统?

黑龙江陆陆信息测评部

用 AI 快速开发一款小程序

悟空聊架构

CodeBuddy首席试玩官

自动动手制作一款Chrome扩展,一键转存文章

悟空聊架构

图形化编程语言视域下iVX开发平台的技术建构

代码制造者

ide 低代码

入门无压力,进阶有深度:iVX 的开发者友好性双重法则

代码制造者

低代码 无代码

等保测评公司:备案证明

黑龙江陆陆信息测评部

通义灵码入职表现实测:蔚来汽车AI 生成代码占比在 30% 以上

阿里云云效

阿里云 云原生 通义灵码

Arthas mbean(查看 Mbean 的信息)

刘大猫

Java 监控 Arthas 监控工具 mbean

Uniapp开发鸿蒙购物项目教程之样式选择器

幽蓝计划

黑龙江等保:跨省或全国联网运行的网络系统如何选择备案地?

黑龙江陆陆信息测评部

10 分钟快速搭建一款面试刷题小程序

悟空聊架构

如何用AI工具制作毕业答辩PPT?PPT制作保姆级攻略来袭!

职场工具箱

效率工具 PPT 毕业设计 办公软件 AI生成PPT

通义灵码入职表现实测:蔚来汽车AI 生成代码占比在 30% 以上

阿里巴巴云原生

阿里云 云原生 通义灵码

数安智用·科技强警|万里红依托“三大优势×五大能力”受邀参展第十二届警博会

新消费日报

Nooka:将书籍生成可互动音频,支持随时打断和提问;Sam Altman:语音与图形界面结合将带来创新丨日报

声网

VMware ESXi 8.0U3e macOS Unlocker & OEM BIOS HPE (慧与) 定制版

sysin

esxi

天下拍-资产拍卖经典案例分享

至存网络

拍卖 拍卖系统 拍卖软件 艺术品拍卖 资产拍卖

接单拒绝别人最好的办法就是:“这个我不会做”

程序员郭顺发

VMware ESXi 8.0U3e macOS Unlocker & OEM BIOS ConnectX-3 网卡定制版

sysin

esxi

公链开发及其配套设施:钱包与区块链浏览器

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 公链开发代币开发

YashanDB V23.4 LTS 正式发布|两地三中心、库级闪回重磅特性上线,生产级可用性再升级

极客天地

京东商品列表接口 item_search 深度解析

tbapi

京东API 关键词搜索京东商品接口 京东商品列表接口 京东数据采集 京东搜索接口

挖到项目中的2高危和中危漏洞

悟空聊架构

CodeBuddy首席试玩官

刷脸购物、智能补货:英特尔AI技术重塑零售门店体验

E科讯

Arthas ognl(执行ognl表达式)

刘大猫

人工智能 监控 Arthas 监控工具 ognl

观测云:从云时代走向AI时代

观测云

人工智能

多模态数据驱动的 RAG 增强实践|QCon 北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章