50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

AI 驱动的新基建:下一代多模态数据湖探索与实践|QCon 上海

  • 2025-10-22
    北京
  • 本文字数:1672 字

    阅读完需:约 5 分钟

大小:892.63K时长:05:04
AI 驱动的新基建:下一代多模态数据湖探索与实践|QCon 上海

QCon 上海站开幕倒计时!如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


火山引擎 AI 数据湖研发负责人丁远普已确认出席并发表题为AI 驱动的新基建:下一代多模态数据湖探索与实践的主题分享。随着 LLM 和多模态 AI 技术的飞速发展,非结构化数据量呈指数级增长,这极大地增加了数据管理、检索、计算和存储的复杂性。传统的数据湖解决方案已难以适应 AI 场景下对数据的新需求。

为了应对这一挑战,新一代数据湖必须解决以下多模态数据带来的关键问题:

  • 数据管理:传统数据管理侧重于库表结构,而面对多模态非结构化数据,如何实现高效管理 ?

  • 数据处理:如何从非结构化数据中挖掘潜在价值,如何提高 CPU 和 GPU 利用率,如何使用模型来处理数据 ?

  • 数据存储:传统数据湖格式在非结构化数据存储方面存在局限,是否可实现全模态数据的统一湖格式存储 ?

  • AI 场景支撑:多模态数据湖如何支撑 预训练、后训练、知识库、AI 搜索、智能体等场景的数据诉求?

本次演讲将分享下一代多模态数据湖探索与实践,包含新一代的技术架构,关键开源技术的更迭等。


丁远普,火山引擎 AI 数据湖研发负责人,拥有超过 10 年的大数据 B 端产品研发经验,当前负责火山引擎 EMR(开源大数据平台)、LAS(AI 数据湖服务)产品的研发工作。自 2023 年起开展 Data for AI 转型探索,在应对 AI 时代数据基建需求变更方面经验丰富。在结构化数据到多模态数据的管理、处理、存储,以及预训练、后训练、推理、AI 应用等方面,具备多个行业的落地实践经验。他在本次会议的详细演讲内容如下:


演讲提纲

1. 传统数据湖架构面临的挑战

  • 传统数据湖架构与特点

  • 无法高效管理多模态数据

  • 数据处理技术栈的限制

  • 传统湖格式存储多模态数据的问题

  • 数据处理人员角色、经验、数据规模的变化

  • 企业创新阵地的变更

2. 下一代面向 AI 的多模态数据湖

  • AI 数据湖参考架构

  • 元数据 vs 数据集

  • 数据处理引擎 or 模型

    数据处理引擎 Ray 的优化与实践

    面向 AI 设计的多模态数据处理新引擎介绍

    引擎 & 模型统一数据处理

    DataFrame and SQL AIQuery

    如何优化模型调用

  • 多模态数据湖格式 Lance

    多模态数据存储的痛点

    Lance 湖格式的优化和实践

    异构存储的数据流动、分层、汰换

3. AI 数据湖的实践案例

  • 模型训练场景实践

  • 智驾行业实践案例

  • AI 应用场景实践案例

  • ……

4. 未来规划与展望

  • 当前未解的问题

  • 看到的趋势

  • 下一阶段的规划

您认为,这样的技术在实践过程中有哪些痛点?

  • AI 时代的数据湖架构是否会逐步形成一套标准,需要时间校验

  • 新技术栈的成熟需要不断的迭代与演进,是挑战也是机遇

  • AI 时代的变化日新月异,对 Data Infra 的诉求也在快速变化中

演讲亮点

  • AI 时代对数据的诉求变更

  • 新一代的技术架构,关键开源技术的更迭

  • 遇到的问题与解法

听众收益

  • 大数据时代的数据湖与 AI 时代的数据湖有巨大变化,全新的需求驱动下一代技术变革

  • 了解服务于 AI 创新的多模态数据湖新架构、新技术介绍,我们的技术优化、实践、思考和总结

  • 一起探讨下一阶段的创新


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,更多详情可联系票务经理 18514549229 咨询。


2025-10-22 13:374167

评论

发布
暂无评论

UIInteraction:iOS中强大的视图交互能力

珲少

VR虚拟驾驶未来发展_汽车vr自动驾驶的优势

3DCAT实时渲染

汽车虚拟仿真

【Tomcat源码分析】生命周期机制 Lifecycle

派大星

tomcat源码解读

WorkPlus IM自定义门户:打造独具特色的企业个性化即时通讯平台

BeeWorks

天翼云 HBlock:安装无忧,使用更优!

Geek_c35793

sds 分布式存储 #HBlock

一站式解决方案:私有化IM即时通讯的综合性能与功能

BeeWorks

🔥 Rust China Conf 2024 震撼来袭,INFINI Pizza 搜索引擎重磅亮相!

极限实验室

搜索引擎 rust

VMware ESXi 6.7U3u macOS Unlocker 标准版和厂商定制版更新 OEM BIOS 2.7 支持 Windows Server 2025

sysin

esxi 2025 OEM BIOS unlocker

如何五分钟使用 Cocos Creator 快速部署 TON 游戏(第一部分)

股市老人

深入剖析淘宝商品详情API的调用与返回值

技术冰糖葫芦

api 网关 API Explorer API 策略 pinduoduo API

WorkPlusIM软件:助力企业实现个性化即时通讯平台

BeeWorks

VMware ESXi 8.0U3 macOS Unlocker 标准版和厂商定制版更新 OEM BIOS 2.7 支持 Windows Server 2025

sysin

esxi OEM BIOS unlocker dell

VMware ESXi 7.0U3q macOS Unlocker 标准版和厂商定制版更新 OEM BIOS 2.7 支持 Windows Server 2025

sysin

macos esxi 2025 OEM BIOS

中小企业是否需要引入生产管理MES系统

万界星空科技

工业互联网 制造业 mes 生产管理MES系统

Leangoo领歌敏捷管理工具:打造高效敏捷团队,提升工作效率

顿顿顿

敏捷开发 敏捷项目 #敏捷开发 scrum工具 scrum敏捷工具

Burp Suite Professional 2024.8 发布下载,新增功能概览

sysin

渗透测试 WEB安全 burp

苹果电脑YouTube客户端下载:YouTube for mac 免激活版

你的猪会飞吗

Mac软件 mac破解软件下载

RAG效果优化:高质量文档解析详解

阿里云大数据AI技术

人工智能 智能搜索 rag 文档解析 智能开放搜索

2024年8月文章一览

codists

编程人

如何利用淘宝商品评论API返回值进行竞品分析

技术冰糖葫芦

api 网关 API Explorer API 策略 pinduoduo API

AI 驱动的新基建:下一代多模态数据湖探索与实践|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章