写点什么

Data Warebase:实时湖仓与多模态检索——构建 AI 时代的智能数据底座|AICon 上海

  • 2025-05-20
    北京
  • 本文字数:1365 字

    阅读完需:约 4 分钟

大小:718.29K时长:04:05
Data Warebase:实时湖仓与多模态检索——构建 AI 时代的智能数据底座|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


ProtonBase CEO 王绍翾已确认出席 AICon 上海并将在Data for AI,驱动智能的下一代数据基础专题发表题为《Data Warebase:实时湖仓与多模态检索 —— 构建 AI 时代的智能数据底座》的主题分享。随着 AI 技术的飞速发展,尤其是生成式 AI 和大模型的崛起,数据系统正面临前所未有的挑战与机遇。本次演讲将深入探讨一种创新的 AI 数据处理架构——分布式 Data Warebase(Data Warehouse + Database)。具体将解析这一架构如何通过实时数据处理和大规模并行计算,构建高效的 AI 湖仓环境,同时支持多模态检索(Multi-Modal Retrieval),以及如何基于它构建实时特征工程和在线特征库。


王绍翾现任 ProtonBase CEO ,北京大学本科,加州大学圣地亚哥分校博士。曾就职于美国的 Facebook,开发分布式内存数据库 memcached 和图关系数据库 TAO。2015 年加入阿里巴巴集团,先后就职于搜索事业部、阿里云计算平台事业部、达摩院,曾任达摩院机器智能 System AI Lab 负责人。国内最早期的 Apache Flink committer & PMC。2021 年离开阿里创立了 ProtonBase。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 生成式 AI 时代的数据挑战与机遇

  • 背景与趋势:生成式 AI 与大模型带来的变革,数据处理需求升级

  • 面临挑战:传统数据架构的局限,海量数据的实时处理,多模态检索的需求

2. Instant Lakehouse 的演进

  • 从传统到即时:从传统的库+仓+湖的多套产品架构,到一站式支持实时高效写入和查询的 Instant Lakehouse

  • 关键技术:大规模数据实时增删改查

3. 多模态检索应用

  • 重要性:多样化数据结构的融合与生成式 AI 对多模态检索的需求

  • 最佳实践:系统架构与技术揭秘

4. 实时特征工程与在线特征库

  • 核心需求:实时特征的高吞吐写入和查询,在线特征库在 AI 中的应用

  • 干货分享:实时特征工程的挑战和方案

5. 分布式 Data Warebase 架构解析

  • 设计理念:用一个引擎支持大部分数据服务的需求,完美覆盖 HTAP,流批一体,湖仓一体等中间态产品

  • 核心组件:融合数据仓库与数据库在存储和索引上的所有优点,使用最先进的存算分离架构确保秒级弹性伸缩

6. 应用场景与案例分享

  • 成功案例:金融、车联网、广告、游戏、电商等行业的应用与效果分析

7. 未来展望:Data Warebase 在 AI 应用中的演进方向


听众收益:

  • 深入了解生成式 AI 时代对数据系统的核心挑战与未来机遇

  • 掌握 Instant Lakehouse、Multi-Modal Retrieval System 以及 Feature Engineering 在生成式 AI 时代的技术演进与最佳实践

  • 学习如何通过 Data Warebase 构建高效、实时的 AI 数据处理架构,赋能下一代 AI 应用


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


大会开幕在即,了解更多报名和详情信息可扫码或联系票务经理 13269078023 咨询。



2025-05-20 14:003966

评论

发布
暂无评论

双十一剁手快,ERP系统不能慢

力软低代码开发平台

用火山引擎DataTester,这家企业开始了“数据驱动增长”

字节跳动数据平台

双11niubility的数据恢复软件,获得更专业的数据恢复服务

淋雨

数据恢复 文件恢复

云BI,如何成为了企业的“贴身管家”?

夏日星河

火山引擎钜惠双11开启,云服务器0.71折起

极客天地

华为云发布三大生态举措,携手伙伴及开发者共创新价值

华为云开发者联盟

云计算 华为云 企业号十月 PK 榜

七层模型

初学者

网络 服务器 11月月更

云原生系列五:Kafka 集群数据迁移基于Kubernetes的内部

叶秋学长

kafka\ kurbernetes 11月月更

MindStudio模型训练场景精度比对全流程和结果分析

华为云开发者联盟

人工智能 华为云 企业号十月 PK 榜

Databend 在 MinIO 环境使用copy 命令 | 新手篇(3)

Databend

开源密码管理器更安全吗?(2)

神锁离线版

开源 网络安全 信息安全 数据安全 密码管理器

【C语言】do 关键字

謓泽

11月月更

颠覆传统BOM检查!用这个方法既​简单、快速又准确

华秋PCB

工具 PCB BOM PCB设计

链表只有面试有用?Redis 之父说:我不同意!

图灵教育

算法 链表 Redis 数据结构

HummerRisk 快速入门教程

HummerCloud

云安全 云原生安全 11月月更 HummerRisk

重磅发布.NET 7!更快、更强、更统一

Azure云科技

.NET 7

Oracle 表空间创建标准(二)

默默的成长

oracle 前端 11月月更

报名|企业数字化转型有何“利器”?一起来揭秘

元年技术洞察

数字化转型

大数据生态中的 RocketMQ 5.0

阿里巴巴云原生

阿里云 RocketMQ 云原生

链表只有面试有用?Redis 之父说:我不同意!

图灵社区

算法 链表 Redis 数据结构

数据可视化分析之新技能——魔数图

葡萄城技术团队

数据分析 前端 可视化 商业智能

为什么电脑主板晶振多采用14.318MHz和32.768KHz ?

元器件秋姐

晶振 元器件 元器件电商平台 元器件采购

阿里这份Java程序性能优化指南,让你的程序快上200%

小小怪下士

Java 程序员 性能优化

重磅发布!星汉未来全国开发者悬赏计划

星汉未来

云计算 开发者 运维 云原生 星汉未来

开源遇上华为云——DataX for HuaweiCloud OBS

华为云开发者联盟

开源 后端 华为云 企业号十月 PK 榜

五大模型揭秘深度学习用于时序预测的最新进展

云智慧AIOps社区

人工智能 机器学习 深度学习 算法 模型

SQL编写规范

默默的成长

前端 sql 11月月更

内存数据库如何发挥内存优势?

C++后台开发

算法 内存数据库 后端开发 linux开发 C++开发

KeeWiDB的高性能修炼之路:架构篇

腾讯云数据库

数据库 nosql redis 腾讯云数据库 KeeWiDB

费劲拿到的阿里P8架构师私藏(java岗的)JCF和JUC源码分析与实现笔记

程序知音

Java 高并发 源码刨析 java架构 后端技术

应用现代化产业联盟,正式成立

华为云开发者联盟

云计算 华为云 企业号十月 PK 榜

Data Warebase:实时湖仓与多模态检索——构建 AI 时代的智能数据底座|AICon 上海_大数据_AICon 全球人工智能开发与应用大会_InfoQ精选文章