写点什么

Data Warebase:实时湖仓与多模态检索——构建 AI 时代的智能数据底座|AICon 上海

  • 2025-05-20
    北京
  • 本文字数:1365 字

    阅读完需:约 4 分钟

大小:718.29K时长:04:05
Data Warebase:实时湖仓与多模态检索——构建 AI 时代的智能数据底座|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


ProtonBase CEO 王绍翾已确认出席 AICon 上海并将在Data for AI,驱动智能的下一代数据基础专题发表题为《Data Warebase:实时湖仓与多模态检索 —— 构建 AI 时代的智能数据底座》的主题分享。随着 AI 技术的飞速发展,尤其是生成式 AI 和大模型的崛起,数据系统正面临前所未有的挑战与机遇。本次演讲将深入探讨一种创新的 AI 数据处理架构——分布式 Data Warebase(Data Warehouse + Database)。具体将解析这一架构如何通过实时数据处理和大规模并行计算,构建高效的 AI 湖仓环境,同时支持多模态检索(Multi-Modal Retrieval),以及如何基于它构建实时特征工程和在线特征库。


王绍翾现任 ProtonBase CEO ,北京大学本科,加州大学圣地亚哥分校博士。曾就职于美国的 Facebook,开发分布式内存数据库 memcached 和图关系数据库 TAO。2015 年加入阿里巴巴集团,先后就职于搜索事业部、阿里云计算平台事业部、达摩院,曾任达摩院机器智能 System AI Lab 负责人。国内最早期的 Apache Flink committer & PMC。2021 年离开阿里创立了 ProtonBase。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 生成式 AI 时代的数据挑战与机遇

  • 背景与趋势:生成式 AI 与大模型带来的变革,数据处理需求升级

  • 面临挑战:传统数据架构的局限,海量数据的实时处理,多模态检索的需求

2. Instant Lakehouse 的演进

  • 从传统到即时:从传统的库+仓+湖的多套产品架构,到一站式支持实时高效写入和查询的 Instant Lakehouse

  • 关键技术:大规模数据实时增删改查

3. 多模态检索应用

  • 重要性:多样化数据结构的融合与生成式 AI 对多模态检索的需求

  • 最佳实践:系统架构与技术揭秘

4. 实时特征工程与在线特征库

  • 核心需求:实时特征的高吞吐写入和查询,在线特征库在 AI 中的应用

  • 干货分享:实时特征工程的挑战和方案

5. 分布式 Data Warebase 架构解析

  • 设计理念:用一个引擎支持大部分数据服务的需求,完美覆盖 HTAP,流批一体,湖仓一体等中间态产品

  • 核心组件:融合数据仓库与数据库在存储和索引上的所有优点,使用最先进的存算分离架构确保秒级弹性伸缩

6. 应用场景与案例分享

  • 成功案例:金融、车联网、广告、游戏、电商等行业的应用与效果分析

7. 未来展望:Data Warebase 在 AI 应用中的演进方向


听众收益:

  • 深入了解生成式 AI 时代对数据系统的核心挑战与未来机遇

  • 掌握 Instant Lakehouse、Multi-Modal Retrieval System 以及 Feature Engineering 在生成式 AI 时代的技术演进与最佳实践

  • 学习如何通过 Data Warebase 构建高效、实时的 AI 数据处理架构,赋能下一代 AI 应用


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


大会开幕在即,了解更多报名和详情信息可扫码或联系票务经理 13269078023 咨询。



2025-05-20 14:003823

评论

发布
暂无评论

互联网公司菜鸟成功逆袭进入阿里钉钉,从月薪 23K直接涨到了年薪65W(Android 岗面经)

android 程序员 移动开发

从零开始学数据结构和算法(四)哈希表的思想和二叉树入门

android 程序员 移动开发

iOS开发:上架App被拒原因5.1.1Legal Privacy - Data Collection and Storage

三掌柜

11月日更

今日头条技术架构分析

android 程序员 移动开发

什么,还有这么简单的OkHttp源码分析?

android 程序员 移动开发

traefik开放80端口时出现权限拒绝

ilinux

从0开始写一个基于Flutter的开源中国客户端(4)—

android 程序员 移动开发

为什么要学习HarmonyOS以及如何快速上手?(1)

android 程序员 移动开发

为什么要学习HarmonyOS以及如何快速上手?

android 程序员 移动开发

为什么要配置环境变量

android 程序员 移动开发

五年开发经验杭州竟找不到工作:Android开发真等于废人?

android 程序员 移动开发

为啥mybatis的mapper只有接口没有实现类,但它却能工作?(全网独一份!

android 程序员 移动开发

二本吊打985?看到原因,网友们服气了!

android 程序员 移动开发

二本渣渣,3年开发,从web前端转到Android移动端后拿到头条offer的心路历程(面试需要积累

android 程序员 移动开发

今日头条屏幕适配方案终极版正式发布!

android 程序员 移动开发

三面字节跳动被虐得“体无完肤”,15天读完这份pdf

android 程序员 移动开发

不要花大力气学-Kotlin

android 程序员 移动开发

为什么有着足够出色的技术,中年程序员依然面临中年危机?

android 程序员 移动开发

管理云服务器密码

坚果

云服务器 服务器密码 11月日更

互联网公司不招35岁以上程序员的真相

android 程序员 移动开发

从零开始实现一个插件化框架(一)

android 程序员 移动开发

仿新浪微博客户端--界面设计(1)

android 程序员 移动开发

优雅保活方案,原来Android还可以这样保活!

android 程序员 移动开发

京东把 Elasticsearch 用的真牛逼!

android 程序员 移动开发

以 29K 成功入职字节跳动,这份《 Android 面试笔记 》让我受益匪浅

android 程序员 移动开发

从Android开发者的角度看一看IOS和Flutter中的列表实现

android 程序员 移动开发

代码怎样review?

android 程序员 移动开发

不要学得太杂太乱!学习Android开发只要记住这几点!

android 程序员 移动开发

两年Android开发三面上岸腾讯,这些核心知识点建议收藏

android 程序员 移动开发

Redis 高可用篇:Cluster 集群原理剖析,集群可以无限拓展么

码哥字节

redis cluster NoSQL 数据库 11月日更

五年前的转正我没有留下,校招进不了大公司就是失败吗?

android 程序员 移动开发

Data Warebase:实时湖仓与多模态检索——构建 AI 时代的智能数据底座|AICon 上海_大数据_AICon 全球人工智能开发与应用大会_InfoQ精选文章