AICon上海「Agent与多模态解决方案专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

Data Warebase:实时湖仓与多模态检索——构建 AI 时代的智能数据底座|AICon 上海

  • 2025-05-20
    北京
  • 本文字数:1365 字

    阅读完需:约 4 分钟

大小:718.29K时长:04:05
Data Warebase:实时湖仓与多模态检索——构建 AI 时代的智能数据底座|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


ProtonBase CEO 王绍翾已确认出席 AICon 上海并将在Data for AI,驱动智能的下一代数据基础专题发表题为《Data Warebase:实时湖仓与多模态检索 —— 构建 AI 时代的智能数据底座》的主题分享。随着 AI 技术的飞速发展,尤其是生成式 AI 和大模型的崛起,数据系统正面临前所未有的挑战与机遇。本次演讲将深入探讨一种创新的 AI 数据处理架构——分布式 Data Warebase(Data Warehouse + Database)。具体将解析这一架构如何通过实时数据处理和大规模并行计算,构建高效的 AI 湖仓环境,同时支持多模态检索(Multi-Modal Retrieval),以及如何基于它构建实时特征工程和在线特征库。


王绍翾现任 ProtonBase CEO ,北京大学本科,加州大学圣地亚哥分校博士。曾就职于美国的 Facebook,开发分布式内存数据库 memcached 和图关系数据库 TAO。2015 年加入阿里巴巴集团,先后就职于搜索事业部、阿里云计算平台事业部、达摩院,曾任达摩院机器智能 System AI Lab 负责人。国内最早期的 Apache Flink committer & PMC。2021 年离开阿里创立了 ProtonBase。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 生成式 AI 时代的数据挑战与机遇

  • 背景与趋势:生成式 AI 与大模型带来的变革,数据处理需求升级

  • 面临挑战:传统数据架构的局限,海量数据的实时处理,多模态检索的需求

2. Instant Lakehouse 的演进

  • 从传统到即时:从传统的库+仓+湖的多套产品架构,到一站式支持实时高效写入和查询的 Instant Lakehouse

  • 关键技术:大规模数据实时增删改查

3. 多模态检索应用

  • 重要性:多样化数据结构的融合与生成式 AI 对多模态检索的需求

  • 最佳实践:系统架构与技术揭秘

4. 实时特征工程与在线特征库

  • 核心需求:实时特征的高吞吐写入和查询,在线特征库在 AI 中的应用

  • 干货分享:实时特征工程的挑战和方案

5. 分布式 Data Warebase 架构解析

  • 设计理念:用一个引擎支持大部分数据服务的需求,完美覆盖 HTAP,流批一体,湖仓一体等中间态产品

  • 核心组件:融合数据仓库与数据库在存储和索引上的所有优点,使用最先进的存算分离架构确保秒级弹性伸缩

6. 应用场景与案例分享

  • 成功案例:金融、车联网、广告、游戏、电商等行业的应用与效果分析

7. 未来展望:Data Warebase 在 AI 应用中的演进方向


听众收益:

  • 深入了解生成式 AI 时代对数据系统的核心挑战与未来机遇

  • 掌握 Instant Lakehouse、Multi-Modal Retrieval System 以及 Feature Engineering 在生成式 AI 时代的技术演进与最佳实践

  • 学习如何通过 Data Warebase 构建高效、实时的 AI 数据处理架构,赋能下一代 AI 应用


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


大会开幕在即,了解更多报名和详情信息可扫码或联系票务经理 13269078023 咨询。



2025-05-20 14:001

评论

发布
暂无评论

小布助手在面向中文短文本的实体链指比赛中的实践应用

OPPO小布助手

人工智能 算法 模型训练 智能助手 短文本

写作——开启技术成长之路

神策技术社区

程序员 写作 日志

4轮技术面+1轮HR面,成功拿到腾讯40k*16的Offer ,详解面试流程和真题解析

Java 程序员 架构 面试

阿里专家分享的SpringCloudNginx高并发核心文档

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

80W美团架构师整理分享出了Spring5企业级开发实战文档

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

TronChain波场链智能合约开发详情|智能合约DAPP搭建

量化系统19942438797

智能合约 波场链

新思科技推出Rapid Scan新功能帮助开发团队在编写云原生应用的同时确保安全性

InfoQ_434670063458

新思科技 静态应用安全

“人人皆可成为AI开发者”!百度世界大会官宣百度松果学堂成立

百度大脑

人工智能

小米和网易两位资深工程师联合编写的HBASE原理与实践PDF

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

FL Studio基本功能介绍

懒得勤快

从 FFmpeg 性能加速到端云一体媒体系统优化

阿里云CloudImagine

开源 ffmpeg 视频处理 视频流 视频云

2021 年 8 月国产数据库排行榜:秋日胜春朝

墨天轮

数据库 TiDB oceanbase 国产数据库 达梦

神策分析 Web JS SDK 功能介绍

神策技术社区

程序员 代码 埋点

阿里专家分享内部绝密RocketMQ核心原理与最佳实践PDF

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

膜拜!终于拿到了美团大佬分享的Netty源码剖析与应用PDF

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

MySQL information_schema 系统库介绍

Simon

MySQL

神策 Android 全埋点插件介绍

神策技术社区

程序员 数据分析 埋点

神策分析 iOS SDK 代码埋点解析 | 数据采集

神策技术社区

程序员 数据 代码 埋点

微信小程序图片流&本地图片转base64处理方案

页面仔小杨

微信小程序

spring-boot 2.5.4,nacos 作为配置、服务发现中心,Cloud Native Buildpacks 打包镜像,GitLab CI/CD

Zhang

gitlab nacos CI/CD spring-boot 2.5.4 CNB

其实TCP聪明得很!详解TCP常见的五个异常处理场景

Java 编程 架构 程序人生 架构师

揭秘环境管理 Noah 的技术实现

Qunar技术沙龙

测试 Dev QA 环境 资源池

Android SDK 之用户路径采集

神策技术社区

数据 路径规划 分析 行为数据

迅雷不及掩耳盗铃

escray

生活记录 8月日更 搜房记

架構實戰營 - 畢業設計

Frank Yang

架构实战营

大数据实战训练营-sparkcore作业

Clarke

Golang高并发:生产者消费者模型

Regan Yue

Go 语言 8月日更 生产者消费者模型

iOS SDK 架构解析

神策技术社区

程序员 数据 埋点

烂大街的Spring循环依赖该如何回答?

Java spring 程序员 架构 面试

LeetCode题解:28. 实现 strStr(),暴力法,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

书单 | 无所不能的Python,从技术到办公,总有一款适合你!

博文视点Broadview

Data Warebase:实时湖仓与多模态检索——构建 AI 时代的智能数据底座|AICon 上海_大数据_AICon 全球人工智能开发与应用大会_InfoQ精选文章