写点什么

Data Warebase 一体化数据平台的云原生实践 | QCon 北京

  • 2025-04-01
    北京
  • 本文字数:1560 字

    阅读完需:约 5 分钟

大小:819.11K时长:04:39
Data Warebase一体化数据平台的云原生实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


ProtonBase 技术副总裁杨克特已确认出席并发表题为《Data Warebase-- 一体化数据平台的云原生实践》的主题分享,深度解析两大场景的技术攻坚:针对 TP/AP 一体化,如何通过分布式事务保障强一致性、行列混合存储优化资源隔离,实现 TP 和 AP 负载的高效共存;针对实时离线一体化,如何通过实时处理和增量计算技术融合的方案,突破传统 Lambda 架构冗余开发与时效性瓶颈,解决当前主流流批引擎痛点。同时分享 Data Warebase 如何以云原生存算分离为基础,集成统一元数据、智能资源调度等能力,简化多场景架构复杂度,为未来数据与 AI 深度协同提供坚实底座。


杨克特具备 10 多年核心系统设计和研发经验。曾任阿里巴巴资深技术专家,负责过搜索引擎、资源调度、实时监控等系统的设计和研发。具备丰富的开源经验,是 Apache Flink 和 Apache Druid 的 PMC 成员,以及 Apache 软件基金会成员。他在本次会议的详细演讲内容如下:


演讲提纲

1.数据平台的云原生进程

- 典型数据架构的演进过程- 数据本身对上云带来的挑战

2.当前数据平台的痛点和新场景需求

- 常见痛点介绍- TP / AP 一体化需求- 离线实时融合需求- AI 数据协同

3.云原生数据平台的基础架构设计- 如何保证数据系统扩展性- 数据分片策略的取舍- 解决分布式数据不一致的问题- 如何保证数据系统的弹性- 实时读写给弹性带来的挑战- 选择合适的存算分离架构

4.TP / AP 一体化需求- 常见场景介绍- 介绍核心技术挑战和实践- 如何保证 TP 和 AP 的数据一致性- 如何保证 TP 和 AP 的资源隔离和公平性- 介绍多种性能优化手段

5.离线实时一体化- 介绍 lambda,kappa 等架构的演进- 介绍现有方案在时效性、性能、资源开销三方面的取舍- 介绍现有方案的核心痛点- 提出新的实时处理和增量技术给这个场景带来的全新选择

6.AI 和数据的协同- 介绍 RAG 的基本原理- 传统搜索技术和向量检索的混合

7.Data Warebase 的实践和展望- Data Warebase 如何有效的融合这些核心技术- 通过 Data Warebase 简化数据架构的实践


您认为,这样的技术在实践过程中有哪些痛点?

一体化的方案,往往需要在用户开箱体验和单一场景极致优化中做出选择。为了系统尽可能的简单易用,我们选择了尽量减少配置,保障开箱体验的路线,但这样会牺牲一些极端单一场景的支持。


演讲亮点

- 在 TP/AP 一体化的场景下,大部分系统的方案还是通过数据同步(比如一份行存,一份列存)来实现。我们选择了在一份混合存储上来支持这个负载。- 在离线实时一体化场景下,当下主流的选择是一个流计算系统加一个批处理系统的 lambda 架构,或者以流计算系统为基础的 kappa 架构。我们提出了实时加增量计算融合的全新思路。


听众收益

- 了解当下数据平台的核心痛点和全新需求- 了解 TP/AP 一体化的挑战和实践方案- 了解离线实时体化的场景,挑战和实践方案


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-01 18:006627

评论

发布
暂无评论

最近又有出什么新电影,要不要停泊片刻,与好友相约一起来去看呢?

叶小鍵

【LeetCode】停在原地的方案数Java题解

Albert

算法 LeetCode 5月日更

华为中国生态大会2021举行在即,GaussDB将重磅发布5大解决方案

华为云开发者联盟

数据库 opengauss 华为云 GaussDB 云数据库

怎样做好服务提供方

程序员架构进阶

架构设计原则 服务化 28天写作 5月日更

单片机I/O控制方式(UART中断和DMA中断的区别)

不脱发的程序猿

嵌入式 单片机 GPIO的原理、特性 单片机I/O设备的控制方式

真实的DevOps落地,应该是这样的 ↓

BoCloud博云

DevOps 敏捷开发

如何让消息队列达到最大吞吐量?

万俊峰Kevin

微服务 消息队列 Queue Go 语言

ThreadLocal不好用?那是你没用对!

王磊

Java 后端 多线程 ThreadLocal 5月日更

声网、新东方、伴鱼英语的音视频技术解读

Jessie

音视频 视频消音

给Java小白,整理一套能上手的简单编程算法题!!!

小傅哥

Java 程序员 数据结构 算法 小傅哥

深度剖析 | 关于数据锁定和读取一致性问题

VoltDB

数据库 数据分析 5G

test1

靠谱哥

作为最好用的可观测平台,如何监控 Grafana

耳东@Erdong

Grafana Prometheus 5月日更

python str模块

若尘

Python编程 str 5月日更

GitHub开源:狗屁不通文章生成器

不脱发的程序猿

GitHub 开源 狗屁不通文章生成器

51CTO熊平:HarmonyOS是大势所趋

科技汇

VMWare中Ubuntu网络配置

进击的梦清

Linux 运维 vmware 网络配置

一文带你读懂PyQt:用Python做出与C++一样的GUI界面应用程序

老猿Python

微服务转型系列4:理念指导实践,厘清微服务建设的主要内容和顺序

BoCloud博云

微服务

不忘过去,不畏将来

小天同学

5月日更 汶川地震 不忘过去

Arthas-技术专题-使用指南

码界西柚

Arthas 5月日更

百信银行基于 Apache Hudi 实时数据湖演进方案

Apache Flink

大数据 flink

SpringBoot技术专题—来看看异步处理返回方案

码界西柚

Java WebAsyncTask 5月日更 AsyncContext DeferredResult

PyQt5 实现可空值的 QDateTimeEdit

一代咩神

Python PyQt QDateTimeEdit

追寻软件定义的梦想汽车

车骑

自动驾驶 智能汽车 软件定义汽车 汽车制造

音视频在智能手表上的应用

anyRTC开发者

音视频 WebRTC IoT RTC

参照STM32时钟树配置STM32CubeMX Clock Configuration(STM32L011G4U6为例)

不脱发的程序猿

单片机 STM32微控制器 时钟树 STM32CubeMX STM32时钟配置

Nginx性能分析之gpreftools

运维研习社

nginx 性能分析 5月日更

Fluid 进入 CNCF Sandbox,加速大数据和 AI 应用拥抱云原生

阿里巴巴云原生

人工智能 容器 云原生 调度 弹性计算

聊聊人像抠图背后的算法技术

华为云开发者联盟

hilens 抠图 工程 抠图算法 baseline

华为云官网负责人明哥:我们是如何做到门面不倒,8个月挑战业界翘楚?

华为云开发者联盟

JavaScript node.js Serverless 云原生 大前端

Data Warebase一体化数据平台的云原生实践 | QCon北京_架构_QCon全球软件开发大会_InfoQ精选文章