大咖直播-鸿蒙原生开发与智能提效实战!>>> 了解详情
写点什么

Data Warebase 一体化数据平台的云原生实践 | QCon 北京

  • 2025-04-01
    北京
  • 本文字数:1560 字

    阅读完需:约 5 分钟

大小:819.11K时长:04:39
Data Warebase一体化数据平台的云原生实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


ProtonBase 技术副总裁杨克特已确认出席并发表题为《Data Warebase-- 一体化数据平台的云原生实践》的主题分享,深度解析两大场景的技术攻坚:针对 TP/AP 一体化,如何通过分布式事务保障强一致性、行列混合存储优化资源隔离,实现 TP 和 AP 负载的高效共存;针对实时离线一体化,如何通过实时处理和增量计算技术融合的方案,突破传统 Lambda 架构冗余开发与时效性瓶颈,解决当前主流流批引擎痛点。同时分享 Data Warebase 如何以云原生存算分离为基础,集成统一元数据、智能资源调度等能力,简化多场景架构复杂度,为未来数据与 AI 深度协同提供坚实底座。


杨克特具备 10 多年核心系统设计和研发经验。曾任阿里巴巴资深技术专家,负责过搜索引擎、资源调度、实时监控等系统的设计和研发。具备丰富的开源经验,是 Apache Flink 和 Apache Druid 的 PMC 成员,以及 Apache 软件基金会成员。他在本次会议的详细演讲内容如下:


演讲提纲

1.数据平台的云原生进程

- 典型数据架构的演进过程- 数据本身对上云带来的挑战

2.当前数据平台的痛点和新场景需求

- 常见痛点介绍- TP / AP 一体化需求- 离线实时融合需求- AI 数据协同

3.云原生数据平台的基础架构设计- 如何保证数据系统扩展性- 数据分片策略的取舍- 解决分布式数据不一致的问题- 如何保证数据系统的弹性- 实时读写给弹性带来的挑战- 选择合适的存算分离架构

4.TP / AP 一体化需求- 常见场景介绍- 介绍核心技术挑战和实践- 如何保证 TP 和 AP 的数据一致性- 如何保证 TP 和 AP 的资源隔离和公平性- 介绍多种性能优化手段

5.离线实时一体化- 介绍 lambda,kappa 等架构的演进- 介绍现有方案在时效性、性能、资源开销三方面的取舍- 介绍现有方案的核心痛点- 提出新的实时处理和增量技术给这个场景带来的全新选择

6.AI 和数据的协同- 介绍 RAG 的基本原理- 传统搜索技术和向量检索的混合

7.Data Warebase 的实践和展望- Data Warebase 如何有效的融合这些核心技术- 通过 Data Warebase 简化数据架构的实践


您认为,这样的技术在实践过程中有哪些痛点?

一体化的方案,往往需要在用户开箱体验和单一场景极致优化中做出选择。为了系统尽可能的简单易用,我们选择了尽量减少配置,保障开箱体验的路线,但这样会牺牲一些极端单一场景的支持。


演讲亮点

- 在 TP/AP 一体化的场景下,大部分系统的方案还是通过数据同步(比如一份行存,一份列存)来实现。我们选择了在一份混合存储上来支持这个负载。- 在离线实时一体化场景下,当下主流的选择是一个流计算系统加一个批处理系统的 lambda 架构,或者以流计算系统为基础的 kappa 架构。我们提出了实时加增量计算融合的全新思路。


听众收益

- 了解当下数据平台的核心痛点和全新需求- 了解 TP/AP 一体化的挑战和实践方案- 了解离线实时体化的场景,挑战和实践方案


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-01 18:006735

评论

发布
暂无评论

震撼!阿里架构师全新产出Java面试突击宝典。Github标星疯涨!

Java你猿哥

spring Spring Boot JVM mybatis java面试

深度学习基础入门篇[六(1)]:模型调优:注意力机制[多头注意力、自注意力],正则化【L1、L2,Dropout,Drop Connect】等

汀丶人工智能

人工智能 机器学习 深度学习

零样本文本分类应用:基于UTC的医疗意图多分类,打通数据标注-模型训练-模型调优-预测部署全流程。

汀丶人工智能

人工智能 自然语言处理 深度学习 文本分类 小样本学习

大厂面试难?对标大厂“Java系统性能优化实战”二面阿里轻松搞定

Java你猿哥

面试 性能优化 SSM框架 Java性能优化

海通证券与易观千帆达成合作,构建优质客户生态圈

易观分析

金融 证券 经济

搭建一站式OpenHarmony设备开发Windows开发环境。

坚果

OpenHarmony 三周年连更

解决90%的面试!GitHub新兴“java面试手册 2023” 一网打尽BAT大厂

Java你猿哥

Java MySQL Spring Boot JVM MySQL面试

中移链合约常用开发介绍(三)工程化开发智能合约

BSN研习社

一次「找回」TraceId的问题分析与过程思考

Java 中间件 raceId

ChatGPT 真能带货吗?晒一下 SQL Chat 上线 3 周以来的真实运营数据📊

Bytebase

MySQL sql postgres ChatGPT SQL Server

Spring Boot如何使用Undertow容器?超级详细,建议收藏

bug菌

Spring Boot 三周年连更 Undertow

校企共建|阿里云与重庆大学人才培养交流会顺利举行

云布道师

阿里云

MySQL的varchar字段最大长度真的是65535吗?

Java你猿哥

MySQL 后端 SSM框架 varchar

BSN-DDC基础网络详解(九):跨链机制

BSN研习社

薪资结构重铸: Zebec将业务范围扩大到Web2薪资管理领域

鳄鱼视界

2023年免费堡垒机软件推荐-行云管家堡垒机免费版

行云管家

网络安全 堡垒机

别再说你不懂Java内存模型了!!!

Java 内存模型 JMM 并发

【4.14-4.21】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

火山引擎DataTester 3大功能升级:聚焦敏捷、智能与易用,帮助企业降本增效

字节跳动数据平台

大数据 AB testing实战 A/B 测试 对比实验

DataEase 对接明道云展示表格应用数据

搞大屏的小北

数据可视化 明道云 对接api 展示明道云

破防了!阿里用17个真实企业级项目阐述Java系统分析与架构设计

Java你猿哥

微服务架构 架构设计 Java系统性能 Redis开发与运维 MySQl部署

第二届中国国际软件发展大会|华为:构筑坚实软件根基,赋能数字经济高质量发展

极客天地

进击的 Java !

OpenAnolis小助手

Java 开源 云原生 GOTC 龙蜥技术

数智融合,生态链接丨 亚信科技“信伙伴”交流会(成都站)成功举办

亚信AntDB数据库

AntDB AntDB数据库 企业号 4 月 PK 榜

和 if else说再见,SpringBoot 这样做参数校验才足够优雅!

Java你猿哥

Java spring Spring Boot ssm if-else

css实现瀑布流效果

格斗家不爱在外太空沉思

CSS 三周年连更

chatGPT衣食住行10种场景系列教程(01)chatGPT热点事件汇总+开发利器

非喵鱼

java openai AIGC ChatGPT 三周年连更

微服务 Spring Boot 整合Redis分布式锁 实现优惠卷秒杀 一人一单

Bug终结者

redis 底层原理 三周年连更

大数据Hadoop之——HDFS小文件问题与处理实战操作

Openlab_cosmoplat

hdfs 开源社区 大数据Hadoop

等级保护5个级别详细说明-行云管家

行云管家

网络安全 等保 等级保护

Data Warebase一体化数据平台的云原生实践 | QCon北京_架构_QCon全球软件开发大会_InfoQ精选文章