写点什么

如何用元数据湖解决多 Lakehouse 治理难题|QCon 北京

  • 2025-04-06
    北京
  • 本文字数:1479 字

    阅读完需:约 5 分钟

大小:765.64K时长:04:21
如何用元数据湖解决多 Lakehouse 治理难题|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


Datastrato VP of engineering 史少锋已确认出席并发表题为《从碎片到统一:如何用元数据湖解决多 Lakehouse 治理难题》的主题分享。企业在采用多 Lakehouse 后,往往面临一些挑战,比如:如何实现多 Lakehouse 中数据的发现和共享,让应用、引擎以统一的方式接入;如何实现多 Lakehouse 的统一管理和治理,使用方式不一致导致的数据治理问题等。对此,基于标准协议的 Rest Catalog 以及支持多引擎的统一元数据服务,可以帮助企业统一管理 Lakehouse,解决上面提到的问题,此次分享将带来以上方面的最佳实践。


史少锋是 Datastrato VP of engineering,Apache 会员, Apache Incubator PMC, Mentor of Apache Gravitino, Gluten, HoraeDB 等多个项目;专注于大数据分析和云计算技术。曾任 eBay 全球分析基础架构部大数据高级工程师,IBM 云计算部门架构师等。他在本次会议的详细演讲内容如下:


演讲提纲

1. Lakehouse 架构背景

  • 什么是 Lakehouse 架构

  • Lakehouse 的核心优势:数据湖与数据仓库的结合

  • Lakehouse 在企业中的典型应用场景

2. 多 Lakehouse 趋势

  • 企业为何需要多 Lakehouse

  • 多 Lakehouse 的典型架构模式

  • 多 Lakehouse 带来的机遇与挑战

3. 多 Lakehouse 治理挑战

  • 数据发现与共享难题

  • 统一管理与治理困境

  • 实际案例:企业面临的具体问题

4. 什么是统一元数据湖

  • 统一元数据湖的定义与核心价值

  • 统一元数据湖的关键特性

  • 统一元数据湖与传统元数据管理的对比

5. 基于统一元数据湖的 Lakehouse 架构

  • 架构设计原则

  • 技术实现

  • 实际应用案例

6. 未来展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 协议适配问题:尽管基于标准协议的 Rest Catalog 是核心优势之一,但在实际企业环境中,不同的 Lakehouse 架构可能是在不同时期、由不同供应商构建的。这些系统可能对标准协议的支持程度参差不齐,存在部分功能无法完全适配 Rest Catalog 的情况。

  • 企业中可能同时存在多种处理引擎和分析引擎,这些引擎对元数据的理解和使用方式存在差异。统一元数据湖服务要支持多引擎,就需要针对每种引擎的特点进行定制化开发。


演讲亮点

  • 介绍基于标准协议的 Rest Catalog 及其在多 Lakehouse 环境中的技术优势,展示统一元数据湖

  • 如何实现跨平台、跨引擎的数据管理。

  • 分享如何通过统一元数据湖解决多 Lakehouse 环境中的数据发现、共享和治理难题,提供可落地的解决方案和实际案例。

  • 探讨统一元数据湖在数据架构中的未来发展方向,为企业提供战略性的技术选型建议。


听众收益

  • 掌握多 Lakehouse 治理的关键挑战与解决方案

  • 学习统一元数据湖的核心技术与实践

  • 获取可落地的数据治理最佳实践


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-06 17:0010653

评论

发布
暂无评论
发现更多内容

先是IPV6,再是WI-FI7你都清楚这是什么吗?

郑州埃文科技

ipv6 IP地址

源码解读预告 |TiFlash DeltaTree 引擎设计及实现解析!

TiDB 社区干货传送门

天翼云推荐新人返好礼,最高返利千元

天翼云开发者社区

大家谈的视频体验指标,都有哪些?如何测定?

声网

视频 Qoe Dev for Dev

dfs专项练习题

工程师日月

DFS 5月月更

5.26直播预告|《观见话题》第一期:跨境组网与加速上云的硬核解法

观测云

青藤入选信通院“数据安全推进计划”成员单位

青藤云安全

数据安全 信通院

【刷题第14天】两个链表的第一个公共节点

白日梦

5月月更

All in ONE!博睿数据重磅推出一体化智能可观测平台

博睿数据

博睿数据 IT运维 ONE平台

Authing 身份云招聘:增长黑客

Authing

招聘 科技

生命科学领域下的医药研发通过什么技术?冷冻电镜?分子模拟?IND?

GPU算力

阿里云联合鼎捷软件发布云上数字工厂解决方案,实现云MES系统本地化部署

阿里云弹性计算

数字化转型 MES系统 中小企业 云盒

ECSM隐私协议

潇潇雨歇

数据库连接池 -Druid 源码学习(十)

wjchenge

Druid 数据库连接池

论道原生:走进可观测性

Daocloud 道客

云原生 可观测性 OpenTelemetry

计算机网络概述

工程师日月

计算机网络 5月月更

宜搭5月更新:跨应用数据读写能力升级,AI组件内测开放

一只大光圈

Authing 被世界经济论坛评选为 2022 技术先锋企业

Authing

身份云 科技 Idaas 科技企业

明天,龙蜥2位专家直播,第22届计算机系统会议等活动来了!

OpenAnolis小助手

Linux 开源 直播 内核 龙蜥技术

AIRIOT物联网低代码平台如何配置OPC UA驱动?

AIRIOT

【活动报名】TiDB 社区天津站 Meetup 要来啦!

TiDB 社区干货传送门

极速调取客户保单,YRCloudFile 助力保险存储架构升级

焱融科技

AI 存储 NAS 数字金融

SysAK 应用抖动诊断篇—— eBPF又立功了! | 龙蜥技术

OpenAnolis小助手

Linux 工具 内核 ebpf 龙蜥技术

4月券商App行情刷新及交易体验评测报告,7家券商入围领导者象限

博睿数据

性能测试 系统运维 博睿数据 券商排行

【高并发】什么是ForkJoin?看这一篇就够了!

冰河

并发编程 多线程 高并发 协程 异步编程

【LeetCode】数组中的第K个最大元素Java题解

Albert

LeetCode 5月月更

Redis「9」主从、高可用性方案

Samson

redis 学习笔记 5月月更

OceanBase 源码解读(十一):Location Cache 模块浅析

OceanBase 数据库

oceanbase 源码解读

springboot集成activiti整套方案()

金陵老街

Vue ERP Activiti spring-boot

普渡科技宣布成立“PUDU-X”创新基金,为青年工程师筑梦未来

极客天地

美团二面:为什么Redis会有哨兵?

Java全栈架构师

Java 数据库 redis 程序员 面试

如何用元数据湖解决多 Lakehouse 治理难题|QCon 北京_架构_QCon全球软件开发大会_InfoQ精选文章