Apache Kudu 在网易实时数仓的实践

阅读数:360 2019 年 9 月 26 日 13:54

Apache Kudu在网易实时数仓的实践

Kudu 作为一款新型的 OLAP 存储引擎,它的实时入库和支持更新、删除操作的优点,是对开源大数据生态短板有力的补充,达到“Fast Analytics on Fast Data”的效果。基于此,我们把 Kudu 深度集成进了网易猛犸大数据平台,用来支持网易考拉和网易云音乐的数据中台建设,并构建起了各自的实时数据仓库。同时,我们积极参与 Kudu 社区的工作,开发新功能(包括各种优化)并提交到社区,推动项目的发展。

网易杭州研究院数据科学中心软件工程师何李夫老师将在 ArchSummit 全球架构师峰会(北京站)2019 为我们带来《 Apache Kudu 在网易实时数仓的实践》的精彩分享。

演讲提纲

  1. 系统概述:Kudu 系统介绍;
  2. 使用场景:Kudu 在网易实时数仓建设中的使用案例;
  3. 经验分享:分享运维过程中的一些经验总结。

听众受益

  1. 使听众了解到 Kudu 项目的定位和技术背景;
  2. 使听众了解到 Kudu 在网易实时数仓建设中的实践经验。

嘉宾介绍

何李夫,网易杭州研究院数据科学中心软件工程师,Apache Kudu 项目 Committer & PMC,拥有多年后台高性能服务端系统设计、开发经验,曾负责网易云分布式缓存系统,现负责网易猛犸大数据平台数据仓库存储引擎开发工作。

更多实时计算的平台化实践的相关分享请访问 ArchSummit 全球架构师峰会(北京站)2019 官网。

https://archsummit.infoq.cn/2019/beijing/

评论

发布