收录了 Apach 频道下的 50 篇内容
本文节选自华章科技大数据技术丛书 《Apache Kylin权威指南(第2版)》一书中的部分章节。
dubbogo 项目每个 import 代码块都是如下组织格式:
Apache DolphinScheduler 社区线上 Meetup 讲师&议题正式对外征集啦!在全球疫情的笼罩下,我们的线上技术沙龙活动一直在紧锣密鼓的筹备举办,在此我们诚心向社区广大用户发起邀请,借你之力壮大社区影响力!社区重于代码,感谢所有的用户对社区的贡献!
对于整个Apache社区来说,2018年是伟大的一年。
Apache之道第20年
整个2021 年,ASF见证了2493名代码提交者和9604名作者更改了5.15亿行代码。
2018年12月12日 , Apache软件基金会(Apache Software Foundation,简称ASF)今天宣布Apache® Griffin™为顶级项目(Top-Level Project,简称TLP) 。
Airflow是一个开源的大数据工作流管理系统,在Adobe、Airbnb、Etsy、谷歌、ING、Lyft、PayPal、Reddit、Square、推特和美联航等组织得到广泛应用。
在Arrow成为顶级项目时,我们预测世界上大多数数据将在未来10年中通过Arrow进行处理。仅仅过了3年,我们就看到Arrow在各种分析、机器学习和人工智能工作负载中出现了大量的业界采用,并实现了价值增长。
简介: 6月14日,阿里巴巴计算平台事业部与阿里云开发者社区共同举办的大数据+AI Meetup 系列第一季即将重磅开启,此次 Meetup 邀请了来自阿里巴巴、Databricks、快手、网易云音乐的7位技术专家,集中解读大数据当前热门话题!
简介: 本文第一部分将简明扼要地介绍容器管理系统的演变;第二部分是 Flink on K8S 简介,包括集群的部署模式调度原理等等;第三部分是我们这一年以来关于 Flink on K8S 的实战经验分享,
本文将首先介绍实时数仓的概念,然后介绍 Flink+TiDB 实时数仓的架构与优势,接着给出一些已经在使用中的用户场景,最后给出在 docker-compose 环境下的 Demo,用于读者进行尝试。
简介:本文由网易云音乐实时计算平台研发工程师岳猛分享,主要从以下四个部分将为大家介绍 Flink + Kafka 在网易云音乐的应用实战: 1. 背景 、2. Flink + Kafka 平台化设计 、3. Kafka 在实时数仓中的应用 、4. 问题 & 改进
本文对 Gartner 近期发布的“分析查询加速的市场引导报告(Market Guide for Analytics Query Accelerators)”进行解读。
相信这两天很多社区小伙伴都看到 StarRocks 所谓”开源“的动态了,开源用户群里有很多小伙伴在讨论,也有很多关心 Apache Doris 的朋友来问我们,诸如“如何看待 StarRocks ‘开源' ”、” Apache Doris 跟 StarRocks 是什么关系“、”社区分化的原因是什么
本篇教程将展示如何使用 Flink CDC 构建实时数据湖,并处理分库分表合并同步的场景。