oozie

Apache Falcon 升级为 Apache 顶级项目

Apache Falcon是一个面向Hadoop的、新的数据处理和管理平台,设计用于数据移动、数据管道协调、生命周期...

雅虎如何在 Hadoop 集群上实现大规模分布式深度学习

雅虎在Hadoop集群上开发了大规模机器学习算法,将Hadoop集群打造成了雅虎首选的大规模机器学习平台。...

Hadoop Summit 2016 会场回顾(三)

2016年4月13日,都柏林的Liffey河畔,Hadoop Summit 2016在Convention会展中心盛大开幕。...

基于 Lambda 架构的股票市场事件处理引擎实践

鉴于金融行业特有的场景,我们实现了我们自己的架构(GF-Lambda),它介于Lambda和Kappa之间。...

跟着示例学 Oozie

本文包括一个完整的Oozie示例,包括过程设计、资源协调程序和工作流实现。

Apache Kylin在链家的实践
Apache Kylin 在链家的实践

伴随链家业务线的拓宽和发展,以及数据生态的建设,数据规模快速增长。从2015年大数据部门成立至今,集群...

来自 Amazon、Cloudera、Microsoft 与 IBM 的 Hadoop-as-a-Service

如今,公司越来越多地依赖大数据进行决策。Amazon、Cloudera和IBM都发布了它们的Hadoop-as-a-Service产品,...

比拼生态和未来,Spark 和 Flink 哪家强?

在前一篇文章《Spark 比拼 Flink:下一代大数据计算引擎之争,谁主沉浮?中,作者对 Spark 和 Flink 的引擎...

从算法实现到 MiniFlow 实现,打造机器学习的基础架构平台

基础架构(Infrastructure)相比于大数据、云计算、深度学习,并不是一个很火的概念,甚至很多程序员就业...