NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

大数据周报第 8 期:Apache Beam 将统一大数据平台的开发

  • 2016-05-09
  • 本文字数:789 字

    阅读完需:约 3 分钟

开源新闻:

  1. AirFlow 加入 Apache 孵化器
    AirFlow 加入 Apache 孵化器工程。AirFlow 是一个工作流和调度系统,用来管理数据管道。由 AirBnb 开发并在内部使用,于去年九月份开源。
  2. Apache Apex 成为 Apache 顶级项目
    Apache Apex 是基于 Hadoop 的流处理和批处理引擎,目前成为 Apache 顶级项目。
  3. Apache Beam 将统一大数据平台的开发
    Apache Beam 将统一大数据平台的开发。一直以来,大数据开发涉及到各种框架,比如,Hadoop、Storm、Spark 和 Flink 等,基于这些框架的开发要求的技术栈都各不同,这对开发者来说开发成本比较高,在 Beam 的统一下可以实现写一个程序既能在 Hadoop 中运行又可在 Spark 中运行。
  4. 开源项目:Spark 分布式训练深度神经网络
    用 Spark 分布式训练深度神经网络,可直接在已有 Spark 集群上安装,简单易学习。

实践:

  1. 基于 Storm 和 Morphlines 一体化实现实时清洗
    使用 Storm 做实时数据清洗(ETL),从数据 Arriving 到数据 Serving 一体化 (Topology) 解决。数据格式转换可以借助 kitesdk morphlines 来配置完成。
  2. Netflix 的数据管道演化系列》(1)、《 Netflix 的数据管道演化系列》(2)
    Netflix 的数据管道演化,从 Chukwa 管道到 Kafka 管道。并详细介绍 Kafka 管道架构技术,包括 Kafka 数据管道的设计原则、云服务中运行的挑战、发布策略、Kafka 容灾和 Kafka 监控等。
  3. Qsquery 支持 Syslog 和 Amazon Kinesis
    Qsquery 是 Facebook 开源的一款支持 SQL 查询系统的各项指标,可以用于 OSX 和 Linux 操作系统,它使得底层操作系统分析和监控性能更加直观。Airbnb 工程师开发插件支持 Syslog 收集,并把查询结果发送到 Amazon Kinesis Streams & Kinesis Firehose。

感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-05-09 19:006541
用户头像

发布了 43 篇内容, 共 27.7 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

事务特征以及隔离级别

爱好编程进阶

Java 程序员 后端开发

漫谈数据安全-老板担心敏感数据泄露,该如何建设数据的安全体系?

王老狮

大数据 Clickhouse 数据安全

电商秒杀系统设计

石小天

架构营毕业总结

Geek_28cf33

架构实战营 - 电商秒杀系统

邹玉麒

你一定需要知道的高阶JAVA枚举特性!

爱好编程进阶

Java 程序员 后端开发

架构训练营毕业设计—电商秒杀系统

yhjhero

#架构训练营

毕业设计秒杀系统架构

Geek_28cf33

再议String-字符串常量池与String

爱好编程进阶

程序员 后端开发

架构实战营-毕业总结

yhjhero

#架构训练营

业务学习-车企数字化转型调研

第519区

数字化生态 数据产品 汽车制造

服务日志规范

en

日志

二、面向云原生环境的安全体系

穿过生命散发芬芳

云原生安全 5月月更

ConcurrentHashMap

急需上岸的小谢

5月月更

API 工程化分享

郑子铭

golang protobuf Cloud Native

毕业设计项目:设计电商秒杀系统

炎彬

「架构实战营」

冷门的 Java 应用程序安全沙箱机制了解一下

爱好编程进阶

Java 程序员 后端开发

架构实战营模块6作业

哈啰–J

SpringBoot之:SpringBoot的HATEOAS基础

程序那些事

Java Spring Boot 程序那些事 5月月更

[数据分析实践]-音频分析-BirdCLE-3

浩波的笔记

人工智能 技术分析

C语言_文件IO操作函数总结

DS小龙哥

5月月更

javaAOP

工程师日月

java 并发 5月月更

探秘智慧民航:融云助力“中国第一国门”数字化转型记

融云 RongCloud

架构实战营模块8作业

哈啰–J

C++最佳实践 | 6. 性能

俞凡

c++ 最佳实践

架构实战训练营毕业总结

石小天

【刷题第九天】20. 有效的括号

白日梦

5月月更

Kubernetes下web服务的性能测试三部曲之一:准备工作

程序员欣宸

Java Kubernetes 5月月更

C++最佳实践 | 7. 正确性和脚本

俞凡

c++ 最佳实践

为 SaaS 企业提供 SaaS 服务

Authing

架构训练营总结

邹玉麒

「架构实战营」

大数据周报第8期:Apache Beam将统一大数据平台的开发_大数据_侠天_InfoQ精选文章