写点什么

大数据分析引擎 Apache Flink 升级成为 Apache 顶级项目

  • 2015-01-16
  • 本文字数:1043 字

    阅读完需:约 3 分钟

Apache Flink 是一个高效、分布式、基于 Java 实现的通用大数据分析引擎,它具有分布式 MapReduce 一类平台的高效性、灵活性和扩展性以及并行数据库查询优化方案,它支持批量和基于流的数据分析,且提供了基于 Java 和 Scala 的 API。从 Apache 官方博客中得知,Flink 已于近日升级成为Apache 基金会的顶级项目。Flink 项目的副总裁对此评论到:

Flink__ 能够成为基金会的顶级项目,自己感到非常高兴。自己认为社区的驱动将是 Flink 成长的最好保证。Flink 逐渐的成长以及众多新人加入该社区真是一件大好事。

从 Flink 官网得知,其具有如下主要特征:

1. 快速

Flink 利用基于内存的数据流并将迭代处理算法深度集成到了系统的运行时中,这就使得系统能够以极快的速度来处理数据密集型和迭代任务。

2. 可靠性和扩展性

当服务器内存被耗尽时,Flink 也能够很好的运行,这是因为 Flink 包含自己的内存管理组件、序列化框架和类型推理引擎。

3. 表现力

利用 Java 或者 Scala 语言能够编写出漂亮、类型安全和可为核心的代码,并能够在集群上运行所写程序。开发者可以在无需额外处理就使用 Java 和 Scala 数据类型

4. 易用性

在无需进行任何配置的情况下,Flink 内置的优化器就能够以最高效的方式在各种环境中执行程序。此外,Flink 只需要三个命令就可以运行在 Hadoop 的新 MapReduce 框架 Yarn 上,

5. 完全兼容 Hadoop

Flink 支持所有的 Hadoop 所有的输入 / 输出格式和数据类型,这就使得开发者无需做任何修改就能够利用 Flink 运行历史遗留的 MapReduce 操作

Flink 主要包括基于 Java 和 Scala 的用于批量和基于流数据分析的 API、优化器和具有自定义内存管理功能的分布式运行时等,其主要架构如下:

更多关于 Flink 的相关信息,请读者登录其托管在 GitHub 的主页和其官网查看。另外,开源的大数据分析平台除了 Flink 外,还包括 Apache 推出 Google Dremel 的开源版本 Apache Drill (2014 年 12 月份升级成为 Apache 基金会的顶级项目)、来自 NSA(美国国家安全局) Apache Nifi (2014 年 12 月份贡献给 Apache 基金会)、来自 Cloudera 公司开发的实时分析系统 Impala (受 Google Dremel 启发)、加州伯克利大学 AMPLab 开发的大数据分析系统 Shark 、Facebook 开源的分布式 SQL 查询引擎 Presto Hortonworks 开源的实时且类 SQL 的即时查询系统 Stinger 等等。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2015-01-16 01:3720803
用户头像

发布了 92 篇内容, 共 49.9 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

管理规划篇

姜戈

团队管理 团队组织

码农远程办公指北

大伟

软件开发生产率改进之我见(二)

清水

软件工程 软件开发 技术管理

ARTS week 2

锈蠢刀

Android原生人脸识别Camera2+FaceDetector 快速实现人脸跟踪

sar

python实现·十大排序算法之计数排序(Counting Sort)

南风以南

Python 排序算法 计数排序

联邦学习与推荐系统

博文视点Broadview

人工智能 大数据 学习 推荐系统

数据与广告系列三:合约广告与与衍生的第三方广告数据监控

黄崇远@数据虫巢

数据挖掘 互联网 广告 移动互联网

redis过期策略和内存淘汰机制

wjchenge

你的团队想做出什么成果?

姜戈

团队管理

终于,我也到了和Eclipse说再见的时候,难说再见

程序员小跃

Java eclipse IDEA

假如孔乙己是程序员

顿晓

学习 程序员 孔乙己

好的软件工程原则

pydata

Spring Security 两种资源放行策略,千万别用错了!

江南一点雨

Java spring springboot springsecurity

使用<input>标签实现六个格子验证码输入框

码字与律动

Java vue.js 大前端

你的团队是干什么的?

姜戈

团队管理 团队职能

突破困局

Neco.W

感悟 工作 创业心态

多线程与线程安全(实例讲解)

YoungZY

Java 多线程 线程安全

宕机原因千千万,被雷劈了最无奈

田晓旭

实现元素等高: Flexbox vs. Grid

寇云

CSS css3

揭秘神经拟态计算:缘何成为AI界新宠?

最新动态

栀子花,我们应该像你一样静静绽放

小天同学

个人感想 感悟 日常思考

提升输入效率第一步——切换双拼

dongh11

效率工具 提升效率 生产力 分享 有趣

你为什么“啃不动”你手中的技术书?

图灵社区

Java Python 算法 HTTP R语言

健身一周年:持续锻炼带来无法想象的改变

小鲸数据

学习 职业 专注 健身

源码分析 | Mybatis接口没有实现类为什么可以执行增删改查

小傅哥

Java 源码分析 小傅哥 mybatis 编程思维

你真的会用Mac中的Finder吗

Winann

macos 效率 App Mac

Vol.1 Java初探,新手必看!

pyfn2030

编程 新手指南

点击劫持:无X-Frame-Options头信息(修复)

唯爱

100天从 Python 小白到大神最良心的学习资源!

JackTian

Python GitHub 学习 Python-100-Days Python-Core-50-Courses

一致性算法 Raft 简述

架构精进之路

raft 一致性算法

大数据分析引擎Apache Flink升级成为Apache顶级项目_开源_李士窑_InfoQ精选文章