写点什么

大数据分析引擎 Apache Flink 升级成为 Apache 顶级项目

  • 2015-01-16
  • 本文字数:1043 字

    阅读完需:约 3 分钟

Apache Flink 是一个高效、分布式、基于 Java 实现的通用大数据分析引擎,它具有分布式 MapReduce 一类平台的高效性、灵活性和扩展性以及并行数据库查询优化方案,它支持批量和基于流的数据分析,且提供了基于 Java 和 Scala 的 API。从 Apache 官方博客中得知,Flink 已于近日升级成为Apache 基金会的顶级项目。Flink 项目的副总裁对此评论到:

Flink__ 能够成为基金会的顶级项目,自己感到非常高兴。自己认为社区的驱动将是 Flink 成长的最好保证。Flink 逐渐的成长以及众多新人加入该社区真是一件大好事。

从 Flink 官网得知,其具有如下主要特征:

1. 快速

Flink 利用基于内存的数据流并将迭代处理算法深度集成到了系统的运行时中,这就使得系统能够以极快的速度来处理数据密集型和迭代任务。

2. 可靠性和扩展性

当服务器内存被耗尽时,Flink 也能够很好的运行,这是因为 Flink 包含自己的内存管理组件、序列化框架和类型推理引擎。

3. 表现力

利用 Java 或者 Scala 语言能够编写出漂亮、类型安全和可为核心的代码,并能够在集群上运行所写程序。开发者可以在无需额外处理就使用 Java 和 Scala 数据类型

4. 易用性

在无需进行任何配置的情况下,Flink 内置的优化器就能够以最高效的方式在各种环境中执行程序。此外,Flink 只需要三个命令就可以运行在 Hadoop 的新 MapReduce 框架 Yarn 上,

5. 完全兼容 Hadoop

Flink 支持所有的 Hadoop 所有的输入 / 输出格式和数据类型,这就使得开发者无需做任何修改就能够利用 Flink 运行历史遗留的 MapReduce 操作

Flink 主要包括基于 Java 和 Scala 的用于批量和基于流数据分析的 API、优化器和具有自定义内存管理功能的分布式运行时等,其主要架构如下:

更多关于 Flink 的相关信息,请读者登录其托管在 GitHub 的主页和其官网查看。另外,开源的大数据分析平台除了 Flink 外,还包括 Apache 推出 Google Dremel 的开源版本 Apache Drill (2014 年 12 月份升级成为 Apache 基金会的顶级项目)、来自 NSA(美国国家安全局) Apache Nifi (2014 年 12 月份贡献给 Apache 基金会)、来自 Cloudera 公司开发的实时分析系统 Impala (受 Google Dremel 启发)、加州伯克利大学 AMPLab 开发的大数据分析系统 Shark 、Facebook 开源的分布式 SQL 查询引擎 Presto Hortonworks 开源的实时且类 SQL 的即时查询系统 Stinger 等等。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2015-01-16 01:3720930
用户头像

发布了 92 篇内容, 共 51.4 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

淘宝天猫商品详情API:商品参数对比与选择

技术冰糖葫芦

API api 货币化 API 文档 API 测试

JavaScript 中的闭包和事件委托

不在线第一只蜗牛

JavaScript 前端

面试官:说说你的项目亮点?

王磊

Java

聊聊JVM如何优化

京东科技开发者

基于Golang实现Kubernetes边车模式

俞凡

golang 架构 微服务

TCL 实业 x TiDB丨从分销转向零售,如何考虑中台建设和数据库选型?

PingCAP

TCL 营销中台 实业

沧州杨埕水库:创建巡检“二维码”,为安全管理赋能

草料二维码

安全管理 设备管理 草料二维码 设备巡检二维码 设备巡检系统

3个办公网站,助你又快又好地搞定工作总结ppt!

彭宏豪95

效率工具 职场 PPT 效率办公 AI生成PPT

蔚来汽车 x TiDB丨单表超 20 亿条数据,从 MySQL 到 TiDB 的迁移思考与实践

PingCAP

MySQL TiDB 蔚来

开放签电子签章系统终于支持docker部署方式了

开放签开源电子签章

Docker 镜像 电子签章

Milvus 向量数据库进阶系列丨构建 RAG 多租户/多用户系统 (上)

Zilliz

人工智能 AI Milvus 向量数据库 大语言模型

电车风噪大?巧妙利用空气动力学和仿真技术,解决风噪影响

Altair RapidMiner

汽车 仿真 汽车仿真 altair 新能源车

基于人工智能的代码分析与 Bug 检测实战

霍格沃兹测试开发学社

微软将深度整合 Azure AI 与 GitHub;Stability AI 0.5 秒生成三维建模丨 RTE 开发者日报

声网

【京东云新品发布月刊】2024年7月产品动态

京东科技开发者

JAVA应用CPU跳点自动DUMP工具

京东科技开发者

ETL数据集成丨将GreenPlum数据同步至Doris数仓

谷云科技RestCloud

Doris greenplum 数据同步 ETL 数据集成工具

软件测试学习笔记丨BlueOcean 安装与使用

测试人

软件测试

AI大模型在业务受理的智能化实践和探索

鲸品堂

运营商 大模型 企业服务大模型

如何在Java、C、Ruby语言中使用Newscatcher API

幂简集成

ruby C语言 API java

某黑产最新免杀攻击样本详细分析

我再BUG界嘎嘎乱杀

黑客 网络安全 安全 网安

制造业数字化转型创新思路 |《数智新时代制造业数字化创新实践白皮书》上线!

tapdata

跨平台数据同步:京东商品详情API的多平台支持

技术冰糖葫芦

api 货币化 API 文档 API 测试 pinduoduo API

唯品会商品列表数据接口详解与实战应用(VIP.item_search)

tbapi

唯品会商品列表数据接口 唯品会API接口 唯品会

TapData 信创数据源 | 国产信创数据库 OceanBase 数据同步指南,加速国产化进程,推进自主创新建设

tapdata

大数据分析引擎Apache Flink升级成为Apache顶级项目_开源_李士窑_InfoQ精选文章