写点什么

大数据分析引擎 Apache Flink 升级成为 Apache 顶级项目

  • 2015-01-16
  • 本文字数:1043 字

    阅读完需:约 3 分钟

Apache Flink 是一个高效、分布式、基于 Java 实现的通用大数据分析引擎,它具有分布式 MapReduce 一类平台的高效性、灵活性和扩展性以及并行数据库查询优化方案,它支持批量和基于流的数据分析,且提供了基于 Java 和 Scala 的 API。从 Apache 官方博客中得知,Flink 已于近日升级成为Apache 基金会的顶级项目。Flink 项目的副总裁对此评论到:

Flink__ 能够成为基金会的顶级项目,自己感到非常高兴。自己认为社区的驱动将是 Flink 成长的最好保证。Flink 逐渐的成长以及众多新人加入该社区真是一件大好事。

从 Flink 官网得知,其具有如下主要特征:

1. 快速

Flink 利用基于内存的数据流并将迭代处理算法深度集成到了系统的运行时中,这就使得系统能够以极快的速度来处理数据密集型和迭代任务。

2. 可靠性和扩展性

当服务器内存被耗尽时,Flink 也能够很好的运行,这是因为 Flink 包含自己的内存管理组件、序列化框架和类型推理引擎。

3. 表现力

利用 Java 或者 Scala 语言能够编写出漂亮、类型安全和可为核心的代码,并能够在集群上运行所写程序。开发者可以在无需额外处理就使用 Java 和 Scala 数据类型

4. 易用性

在无需进行任何配置的情况下,Flink 内置的优化器就能够以最高效的方式在各种环境中执行程序。此外,Flink 只需要三个命令就可以运行在 Hadoop 的新 MapReduce 框架 Yarn 上,

5. 完全兼容 Hadoop

Flink 支持所有的 Hadoop 所有的输入 / 输出格式和数据类型,这就使得开发者无需做任何修改就能够利用 Flink 运行历史遗留的 MapReduce 操作

Flink 主要包括基于 Java 和 Scala 的用于批量和基于流数据分析的 API、优化器和具有自定义内存管理功能的分布式运行时等,其主要架构如下:

更多关于 Flink 的相关信息,请读者登录其托管在 GitHub 的主页和其官网查看。另外,开源的大数据分析平台除了 Flink 外,还包括 Apache 推出 Google Dremel 的开源版本 Apache Drill (2014 年 12 月份升级成为 Apache 基金会的顶级项目)、来自 NSA(美国国家安全局) Apache Nifi (2014 年 12 月份贡献给 Apache 基金会)、来自 Cloudera 公司开发的实时分析系统 Impala (受 Google Dremel 启发)、加州伯克利大学 AMPLab 开发的大数据分析系统 Shark 、Facebook 开源的分布式 SQL 查询引擎 Presto Hortonworks 开源的实时且类 SQL 的即时查询系统 Stinger 等等。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2015-01-16 01:3720950
用户头像

发布了 92 篇内容, 共 51.5 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

每年省200万?VMware隐性成本拆解与超融合替代实战

智驱前线

vmware 超融合

数字化转型的关键:MES系统成功部署的六大阶段与避坑指南

万界星空科技

数字化转型 制造业 mes 生产管理MES系统 软件实施

中烟创新连续两年被认定为国家级科技型中小企业

中烟创新

YashanDB全面解析:助力企业数字化转型的核心技术

数据库砖家

YashanDB容量规划教程,满足企业不断增长的数据需求

数据库砖家

AI智能体开发的技术框架

北京木奇移动技术有限公司

AI技术 AI智能体 软件外包公司

谙流 ASK × 中国联通:2.25 小时→秒级,存算分离革新数据传输

AscentStream

大数据

荣耀游戏中心新增礼包配置项丨开发加油站

荣耀开发者服务平台

荣耀开发者服务平台 荣耀HONOR 荣耀手机 荣耀游戏中心

YashanDB日志管理和监控工具使用指南

数据库砖家

YashanDB日志清理和维护实践,保障数据库健康

数据库砖家

新闻速递 | Altair 成功协办2025中国工业设计工程大会“工程仿真与创新设计学术论坛”

Altair RapidMiner

人工智能 AI 仿真 CAE 工业设计

YashanDB日志分析与异常检测实战技巧

数据库砖家

抖音视频列表API秘籍!轻松获取视频列表数据

tbapi

抖音API 抖音视频数据采集 抖音视频列表接口 抖音视频列表API

YashanDB容器化环境下的部署和监控方法

数据库砖家

督办产品新特性来袭,助力企业高效工作

inBuilder低代码平台

YashanDB日志管理技巧,助力企业精细化运维

数据库砖家

YashanDB日志系统架构与管理实战

数据库砖家

YashanDB日志系统详解及性能优化技巧

数据库砖家

海外舆情监测中的“沉默大多数”:非活跃用户态度的挖掘方法

沃观Wovision

舆情监测系统 海外舆情监测

Wispr Flow 创始人:我曾亲手扼杀硬件梦想,仅剩 5 人团队在裁员阴影下找到 PMF

RTE开发者社区

ChatGPT治好了我的拖延症,自由职业如何用AI实现无痛时间管理(附完整提示词)

田威AI

自由职业 时间管理 自律 ChatGPT flowping

YashanDB日志管理及故障恢复实战指南

数据库砖家

YashanDB日志管理与监控,保障企业数据库稳定运行

数据库砖家

区块链Web3开发上线

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

今年国内智能眼镜出货量预计达 290.7 万台;ElevenLabs 推出商用 Eleven Music API丨日报

RTE开发者社区

下周二见!奇虎360数据专家亲授:DolphinScheduler on K8s 生产级部署避坑指南!

白鲸开源

开源 Kubernetes 云原生 Apache DolphinScheduler 奇虎360

把数套数据传输通道一键“折叠”成 SeaTunnel:同程工程师周晓晨的实战笔记

白鲸开源

大数据 开源 Apache SeaTunnel

大数据分析引擎Apache Flink升级成为Apache顶级项目_开源_李士窑_InfoQ精选文章