写点什么

大数据分析引擎 Apache Flink 升级成为 Apache 顶级项目

  • 2015-01-16
  • 本文字数:1043 字

    阅读完需:约 3 分钟

Apache Flink 是一个高效、分布式、基于 Java 实现的通用大数据分析引擎,它具有分布式 MapReduce 一类平台的高效性、灵活性和扩展性以及并行数据库查询优化方案,它支持批量和基于流的数据分析,且提供了基于 Java 和 Scala 的 API。从 Apache 官方博客中得知,Flink 已于近日升级成为Apache 基金会的顶级项目。Flink 项目的副总裁对此评论到:

Flink__ 能够成为基金会的顶级项目,自己感到非常高兴。自己认为社区的驱动将是 Flink 成长的最好保证。Flink 逐渐的成长以及众多新人加入该社区真是一件大好事。

从 Flink 官网得知,其具有如下主要特征:

1. 快速

Flink 利用基于内存的数据流并将迭代处理算法深度集成到了系统的运行时中,这就使得系统能够以极快的速度来处理数据密集型和迭代任务。

2. 可靠性和扩展性

当服务器内存被耗尽时,Flink 也能够很好的运行,这是因为 Flink 包含自己的内存管理组件、序列化框架和类型推理引擎。

3. 表现力

利用 Java 或者 Scala 语言能够编写出漂亮、类型安全和可为核心的代码,并能够在集群上运行所写程序。开发者可以在无需额外处理就使用 Java 和 Scala 数据类型

4. 易用性

在无需进行任何配置的情况下,Flink 内置的优化器就能够以最高效的方式在各种环境中执行程序。此外,Flink 只需要三个命令就可以运行在 Hadoop 的新 MapReduce 框架 Yarn 上,

5. 完全兼容 Hadoop

Flink 支持所有的 Hadoop 所有的输入 / 输出格式和数据类型,这就使得开发者无需做任何修改就能够利用 Flink 运行历史遗留的 MapReduce 操作

Flink 主要包括基于 Java 和 Scala 的用于批量和基于流数据分析的 API、优化器和具有自定义内存管理功能的分布式运行时等,其主要架构如下:

更多关于 Flink 的相关信息,请读者登录其托管在 GitHub 的主页和其官网查看。另外,开源的大数据分析平台除了 Flink 外,还包括 Apache 推出 Google Dremel 的开源版本 Apache Drill (2014 年 12 月份升级成为 Apache 基金会的顶级项目)、来自 NSA(美国国家安全局) Apache Nifi (2014 年 12 月份贡献给 Apache 基金会)、来自 Cloudera 公司开发的实时分析系统 Impala (受 Google Dremel 启发)、加州伯克利大学 AMPLab 开发的大数据分析系统 Shark 、Facebook 开源的分布式 SQL 查询引擎 Presto Hortonworks 开源的实时且类 SQL 的即时查询系统 Stinger 等等。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2015-01-16 01:3720973
用户头像

发布了 92 篇内容, 共 51.8 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

Voila:开源端到端全双工语音模型,延迟 195 毫秒;Gemini 2.5 Pro 预览版发布,视频理解能力提升丨日报

RTE开发者社区

办公常用的AI工具有哪些?8个流行的AI软件盘点!

职场工具箱

人工智能 PPT AIGC AI工具 AI生成PPT

YashanDB 知识库|OM 仲裁节点异常?如何手动切换主备并重新纳管数据库集群

数据库砖家

数据库

HarmonyOS App 如何实现全网比价工具

网罗开发

鸿蒙 HarmonyOS HarmonyOS NEXT

麦杰工业数据底座亮相德阳,为工业设备管理贡献力量

麦杰科技

YashanDB|别彬彬:金融科技进入智能化深水区,数据+逻辑才是新范式

数据库砖家

数据库

逻辑可视化的进化:从图灵完备到量子计算

代码制造者

AI编程

YashanDB 知识库|导入 dump 报错 YAS-00218?试试这一招快速定位

数据库砖家

数据库

从架构设计到核心组件深度解析SpringCloudAlibaba一站式解决方案

程序员高级码农

架构师 SpringCloud Alibaba spring-cloud

远程访问代理+内网穿透:火山引擎边缘网关助力自部署模型公网调用与全链路管控

火山引擎边缘云

网关 火山引擎 大模型 私有化部署 LLM

YashanDB:樊文飞院士观点速递|中国软件的未来:自强、自立、自信

数据库砖家

数据库

YashanDB演讲纪要|崖山科技陈志标:坚持自主原创,走长期主义之路

数据库砖家

数据库

YashanDB王南演讲精要|YAC 集群:为核心系统而生的平替路径

数据库砖家

数据库

第二章:数据治理的边界在哪里

数据小吏

数据治理

我在 Google L4 面试中的经验和教训

Nackydeng

程序员求职 谷歌面经 北美求职 google interview

YashanDB V23.3 正式发布:迈向企业核心系统的 1:1 替代新阶段

数据库砖家

数据库

技术解读|YashanDB 共享集群 V23.3:从架构到底层的全面升级

数据库砖家

数据库

YashanDB 知识库|exp 导出 CSV 报错 YAS-00218?别忘了这一步

数据库砖家

数据库

活动报名丨在旧金山&硅谷,遇见 Voice Agent 开发者&创业者

RTE开发者社区

HarmonyOS App 购物助手工具的开发与设计

网罗开发

鸿蒙 HarmonyOS HarmonyOS NEXT

5月13日观测云发布会:这一次,我们不只是发布产品

观测云

产品发布会

YashanDB 知识库|虚拟机重启后 YMP 无法启动?先看看 8093 端口谁在用

数据库砖家

数据库

【HarmonyOS】鸿蒙实现刻度尺

鸿蒙 HarmonyOS HarmonyOS NEXT 实践分享

《算法导论(第4版)》阅读笔记:p10-p10

codists

算法

麦杰工业数据底座亮相德阳,为工业设备管理贡献力量

麦杰研究院

大数据分析引擎Apache Flink升级成为Apache顶级项目_开源_李士窑_InfoQ精选文章