50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

大数据分析引擎 Apache Flink 升级成为 Apache 顶级项目

  • 2015-01-16
  • 本文字数:1043 字

    阅读完需:约 3 分钟

Apache Flink 是一个高效、分布式、基于 Java 实现的通用大数据分析引擎,它具有分布式 MapReduce 一类平台的高效性、灵活性和扩展性以及并行数据库查询优化方案,它支持批量和基于流的数据分析,且提供了基于 Java 和 Scala 的 API。从 Apache 官方博客中得知,Flink 已于近日升级成为Apache 基金会的顶级项目。Flink 项目的副总裁对此评论到:

Flink__ 能够成为基金会的顶级项目,自己感到非常高兴。自己认为社区的驱动将是 Flink 成长的最好保证。Flink 逐渐的成长以及众多新人加入该社区真是一件大好事。

从 Flink 官网得知,其具有如下主要特征:

1. 快速

Flink 利用基于内存的数据流并将迭代处理算法深度集成到了系统的运行时中,这就使得系统能够以极快的速度来处理数据密集型和迭代任务。

2. 可靠性和扩展性

当服务器内存被耗尽时,Flink 也能够很好的运行,这是因为 Flink 包含自己的内存管理组件、序列化框架和类型推理引擎。

3. 表现力

利用 Java 或者 Scala 语言能够编写出漂亮、类型安全和可为核心的代码,并能够在集群上运行所写程序。开发者可以在无需额外处理就使用 Java 和 Scala 数据类型

4. 易用性

在无需进行任何配置的情况下,Flink 内置的优化器就能够以最高效的方式在各种环境中执行程序。此外,Flink 只需要三个命令就可以运行在 Hadoop 的新 MapReduce 框架 Yarn 上,

5. 完全兼容 Hadoop

Flink 支持所有的 Hadoop 所有的输入 / 输出格式和数据类型,这就使得开发者无需做任何修改就能够利用 Flink 运行历史遗留的 MapReduce 操作

Flink 主要包括基于 Java 和 Scala 的用于批量和基于流数据分析的 API、优化器和具有自定义内存管理功能的分布式运行时等,其主要架构如下:

更多关于 Flink 的相关信息,请读者登录其托管在 GitHub 的主页和其官网查看。另外,开源的大数据分析平台除了 Flink 外,还包括 Apache 推出 Google Dremel 的开源版本 Apache Drill (2014 年 12 月份升级成为 Apache 基金会的顶级项目)、来自 NSA(美国国家安全局) Apache Nifi (2014 年 12 月份贡献给 Apache 基金会)、来自 Cloudera 公司开发的实时分析系统 Impala (受 Google Dremel 启发)、加州伯克利大学 AMPLab 开发的大数据分析系统 Shark 、Facebook 开源的分布式 SQL 查询引擎 Presto Hortonworks 开源的实时且类 SQL 的即时查询系统 Stinger 等等。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2015-01-16 01:3720917
用户头像

发布了 92 篇内容, 共 51.2 次阅读, 收获喜欢 5 次。

关注

评论

发布
暂无评论
发现更多内容

微店商品详情API助力多店铺管理和竞品监控

Datafox(数据狐)

微店数据接口 微店API 微店数据采集 微店商品详情API

2025年YashanDB数据库发展趋势及行业影响分析

数据库砖家

2025年YashanDB的具体发展趋势

数据库砖家

企业如何高效利用全球社交媒体监测软件做市场洞察?

沃观Wovision

社交媒体 舆情监测 海外舆情监控 沃观Wovision

【隐语SecretFlow用户案例】亚信科技构建统一隐私计算框架探索实践

隐语SecretFlow

区块链 隐私计算 可信数据空间 secretflow

Hudi系列:Hudi核心概念之索引(Indexs)

京东科技开发者

2025年YashanDB的行业发展趋势与启示

数据库砖家

2025年YashanDB发展趋势与市场前景

数据库砖家

2025年YashanDB数据库的发展趋势与应用前景

数据库砖家

看球总刷比分?好奇数据哪来的?你该认识一下「体育API」了

ggscoreLynne

2023年YashanDB数据库用户体验及反馈总结

数据库砖家

> search("2025年YashanDB对中小企业的影响")

数据库砖家

2025年YashanDB数据库功能更新及展望

数据库砖家

如何用低代码的能力提升软件厂商的定制化需求收益?从成本中心到利润引擎的商业模式重构

星云低代码中间件

软件开发 低代码 开发工具 业务系统

2025年YashanDB的技术创新与市场格局展望

数据库砖家

2025年YashanDB的未来趋势及市场影响

数据库砖家

2025年YashanDB技术创新热点全面扫描

数据库砖家

AI应用种类及开发

北京木奇移动技术有限公司

AI技术开发 软件外包公司 AI应用开发

2025年YashanDB的发展趋势与行业前景

数据库砖家

2025年YashanDB的技术演变与发展方向

数据库砖家

2025年YashanDB市场机遇与挑战

数据库砖家

2025年YashanDB数据库安全合规趋势与策略建议

数据库砖家

OpenAI推出Apps SDK,你的企业App跟上了吗?

FinClip

AI App

Hudi系列:表类型(Table & Query Types)

京东科技开发者

2024年YashanDB的创新特性及应用前景

数据库砖家

2025年YashanDB技术发展趋势全面剖析

数据库砖家

2025年YashanDB技术趋势:你需要关注的5个领域

数据库砖家

2025年YashanDB数据库的未来应用趋势

数据库砖家

图解AI核心技术:大模型、RAG、智能体、MCP

京东科技开发者

2025年YashanDB技术创新的前瞻性探讨

数据库砖家

2025年YashanDB数据库的未来趋势与发展方向

数据库砖家

大数据分析引擎Apache Flink升级成为Apache顶级项目_开源_李士窑_InfoQ精选文章