【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

Hortonworks 进军物联网,发布基于 Apache NiFi 项目的 DataFlow 产品

  • 2015-10-07
  • 本文字数:1157 字

    阅读完需:约 4 分钟

Hortonworks 已经在不知不觉中完成了他们的 DataFlow 平台,这个平台基于 Apache NiFi 项目并准备去解决物联网(IoAT)中的数据处理需求。

Hortonworks 公司在最近的一次研讨会上向石油和天然气行业的客户介绍了其DataFlow (HDF)平台。HDF(Hortonworks Data Flow)平台基于 Apache NiFi 项目,它是一种实时数据流处理 系统,在去年由美国安全局( NSA )开源并进入 Apache 社区,NiFi 初始的项目名称是 Niagarafiles。当 NiFi 项目开源之后,一些早先在 NSA 的开发者们创立了初创公司 Onyara,Onyara 随之继续 NiFi 项目的开发并提供相关的支持。Hortonworks 公司最近收购了 Onyara 并将其开发者整合到自己的团队中。

因为 NiFi 可以对来自多种数据源的流数据进行处理,Hortonworks 认为 HDF 平台非常适合用于物联网 (IoAT) 的数据处理。HDF 中的数据流动可以是多个方向,甚至是点对点的,用户可以同收集到的数据流进行交互,这种交互甚至可以延伸到数据源,比如一些传感器或是设备。按照 Hortonworks 公司的说法,HDF 产品是对 HDP 产品的补充,前者主要处理移动中的数据,而后者基于 Hadoop 技术,主要负责从静止的数据中获取洞察。

NiFi 项目在创建过程中遵循了一些理念:1)精细化管理信息流的能力;2)跟踪数据相关事件和信息的能力,比如数据从哪里来,在路径中发生了什么;3)保证控制和数据面的安全能力。NiFi 的主要特性包括:

  • 有保证的数据交付
  • 支持背压(back-pressure)机制的数据缓冲
  • 有优先级的队列
  • QoS
  • 数据溯源(Data provenance):NiFi 对数据流路径上的每次变化都会保留日志记录,从而保证结果的可追溯,以及数据的恢复、重播、审计和评估。
  • 通过日志记录数据的历史细节
  • 支持交互式命令和控制台,并对系统变化提供可视化的反馈
  • 支持流模板(Flow templates)
  • 支持插入式(Pluggable)/ 多角色(multi-role)的安全机制
  • 支持对数据操作的扩展
  • 支持集群管理

NiFi 并非只能用于物联网,实际上,它可以用于所有种类的实时数据处理,比如预测分析、欺诈检测、大数据注入、资源评估等等。NiFi 项目自身提供了 90 个数据处理器 (data processors),这其中包括了数据的编码、加密、压缩、转换、从数据流创建 Hadoop 的序列文件、同 AWS 交互、发送消息到 Kafka、从 Twitter 上获取消息,以及其它等等。你可以在拖放风格的可视化界面上来配置这些数据处理器,把它们链接到一起,并在它们之间使用背压机制来进行流控。NiFi 还提供了内置的自动扩展、请求复制、负载均衡和故障切换机制。

在 NiFi 的路标中还可以看到以下特性:对流的配置管理做进一步的提升、一个扩展和模板注册表、对Avro 的优先支持、交互式队列管理、多租户的数据流,以及其它。

目前,HDF 已经可以在沙箱式的环境中配合 Apache Ambari 进行测试验证。

查看英文原文: Hortonworks Addresses the IoAT with DataFlow Based on NiFi

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2015-10-07 19:005728

评论

发布
暂无评论
发现更多内容

程序员必备的思维能力:结构化思维

Java 程序员 后端

第一次凡尔赛,字节跳动3面+腾讯6面一次过,谈谈我的大厂面经

Java 程序员 后端

程序员你了解零拷贝吗?

Java 程序员 后端

程序流程控制(1)

Java 程序员 后端

站在筛选简历和面试流程角度,给培训班出身Java程序员一些建议!

Java 程序员 后端

第六章(1(1)

Java 程序员 后端

第六章(1

Java 程序员 后端

算法基础三之链表、栈、队列、递归

Java 程序员 后端

程序员如何利用技术变现?

Java 程序员 后端

简单的词法分析器

Java 程序员 后端

程序员缺乏经验的 7 种表现

Java 程序员 后端

程序员,你以为你很优秀,但却面试屡屡失败?

Java 程序员 后端

线上频出MySQL死锁问题!分享一下自己教科书般的排查和分析过程

Java 程序员 后端

终于等到了!阿里内部“性能怪兽”开源了,竟是Nginx

Java 程序员 后端

程序员面试防坑宝典,助你秋招一臂之力(建议收藏,文末有彩蛋)

Java 程序员 后端

窥探Tomcat整体架构,server

Java 程序员 后端

站在巨人的肩膀上学习:五位阿里大牛联手撰写的《深入浅出Java多线程》

Java 程序员 后端

终于有人把Java程序员必学知识点整理出来了,令人有如醍醐灌顶

Java 程序员 后端

程序员如何提高影响力

Java 程序员 后端

程序员欣宸文章汇总(Spring篇)

Java 程序员 后端

程序员膨胀了?年薪100万,腾讯程序员跟南航飞行员差不多?

Java 程序员 后端

程序流程控制

Java 程序员 后端

纯干货“Java面试指南+Java核心宝典”!

Java 程序员 后端

终于等到了!十位Java架构师整理的“阿里P7”养成计划

Java 程序员 后端

程序员必备基础:Git 命令全方位学习

Java 程序员 后端

程序员的黄金五年,如何做到从月薪8K达到38K?

Java 程序员 后端

线程的介绍与创建

Java 程序员 后端

程序员必须掌握的600个英语单词

Java 程序员 后端

程序员欣宸文章汇总(Java篇)

Java 程序员 后端

策略模式---动态更改算法

Java 程序员 后端

线索化二叉树的作用

Java 程序员 后端

Hortonworks进军物联网,发布基于Apache NiFi项目的DataFlow产品_开源_Abel Avram_InfoQ精选文章