写点什么

Hortonworks 进军物联网,发布基于 Apache NiFi 项目的 DataFlow 产品

  • 2015-10-07
  • 本文字数:1157 字

    阅读完需:约 4 分钟

Hortonworks 已经在不知不觉中完成了他们的 DataFlow 平台,这个平台基于 Apache NiFi 项目并准备去解决物联网(IoAT)中的数据处理需求。

Hortonworks 公司在最近的一次研讨会上向石油和天然气行业的客户介绍了其DataFlow (HDF)平台。HDF(Hortonworks Data Flow)平台基于 Apache NiFi 项目,它是一种实时数据流处理 系统,在去年由美国安全局( NSA )开源并进入 Apache 社区,NiFi 初始的项目名称是 Niagarafiles。当 NiFi 项目开源之后,一些早先在 NSA 的开发者们创立了初创公司 Onyara,Onyara 随之继续 NiFi 项目的开发并提供相关的支持。Hortonworks 公司最近收购了 Onyara 并将其开发者整合到自己的团队中。

因为 NiFi 可以对来自多种数据源的流数据进行处理,Hortonworks 认为 HDF 平台非常适合用于物联网 (IoAT) 的数据处理。HDF 中的数据流动可以是多个方向,甚至是点对点的,用户可以同收集到的数据流进行交互,这种交互甚至可以延伸到数据源,比如一些传感器或是设备。按照 Hortonworks 公司的说法,HDF 产品是对 HDP 产品的补充,前者主要处理移动中的数据,而后者基于 Hadoop 技术,主要负责从静止的数据中获取洞察。

NiFi 项目在创建过程中遵循了一些理念:1)精细化管理信息流的能力;2)跟踪数据相关事件和信息的能力,比如数据从哪里来,在路径中发生了什么;3)保证控制和数据面的安全能力。NiFi 的主要特性包括:

  • 有保证的数据交付
  • 支持背压(back-pressure)机制的数据缓冲
  • 有优先级的队列
  • QoS
  • 数据溯源(Data provenance):NiFi 对数据流路径上的每次变化都会保留日志记录,从而保证结果的可追溯,以及数据的恢复、重播、审计和评估。
  • 通过日志记录数据的历史细节
  • 支持交互式命令和控制台,并对系统变化提供可视化的反馈
  • 支持流模板(Flow templates)
  • 支持插入式(Pluggable)/ 多角色(multi-role)的安全机制
  • 支持对数据操作的扩展
  • 支持集群管理

NiFi 并非只能用于物联网,实际上,它可以用于所有种类的实时数据处理,比如预测分析、欺诈检测、大数据注入、资源评估等等。NiFi 项目自身提供了 90 个数据处理器 (data processors),这其中包括了数据的编码、加密、压缩、转换、从数据流创建 Hadoop 的序列文件、同 AWS 交互、发送消息到 Kafka、从 Twitter 上获取消息,以及其它等等。你可以在拖放风格的可视化界面上来配置这些数据处理器,把它们链接到一起,并在它们之间使用背压机制来进行流控。NiFi 还提供了内置的自动扩展、请求复制、负载均衡和故障切换机制。

在 NiFi 的路标中还可以看到以下特性:对流的配置管理做进一步的提升、一个扩展和模板注册表、对Avro 的优先支持、交互式队列管理、多租户的数据流,以及其它。

目前,HDF 已经可以在沙箱式的环境中配合 Apache Ambari 进行测试验证。

查看英文原文: Hortonworks Addresses the IoAT with DataFlow Based on NiFi

2015-10-07 19:006582

评论

发布
暂无评论
发现更多内容

从真实世界数据到监管级证据:临析智镜 ClinLens AI 受邀出席中国医药生物技术大会,发布真实世界研究解决方案

ModelWhale

人工智能 医学 专病库 临床科研

主数据管理在数据治理中实施的时机

inBuilder低代码平台

数据挖掘 数据中台 主数据管理

火山引擎多模态数据湖解决方案,以新一代数据基座迎接AI Agent时代

字节跳动数据平台

清理祖传 AK 不怕炸锅:基于 UModel 的云监控 2.0 身份凭证观测实践

阿里巴巴云原生

阿里云 云原生 RAM

翘楚共探AI落地 同驱产业新程:司马阅2025企业AI落地应用峰会上海站,在张江机器人谷落下帷幕

司马阅

人工智能

小红书同款3D百万运镜平替!他们用AE肝到崩,我们用这个一键直接出丨ScreenSage

阿星AI工作室

产品 AI 自媒体 AI工具

哈尔滨二级等保:核心定位、适用范围与三级等保差异

等保测评

AI英语学习App的开发

北京木奇移动技术有限公司

AI教育 软件外包公司 AI英语

字节一面凉了!被问 “你们项目为啥要用消息队列”,我张口就说 “解耦异步削峰”,面试官:你怕不是没真做过项目?

Fox爱分享

程序员 面试 开发 消息队列 大厂

大数据-140 ClickHouse CollapsingMergeTree详解 外部数据源最小闭环HDFS/MySQL/Kafka

武子康

MySQL 大数据 kafka hdfs Clickhouse

【新特性】 版本速递 | 华为云Versatile智能体平台 新增特性介绍(2025年10月发布)

华为云开发者联盟

人工智能 华为云 agent 华为云开发者联盟 MCP

大数据-139 ClickHouse MergeTree 最佳实践:Replacing 去重、Summing 求和、分区设计与物化视图替代方案

武子康

大数据 flink spark 分布式 Clickhouse

AIO Sandbox:为 AI Agent 打造的一体化、可定制的沙箱环境

字节跳动开源

开源 AI agent

聊点技术 | 智能可观测架构升级:构建统一、实时、高可用的数据处理平台

博睿数据

使用智能代理在亚马逊云科技无服务器架构上进行源代码分析

亚马逊云科技 (Amazon Web Services)

【浪潮海岳inDatax数据中台专栏】主数据管理在数据治理中实施的时机

inBuilder低代码平台

数据中台 数据治理 主数据管理

DeepSeek-OCR 开了窗,但企业落地的大门为何是EasyLink多模态视觉模型?

EasyLink_ai

人工智能 非结构化数据 智能体 OCR 智能文档图像解析技术

舆情监测软件的“心脏”:高质量数据源的构成与采集原理探秘

沃观Wovision

海外舆情监测 舆情监测软件 全球舆情监测

过程控制 软件维护经验总结(3)

万里无云万里天

工业 工厂运维 过程控制

哈尔滨三级等保:等级定位、适用范畴与二级等保核心区别

等保测评

AI向量知识库更新策略

阿汤哥

知识库

Java 运行时安全:输入验证、沙箱机制、安全反序列化

码界行者

Java 安全

“数据筑基” 赋能 “人工智能+”:解构“十五五”新质生产力的核心路径

袋鼠云数栈

大数据 数据治理 发布会 袋鼠云 易知微

从全球噪声到战略信号:全球舆情监控数据的融合、分析与决策赋能

沃观Wovision

海外舆情监测 舆情监测软件 全球舆情监测 全球舆情监控

云栖实录 | AI 搜索引擎如何驱动亿级物流:货拉拉 x 阿里云 Elasticsearch

阿里云大数据AI技术

elasticsearch 阿里云 货拉拉

2025年GEO公司排名:基于公开数据的可信评价榜单

新消费日报

大模型在百度电商机审应用的落地实践

百度Geek说

大模型 电商风控 内容风控 审核agent

springboot使用flyway,使用介绍、个人总结及报错场景如何修改

刘大猫

环境工程 城市规划 城市设计 环境纳米设计 环境遥感应用

对 GPT 5 模型路由机制的深度解析

Baihai IDP

程序员 AI 大模型 LLM 模型路由

2025年GEO优化服务评测:用户口碑与数据双重验证榜

新消费日报

Hortonworks进军物联网,发布基于Apache NiFi项目的DataFlow产品_开源_Abel Avram_InfoQ精选文章