20 个大数据必知领域之「Kafka」

发布于:2020 年 5 月 29 日 14:54

20个大数据必知领域之「Kafka」

20个大数据必知领域之「Kafka」
Kafka 是由 Apache 软件基金会开发的一个开源流处理平台,由 Scala 和 Java 编写。Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 对于像 Hadoop 一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。Kafka 的目的是通过 Hadoop 的并行加载机制来统一线上和离线的消息处理,也是为了通过集群来提供实时的消息。
软件名称 Apache Kafka 开发商 Apache 软件基金会软件平台跨平台软件版本 2.5.0

一线实践案例

阅读数:15 发布于:2020 年 5 月 29 日 14:54

评论

发布
暂无评论