10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

流数据处理

收录了 流数据处理 频道下的 49 篇内容

Twitter 开源了流数据处理引擎 Heron

Twitter开源了作为Storm替代者的Heron流数据处理引擎。Heron上的应用向后兼容Strom,目前已得到广泛的关注和使用。本文是InfoQ对Heron项目负责人的访谈,涉及了Heron项目的构思、特点、开发情况、主要特性及开发社区与使用情况等。

使用 Dataflow 模型和 Apache Beam 进行流数据处理的基础

在QCon San Francisco 2016大会上,Frances Perry和Tyler Akidau做了一个关于“使用Apache Beam进行流数据处理的基础”的主题演讲。在演讲中探讨了Google的Dataflow模型以及Apache Beam的相关实现。

用 Apache Spark 进行大数据处理——第三部分:Spark 流

在本文,也就是Apache Spark系列的第三部分中,作者Srini Penchikala用一个日志分析样例应用讨论了如何将Apache Spark流框架用于实时流数据处理中。

如何基于Apache Pulsar和Spark进行批流一体的弹性数据处理?
如何基于 Apache Pulsar 和 Spark 进行批流一体的弹性数据处理?

本文介绍了以 Pulsar 做流数据平台,使用 Spark 进行批流一体数据处理的编程实践。

使用 Apache Kafka 和 KSQL 实现普及化流处理

本文作者Michael Noll介绍了如何使用KSQL实现流处理。KSQL是Apache Kafka的数据流SQL引擎。本文内容涵盖了有状态流处理中的挑战、KSQL是如何解决这些挑战的,以及KSQL是如何通过流和表构建了流数据和数据库之间的桥梁。

go-zero流数据处理利器
go-zero 流数据处理利器

流处理 (Stream processing) 是一种计算机编程范式,其允许给定一个数据序列 (流处理数据源),一系列数据操作 (函数) 被应用到流中的每个元素。同时流处理工具可以显著提高程序员的开发效率,允许他们编写有效、干净和简洁的代码。

stream
functional
Go 语言
20个大数据必知领域之「Heron」
20 个大数据必知领域之「Heron」

提高计算的时效性,更快的从数据中挖掘出信息和知识就意味着能够获取更大的价值。

为什么 Google 用 Apache Beam 彻底替换掉 MapReduce

1月10日,Apache软件基金会宣布,Apache Beam成功孵化,成为该基金会的一个新的顶级项目。谷歌坚信Apache Beam就是数据批量处理和流式处理的未来。

探寻流式计算
探寻流式计算

流式计算的介绍

如何搭建批流一体大数据分析架构?
如何搭建批流一体大数据分析架构?

当提到“实时分析”,大家脑海里首先浮现的是大屏上不断跳跃闪烁的数字和波动的曲线,让人有种纵观全局的掌控感。

贝壳:流式数据的平台化实践与挑战
贝壳:流式数据的平台化实践与挑战

本文介绍贝壳找房如何建设流式数据平台来满足业务方的需求。

从键盘键入到神经网络——深度学习在彭博的应用
从键盘键入到神经网络——深度学习在彭博的应用

本次分享介绍在神经网络领域最新的突破如何帮助彭博对文件进行自动化处理,展示其在数据提取及分析方面体现出来的更高准确度和更快处理速度。

为什么说Pravega是流处理统一批处理的最后一块拼图?
为什么说 Pravega 是流处理统一批处理的最后一块拼图?

本文是分布式流存储Pravega专栏第一篇文章

爱奇艺大数据实时分析平台的建设与实践
爱奇艺大数据实时分析平台的建设与实践

本文介绍爱奇艺大数据实时分析平台RAP的设计思路、技术架构演进以及业务应用实践。

分布式流处理框架 Apache Samza 成为 Apache 的顶级项目

近日,从Apache官方博客中得知,开源的分布式流处理框架Apache Samza历经18个月的孵化期后终于升级成为Apache的顶级项目。Samza由LinkedIn于2013年9月开源并作为孵化项目贡献给Apache, 它能够帮助开发者进行高速消息处理,同时具有还良好的容错能力。

对话 Confluent CTO :针对 Kafka 的分布式流数据查询引擎 KSQL 技术解读

Confluent发布KSQL:针对Apache Kafka的交互式、分布式流数据SQL引擎。KSQL支持对Apache Kafka中的主题进行多种流处理操作,比如聚合、连接、时间窗口以及会话。Confluent是在最近举行的Kafka峰会上宣布开源这个流SQL引擎的。

批处理 ETL 已经消亡,Apache Kafka 才是数据处理的未来吗?

在QCon旧金山2016会议上,Neha Narkhed做了“ETL已死,而实时流长存”的演讲,并讨论了企业级数据处理领域所面临的挑战。该演讲的核心前提是开源的Apache Kafka流处理平台能够提供灵活且统一的框架,支持数据转换和处理的现代需求。

基于Flink的超大规模在线实时反欺诈系统的建设与实践
基于 Flink 的超大规模在线实时反欺诈系统的建设与实践

如何更快速地预防或甄别可能的欺诈行为?如何从超大规模、高并发、多维度的数据中实现在线实时反欺诈?这些都是金融科技公司当下面临的主要难题。针对这些问题,InfoQ专访玖富集团,揭秘基于Flink的超大规模在线实时反欺诈技术是如何快速处理海量数据并打造良好的用户体验。

主流流处理框架比较(系列文章)

分布式流处理需求日益增加,包括支付交易、社交网络、物联网(IOT)、系统监控等。业界对流处理已经有几种适用的框架来解决,下面我们来比较各流处理框架的相同点以及区别。

OpenYurt 联手 eKuiper,解决 IoT 场景下边缘流数据处理难题
OpenYurt 联手 eKuiper,解决 IoT 场景下边缘流数据处理难题

近日,OpenYurt 与开源项目 eKuiper 正式达成合作,完成了集成对接:从 v0.4.0 版本开始,OpenYurt 将正式支持部署和管理 eKuiper ,双方将共同帮助开发者轻松、高效地解决物联网边缘计算场景下流式数据处理和运维挑战。

云计算
阿里云
开源
云原生
中间件
流数据处理专题_资料-InfoQ中文网