写点什么

流数据处理

收录了 流数据处理 频道下的 50 篇内容

Twitter 开源了流数据处理引擎 Heron

Twitter开源了作为Storm替代者的Heron流数据处理引擎。Heron上的应用向后兼容Strom,目前已得到广泛的关注和使用。本文是InfoQ对Heron项目负责人的访谈,涉及了Heron项目的构思、特点、开发情况、主要特性及开发社区与使用情况等。

使用 Dataflow 模型和 Apache Beam 进行流数据处理的基础

在QCon San Francisco 2016大会上,Frances Perry和Tyler Akidau做了一个关于“使用Apache Beam进行流数据处理的基础”的主题演讲。在演讲中探讨了Google的Dataflow模型以及Apache Beam的相关实现。

用 Apache Spark 进行大数据处理——第三部分:Spark 流

在本文,也就是Apache Spark系列的第三部分中,作者Srini Penchikala用一个日志分析样例应用讨论了如何将Apache Spark流框架用于实时流数据处理中。

如何基于Apache Pulsar和Spark进行批流一体的弹性数据处理?
如何基于 Apache Pulsar 和 Spark 进行批流一体的弹性数据处理?

本文介绍了以 Pulsar 做流数据平台,使用 Spark 进行批流一体数据处理的编程实践。

go-zero流数据处理利器
go-zero 流数据处理利器

流处理 (Stream processing) 是一种计算机编程范式,其允许给定一个数据序列 (流处理数据源),一系列数据操作 (函数) 被应用到流中的每个元素。同时流处理工具可以显著提高程序员的开发效率,允许他们编写有效、干净和简洁的代码。

stream
functional
Go 语言
YashanDB 数据库支持实时流数据处理的核心优势

在数据库技术领域,实时流数据处理面临诸多技术挑战,包括数据的高吞吐量处理、低延迟响应、数据一致性保证以及高可用性支持等。传统数据库系统常因性能瓶颈和扩展性不足难以满足流数据处理的需求。本文以YashanDB数据库为例,深入探讨其在支持实时流数据处理

从键盘键入到神经网络——深度学习在彭博的应用
从键盘键入到神经网络——深度学习在彭博的应用

本次分享介绍在神经网络领域最新的突破如何帮助彭博对文件进行自动化处理,展示其在数据提取及分析方面体现出来的更高准确度和更快处理速度。

为什么说Pravega是流处理统一批处理的最后一块拼图?
为什么说 Pravega 是流处理统一批处理的最后一块拼图?

本文是分布式流存储Pravega专栏第一篇文章

OpenYurt 联手 eKuiper,解决 IoT 场景下边缘流数据处理难题
OpenYurt 联手 eKuiper,解决 IoT 场景下边缘流数据处理难题

近日,OpenYurt 与开源项目 eKuiper 正式达成合作,完成了集成对接:从 v0.4.0 版本开始,OpenYurt 将正式支持部署和管理 eKuiper ,双方将共同帮助开发者轻松、高效地解决物联网边缘计算场景下流式数据处理和运维挑战。

云计算
阿里云
开源
云原生
中间件
eKuiper 联手 OpenYurt,解决物联网场景下边缘流数据处理难题
eKuiper 联手 OpenYurt,解决物联网场景下边缘流数据处理难题

云计算的出现使得物联网实现了爆炸式增长。

云计算
阿里云
物联网
IoT
#Kubernetes#
数据库内核杂谈(二十一): 流处理系统简介
数据库内核杂谈 (二十一): 流处理系统简介

InfoQ 热门专题之一又更新了

使用Redis流和Apache Spark处理实时数据
使用 Redis 流和 Apache Spark 处理实时数据

将Redis流作为流数据库,Apache Spark作为数据处理引擎,两者怎样共同部署才能做到最佳搭配?

继数据库、流处理器之后,数据管理的下一步是什么?
继数据库、流处理器之后,数据管理的下一步是什么?

本文将带我们了解流处理器和数据库的关联关系,以及为什么出现了一种新类型的数据库,这种数据库既关注固定数据,也关注移动数据。

流数据并行处理性能比较:Kafka vs Pulsar vs Pravega
流数据并行处理性能比较:Kafka vs Pulsar vs Pravega

当高性能遇上并行性

Pulsar 如何为批和流处理提供高效统一的数据存储
Pulsar 如何为批和流处理提供高效统一的数据存储

本次分享介绍 Pulsar 如何为批和流处理提供高效统一的数据存储

Pulsar 如何为批和流处理提供高效统一的数据存储 | QCon
Pulsar 如何为批和流处理提供高效统一的数据存储 | QCon

大数据的处理方式主要分为两类,一类是基于有边界的历史静态数据的批处理;和流数据的实时处理。由于具体业务和大数据技术发展历程的原因,在实际应用中,批处理和流处理的数据和技术还是被分隔成两个不同的部分。

大师级教程:构建高保真流处理数据管道
大师级教程:构建高保真流处理数据管道

“可X性”是数据系统构建的头等大事。

一文说清楚数据集成中的流处理与批处理的区别
一文说清楚数据集成中的流处理与批处理的区别

流数据处理实时、连续,适合处理无边界数据流;批数据处理则收集数据后一次性处理,适合处理边界明确的数据集。两者在数据处理方式、时间性、架构设计及应用场景上有所不同。

Apache
数据处理
批处理
ETL
流处理
使用 Kafka 处理高并发数据流

如果我们需要持续地处理大约20万条/秒的消息量,同时还需要保证数据的可用性和冗余,我们应该怎么做呢?最近Tadas Vilkeliskis在自己的博客上发表了一篇题为《数据流基础设施》的文章,分享了他们是如何应对这种场景的。

事件流处理:数据仓库的可伸缩替代品

Dan Pritchett提出,事件流处理程序有可能成为数据仓库应用的一种替代方案。在他看来,数据仓库在成本、可伸缩性和反应能力上都有很大的缺点。

流数据处理专题_资料-InfoQ中文网