现场实操破解开发瓶颈,「2023 百度云智大会·智算大会 开发者沙龙」不容错过! 了解详情
写点什么

流式计算

收录了 流式计算 频道下的 50 篇内容

百度新一代流式计算系统DStream3
百度新一代流式计算系统 DStream3

本次分享介绍如何设计并实现一个业界领先的流式计算系统,以及工业级场景下的设计折衷、线上验证与实践经验。

Flink 流式计算在节省资源方面的简单分析
Flink 流式计算在节省资源方面的简单分析

小米在流式计算方面经历了Storm、Spark Streaming和Flink的发展历程。在整个发展历程中,逐步完善了稳定性、作业管理、日志和监控收集展示等关系到用户易用性和运维能力的特性,帮助越来越多的业务接入到了Flink。

流式计算优化指南:提高时效性
流式计算优化指南:提高时效性

本文介绍如何优化流式计算的速度,提高时效性。

大数据凉了?不,流式计算浪潮才刚刚开始

本文重点讨论了大数据系统发展的历史轨迹,行文轻松活泼,内容通俗易懂,是一篇茶余饭后用来作为大数据谈资的不严肃说明文。本文翻译自《Streaming System》最后一章《The Evolution of Large-Scale Data Processing》,在探讨流式系统方面本书是市面上难得一见的深度书籍,非常值得学习。

Kafka 设计解析(七):流式计算的新贵 Kafka Stream

本文介绍了Kafka Stream的背景,如Kafka Stream是什么,什么是流式计算,以及为什么要有Kafka Stream。接着介绍了Kafka Stream的整体架构,并行模型,状态存储,以及主要的两种数据集KStream和KTable。并且分析了Kafka Stream如何解决流式系统中的关键问题,如时间定义,窗口操作,Join操作,聚合操作,以及如何处理乱序和提供容错能力。最后结合示例讲解了如何使用Kafka Stream。

探寻流式计算
探寻流式计算

流式计算的介绍

Kafka Stream 的进化探索:流式 Serverless 计算
Kafka Stream 的进化探索:流式 Serverless 计算

也面临着数据量级和业务复杂度的双重考验。业界的流批一体,也逐渐转变为统一到流。近年来,新的流计算形态不断涌现。

新老手都值得看的Flink关键技术解析与优化实战
新老手都值得看的 Flink 关键技术解析与优化实战

本次分享主要分为三部分。首先介绍流式计算的基本概念, 然后介绍Flink的关键技术,最后讲讲Flink在快手生产实践中的一些应用,包括实时指标计算和快速failover。

搞流式计算,大厂也没有什么神话

这不是一个挽狂澜于既倒的英雄故事,没有什么跌宕起伏的情节,也没有耀眼的鲜花与掌声。而是千千万万个普通开发者中的一小群人,一边在业务中被动接受成长,一边在开源中主动寻求突破的一段记录。

flink
云原生
流式计算
数据实时化技术创新进展 | 一文览尽 Flink Forward Asia 2022 重磅干货内容
数据实时化技术创新进展 | 一文览尽 Flink Forward Asia 2022 重磅干货内容

FFA 大会照例总结了 Apache Flink 过去一年的发展情况。

数据中台:宜信敏捷数据中台建设实践
数据中台:宜信敏捷数据中台建设实践

本文介绍了宜信数据中台顶层设计,从中间件工具到平台及案例分析。

实时离线融合在唯品会的进展

实时大数据分析是指对规模巨大的数据进行分析,利用大数据技术高效的快速完成分析,达到近似实时的效果,更及时的反映数据的价值和意义。 所有人都能理解数据的时效性对于数据的价值至关重要。以唯品会为例,唯品会已经有一整套非常成熟的离线数据仓库系统。这套系统对于业务有非常大的指导意义,但目前碰到的问题是如何将各种计算、报表加速,从原来天级别、小时级别,加速到近实时来。

流式计算常见的开源实现
流式计算常见的开源实现

当前比较主流的流式数据线(Data Pipeline)共分为四个阶段。

10月月更
流式计算
TDengine3.0 流式计算引擎语法规则介绍

TDengine 3.0 引入了全新的流式计算引擎,既支持时间驱动的流式计算,也支持事件驱动的流式计算。本文将对新的流式计算引擎的语法规则进行详细介绍,方便开发者及企业使用。

数据库
tdengine
企业号九月金秋榜
基于 Kafka 的实时计算引擎如何选择?Spark or Flink ?
基于 Kafka 的实时计算引擎如何选择?Spark or Flink ?

本文分析了基于Kafka的两种计算引擎Spark和Flink的各自特点。

腾讯云 Serverless 衔接 Kafka 上下游数据流转实战
腾讯云 Serverless 衔接 Kafka 上下游数据流转实战

腾讯云 CKafka 作为大数据架构中的关键组件,起到了数据聚合,流量削峰,消息管道的作用。在 CKafka 上下游中的数据流转中有各种优秀的开源解决方案。如 Logstash,File Beats,Spark,Flink 等等。本文将带来一种新的解决方案:Serverless Function。

容错和高性能如何兼得: Flink 创始人谈流计算核心架构演化和现状

作为 Flink 发明人以及 data-Artisan(Flink 背后商业公司) CEO,Kostas Tzoumas 对于流式处理有深入的见解。文章分为两部分,本篇文章是上半部分有关流式计算核心能力的介绍和探讨。文章考虑到语言文化差异,对于部分较难理解部分加入译者的说明。

阿里新一代计算引擎 Blink 与 SQL 和机器学习的二三事

2017年10月19日,阿里巴巴的高级技术专家王绍翾(花名“大沙”)将为QCon上海的听众带来一场以大数据实时流计算与人工智能为主题的专题演讲,本专题将邀请来自腾讯、阿里、Facebook、Uber、Streamlio的多位一线专家分析实时流计算和人工智能领域的最新的技术成果、应用和趋势。本文整理自InfoQ对王绍翾的采访问答,他与我们分享了关于实时流计算的看法,并对选择Flink的原因、Blink对Flink所做的改进和优化、流数据SQL查询,以及阿里巴巴自研的基于Blink的在线机器学习平台Porsche等问题进行了解答。

未来几年,图计算或许是一条很好的赛道
未来几年,图计算或许是一条很好的赛道

在互联网时代,图数据越来越多地呈现出海量和动态等特性,静态图计算的模型和方法难以应对数据处理的需求。

流式计算专题_资料-InfoQ中文网