写点什么

事件流处理:数据仓库的可伸缩替代品

  • 2008-11-09
  • 本文字数:834 字

    阅读完需:约 3 分钟

Dan Pritchett 在博客上提出了一种数据仓库应用的替代方案。虽然厌恶“只能单一位置及单一存储空间上实现的方案”,他也承认有时候必须先聚合数据才能作分析。他所说的正是数据仓库应用的功能——沿着某些变量轴聚合信息并转化数据间的关系。而在 Pritchett 看来,数据仓库应用在使用中有许多缺点。数据仓库应用不仅非常昂贵,“比较小的组织一般难以企及”,而且 ETL(Extract, Transform and Load,提取、转换、装载)软件的工作方式意味着要付出可伸缩性和反应能力的代价:

首先,ETL 给生产数据库增加了明显的负担。如果你的业务有空窗期可以做 ETL,那是最好的;如果没有,管理可伸缩性就是很大的挑战。第二,数据仓库里的数据新鲜度一般滞后 24 小时或更长,随着业务增长,滞后时间会越来越长。

Dan Pritchett 相信有一种方案更便宜,也更可伸缩:用 ESP( Event Stream Processor )处理事件流。

ESP 用类似 SQL 的语言处理各种事件流。与数据库和数据仓库通过 SQL 分析数据表类似,ESP 用它们的查询语言分析事件流。要想理解 ESP,可以把事件类比成数据库表中的行,而事件的属性则对应数据库表的列。每一种事件类型就等于是一张表。 […]

[ESP 分析] 数据的变化,而且就在变化发生的当时分析。我们不再进行批量的 ETL,而是把业务事件变成一连串的数据状态变化。这就创造出一种更易于管理的生产系统的伸缩模型。

[…]

ESP 可以做水平伸缩,因此可以达至一种更具成本效益的业务方案。而且由于 ESP 执行分析是实时的,因此得到的业务指标更加应时,并且不受业务增长的影响。

Dan 也特别指出这种方法的弱点,就是不能进行历史性的分析,不能从当前以外的角度去观察业务活动。Pritchett 提出用一种捕捉并重演事务的框架去克服此弱点,不过该方案相当昂贵。Tahir Akhtar 在帖子的留言中提出另一种弥补方法:用 ESP 替代 ETL,但在享用 ESP 的可伸缩性和反应能力优势的同时,继续使用数据仓库应用以保留历史分析能力。

查看英文原文: Event Stream Processing: Scalable Alternative to Data Warehouses?

2008-11-09 19:321607
用户头像

发布了 225 篇内容, 共 75.1 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

YashanDB离线升级回退

YashanDB

数据库 yashandb

《Operating System Concepts》阅读笔记:p203-p207

codists

操作系统

YashanDB安装常见问题

YashanDB

数据库 yashandb

通义灵码AI程序员深度测评:这些能力体验感拉满!满血版 DeepSeek 玩法大揭秘

阿里云云效

阿里云 云原生 通义灵码 AI程序员 AI程序员体验官

11 【HarmonyOS NEXT】 仿uv-ui组件开发之Avatar组件深度剖析(二)

全栈若城

HarmonyOS NEXT

团队高效协同必看:Trello、Teambition等 8 大实用工具

易成研发中心

项目管理 项目管理工具 项目管理软件

鸿蒙HarmonyOS NEXT开发实战:在社交分享类APP中实现跨设备无缝分享功能

chengxujianke

低代码与AI融合实践:解构智能化办公平台的企业级技术架构

不在线第一只蜗牛

YashanDB滚动升级

YashanDB

数据库 yashandb

2025《政府工作报告》解读:发展新质生产力,为现代化产业体系 “赋能提速”!

数造万象

人工智能 数字经济 政策 热门 #大数据

YashanDB更换服务器IP

YashanDB

数据库 yashandb

鸿蒙HarmonyOS NEXT开发实战:图书阅读类APP的跨设备数据同步解决方案

chengxujianke

AI 驱动开发,代码世界的革新

秃头小帅oi

YashanDB滚动升级回退

YashanDB

数据库 yashandb

13 【HarmonyOS NEXT】 仿uv-ui组件开发之Avatar组件进阶指南(四)

全栈若城

HarmonyOS NEXT

企业云盘评测:18款工具深度对比

易成研发中心

云盘 企业云盘 企业网盘

YC 孵化项目 Pinch:实时语音翻译视频会议平台;Mistral OCR:能处理多语言多模态复杂文档丨日报

RTE开发者社区

微信基于 StarRocks 的实时因果推断实践

StarRocks

微信 OLAP StarRocks 因果推断 数据库 大数据

英特尔至强6处理器家族,性能与能效的平衡之道

E科讯

YashanDB升级前准备

YashanDB

数据库 yashandb

12 【HarmonyOS NEXT】 仿uv-ui组件开发之Avatar组件设计精髓(三)

全栈若城

HarmonyOS NEXT

RocketMQ消息回溯实践与解析

Geek_e3e86e

Java 编程

鸿蒙HarmonyOS NEXT开发实战:新闻头条APP的列表数据加载优化

chengxujianke

YashanDB Windows客户端安装

YashanDB

数据库

通义灵码AI程序员深度测评:这些能力体验感拉满!满血版 DeepSeek 玩法大揭秘

阿里巴巴云原生

阿里云 云原生 通义灵码 AI程序员 AI程序员体验官

YashanDB Linux客户端安装

YashanDB

数据库 yashandb

YashanDB离线升级

YashanDB

数据库 yashandb

鸿蒙HarmonyOS NEXT开发实战:音乐畅听APP的音频播放与分享功能实现

chengxujianke

解锁YashanDB高效查询的关键功能 Group by分组

YashanDB

数据库 yashandb

15款热门电子协议签署平台横评,选型不踩坑

易成研发中心

电子合同 电子合同软件 电子合同系统

事件流处理:数据仓库的可伸缩替代品_架构_Sadek Drobi_InfoQ精选文章