把握行业变革关键节点,12 月 19 日 - 20 日,AICon北京站即将重磅启幕! 了解详情
写点什么

事件流处理:数据仓库的可伸缩替代品

  • 2008-11-09
  • 本文字数:834 字

    阅读完需:约 3 分钟

Dan Pritchett 在博客上提出了一种数据仓库应用的替代方案。虽然厌恶“只能单一位置及单一存储空间上实现的方案”,他也承认有时候必须先聚合数据才能作分析。他所说的正是数据仓库应用的功能——沿着某些变量轴聚合信息并转化数据间的关系。而在 Pritchett 看来,数据仓库应用在使用中有许多缺点。数据仓库应用不仅非常昂贵,“比较小的组织一般难以企及”,而且 ETL(Extract, Transform and Load,提取、转换、装载)软件的工作方式意味着要付出可伸缩性和反应能力的代价:

首先,ETL 给生产数据库增加了明显的负担。如果你的业务有空窗期可以做 ETL,那是最好的;如果没有,管理可伸缩性就是很大的挑战。第二,数据仓库里的数据新鲜度一般滞后 24 小时或更长,随着业务增长,滞后时间会越来越长。

Dan Pritchett 相信有一种方案更便宜,也更可伸缩:用 ESP( Event Stream Processor )处理事件流。

ESP 用类似 SQL 的语言处理各种事件流。与数据库和数据仓库通过 SQL 分析数据表类似,ESP 用它们的查询语言分析事件流。要想理解 ESP,可以把事件类比成数据库表中的行,而事件的属性则对应数据库表的列。每一种事件类型就等于是一张表。 […]

[ESP 分析] 数据的变化,而且就在变化发生的当时分析。我们不再进行批量的 ETL,而是把业务事件变成一连串的数据状态变化。这就创造出一种更易于管理的生产系统的伸缩模型。

[…]

ESP 可以做水平伸缩,因此可以达至一种更具成本效益的业务方案。而且由于 ESP 执行分析是实时的,因此得到的业务指标更加应时,并且不受业务增长的影响。

Dan 也特别指出这种方法的弱点,就是不能进行历史性的分析,不能从当前以外的角度去观察业务活动。Pritchett 提出用一种捕捉并重演事务的框架去克服此弱点,不过该方案相当昂贵。Tahir Akhtar 在帖子的留言中提出另一种弥补方法:用 ESP 替代 ETL,但在享用 ESP 的可伸缩性和反应能力优势的同时,继续使用数据仓库应用以保留历史分析能力。

查看英文原文: Event Stream Processing: Scalable Alternative to Data Warehouses?

2008-11-09 19:321588
用户头像

发布了 225 篇内容, 共 74.6 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

绘制监控页面的一些最佳实践

耳东@Erdong

最佳实践 监控 28天写作 12月日更

如何让TiDB在云上智能运维 (TiDB Hackathon 赛题)

如果迎着风就飞

云原生 operator TiDB Operator 存储上云

启梦行动再扬帆 | 2021启智社区优秀项目&优秀开发者评选结果重磅揭晓

OpenI启智社区

启智社区 优秀开发者 优秀开源项目

Dubbo 框架学习笔记十四

风翱

dubbo 12月日更

Go+ 结构体方法定义教程

liuzhen007

28天写作 12月日更

react源码解析18事件系统

buchila11

React

黑客是怎么盗取你的密码的?

喀拉峻

黑客 网络安全

盘点2021(一)

圣迪

复盘 盘点 2021

基于流程管理,提高工作质量和效率

流程管理

绩效评估的why&how

mtfelix

28天写作

为什么很难得出结论

将军-技术演讲力教练

Go 语言快速入门指南:第七篇 方法

宇宙之一粟

12月日更

26《重学JAVA》--网络编程之Socket类

杨鹏Geek

Java25周年 28天写作 12月日更

Dubbo 框架学习笔记十五

风翱

dubbo 12月日更

c语言学习笔记2021/12

姬翔

从0到1带你深入理解log4j2漏洞

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

低代码实现探索(十一)流程中的动作执行器

零道云-混合式低代码平台

第一财经年终总结

石云升

读书笔记 28天写作 12月日更

为什么?为什么要先问目的?(27/28)

赵新龙

28天写作

慢跑的正确打开方式

wood

跑步 28天写作

性能即天元:vivo S12的落子与棋局

脑极体

从AI前沿到科技自立:百度大脑的风向标意义

脑极体

过冬

搬砖的周狮傅

随笔杂谈

HarmonyOS(鸿蒙)——滑动事件之上下左右滑动

李子捌

28天写作 21天挑战 鸿蒙开发 12月日更

百度智能云 AI 公有云服务市场,连续五次第一!

百度大脑

人工智能

一文了解 Redis 内存监控和内存消耗

程序员历小冰

redis 28天写作 12月日更

记录与 Electron 的第一次亲密接触

何佩弦

跨平台 Electron

低代码实现探索(十)流程执行器

零道云-混合式低代码平台

2021年全国人工智能大赛正式启动,396万奖金等你报名!

OpenI启智社区

人工智能大赛

软件设计之非功能性

xcbeyond

软件设计 28天写作 12月日更 非功能性

.NET中的Husky工具

喵叔

28天写作 12月日更

事件流处理:数据仓库的可伸缩替代品_架构_Sadek Drobi_InfoQ精选文章