2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

事件流处理:数据仓库的可伸缩替代品

  • 2008-11-09
  • 本文字数:834 字

    阅读完需:约 3 分钟

Dan Pritchett 在博客上提出了一种数据仓库应用的替代方案。虽然厌恶“只能单一位置及单一存储空间上实现的方案”,他也承认有时候必须先聚合数据才能作分析。他所说的正是数据仓库应用的功能——沿着某些变量轴聚合信息并转化数据间的关系。而在 Pritchett 看来,数据仓库应用在使用中有许多缺点。数据仓库应用不仅非常昂贵,“比较小的组织一般难以企及”,而且 ETL(Extract, Transform and Load,提取、转换、装载)软件的工作方式意味着要付出可伸缩性和反应能力的代价:

首先,ETL 给生产数据库增加了明显的负担。如果你的业务有空窗期可以做 ETL,那是最好的;如果没有,管理可伸缩性就是很大的挑战。第二,数据仓库里的数据新鲜度一般滞后 24 小时或更长,随着业务增长,滞后时间会越来越长。

Dan Pritchett 相信有一种方案更便宜,也更可伸缩:用 ESP( Event Stream Processor )处理事件流。

ESP 用类似 SQL 的语言处理各种事件流。与数据库和数据仓库通过 SQL 分析数据表类似,ESP 用它们的查询语言分析事件流。要想理解 ESP,可以把事件类比成数据库表中的行,而事件的属性则对应数据库表的列。每一种事件类型就等于是一张表。 […]

[ESP 分析] 数据的变化,而且就在变化发生的当时分析。我们不再进行批量的 ETL,而是把业务事件变成一连串的数据状态变化。这就创造出一种更易于管理的生产系统的伸缩模型。

[…]

ESP 可以做水平伸缩,因此可以达至一种更具成本效益的业务方案。而且由于 ESP 执行分析是实时的,因此得到的业务指标更加应时,并且不受业务增长的影响。

Dan 也特别指出这种方法的弱点,就是不能进行历史性的分析,不能从当前以外的角度去观察业务活动。Pritchett 提出用一种捕捉并重演事务的框架去克服此弱点,不过该方案相当昂贵。Tahir Akhtar 在帖子的留言中提出另一种弥补方法:用 ESP 替代 ETL,但在享用 ESP 的可伸缩性和反应能力优势的同时,继续使用数据仓库应用以保留历史分析能力。

查看英文原文: Event Stream Processing: Scalable Alternative to Data Warehouses?

2008-11-09 19:321568
用户头像

发布了 225 篇内容, 共 74.2 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

鸿蒙NEXT安全控件深度揭秘:粘贴与保存控件全解析

最新动态

区块链DID 系统的开发流程

北京木奇移动技术有限公司

区块链技术 软件外包公司 DID开发

从概念到落地:RPA 才是 AI 技术规模化应用的关键载体

Techinsight

深入探索ArkWeb:构建高效且安全的Web组件

最新动态

「从自动化到智能体」:2025年选平台,决定你企业能走多远

Techinsight

如何在 HarmonyOS NEXT 中实现自定义 BackupExtensionAbility

最新动态

支持私有化本地部署|域名证书管理系统白皮书

37丫37

DevOps 运维自动化 自动化运维 域名系统 证书管理

鸿蒙NEXT密码自动填充服务:功能与应用场景全解析

最新动态

HarmonyOS方舟数据管理的未来展望

最新动态

鸿蒙NEXT之数据同步艺术之四:必要不充分理解分布式数据对象同步

最新动态

出海企业要做好境外舆情监测应注意哪些问题?

沃观Wovision

舆情监测 海外舆情监测 境外舆情监测 境外舆情监控

Apache SeaTunnel 9 月动态:多模块修复 + 新功能上线,社区贡献成果亮眼

白鲸开源

大数据 开源 数据同步 数据集成 Apache SeaTunnel

汇智引才,同筑未来|狄耐克&小米数字家庭工程师认证培训专班正式启动!

新消费日报

HarmonyOS NEXT 设备适配与生态拓展

最新动态

HarmonyOS NEXT智能车载应用开发实战

最新动态

HarmonyOS NEXT 安全生态构建与展望

最新动态

HarmonyOS NEXT 椭圆曲线密码学应用:ECC 与 SM2 深入剖析

最新动态

华为鸿蒙开发:掌握应用包名、图标、版本及权限配置

最新动态

Abaqus购买指南:除了软件费用还有其他成本吗?达索授权代理商思茂信息

思茂信息

abaqus abaqus有限元仿真 达索系统 达索代理商

芜湖,千兆网络下载速率只有10MB秒,过的什么苦日子

BugShare

macos 网络 网盘 网速

2026全球舆情趋势报告:洞察跨区域议题与商业风险图谱

沃观Wovision

舆情监测 海外舆情监控 舆情监测网站 全球舆情监测 全球舆情监控

从蓝牙到WLAN:HarmonyOS NEXT Connectivity Kit入门

最新动态

HarmonyOS NEXT与物联网安全融合之道

最新动态

大数据-138 ClickHouse MergeTree 实战详解|分区裁剪 × 稀疏主键索引 × marks 标记 × 压缩

武子康

大数据 flink 分布式 Clickhouse MergeTree

SD-WAN如何帮助企业降低网络运维成本?

光联世纪

如何做好境外舆情监测?五大策略解密

沃观Wovision

舆情监测 海外舆情监测 境外舆情监测 境外舆情监控 境外舆情

HarmonyOS NEXT 网络加速实战:打造极致网络体验

最新动态

鸿蒙编程江湖:深入理解TaskPool和Worker的并发任务执行

最新动态

数据采集故障频发,中控技术靠SeaTunnel实现日均TB级核心数据同步任务0出错

白鲸开源

AI 技术分享 数据同步 Apache SeaTunnel 中控技术

全球舆情的AI赋能:智能监控平台如何实现风险预测

沃观Wovision

舆情监控 舆情监测 海外舆情监控 全球舆情监测 全球舆情监控

事件流处理:数据仓库的可伸缩替代品_架构_Sadek Drobi_InfoQ精选文章