写点什么

HTAP:统一数据库系统的兴衰?

  • 2025-06-16
    北京
  • 本文字数:1279 字

    阅读完需:约 4 分钟

大小:631.70K时长:03:35
HTAP:统一数据库系统的兴衰?

Zhou Sun 最近的文章《HTAP已死》在数据社区引发了一场关于混合事务/分析处理(HTAP)未来的辩论。HTAP 旨在帮助大规模集成历史数据和在线数据,支持更灵活的查询方法,并降低业务复杂性。

 

在这篇文章中,Mooncake Labs 的联合创始人兼首席执行官Sun认为,将事务性和分析性工作负载统一到单一系统中的长期承诺未能实现。Gartner 在十多年前引入了术语 HTAP(混合事务和分析处理),宣布它是“下一个大型数据库架构”,其目标是缩小运维系统和分析系统之间的差距。

 

文章追溯了 OLTP 和 OLAP 数据库工作负载的历史,它们在 20 世纪 70 年代开始是一体的,十年后分离,HTAP 在 2010 年代试图再次将它们合并。Sun 认为,资源竞争、复杂性和不断演变的硬件架构等实际挑战使得专用的、专业的系统成为更可行的前进道路。Sun 写道:

 

云也开始从紧密耦合的仓库转向基于对象存储构建的模块化数据湖。在试图摆脱传统的仓库/数据库时,数据团队开始组装自己的定制系统。

 

多年前,HTAP 被认为是定价、欺诈检测和个性化等新兴工作负载的需求,而 SingleStoreDB 和 TiDB 是市场上的主要参与者。作者认为,像 Snowflake 和 BigQuery 这样的云数据仓库在 2020 年代通过专注于分析处理并将存储与计算分离,成为明显的赢家,这允许在没有 HTAP 系统复杂性的情况下提供可扩展的、具有成本效益的解决方案。Sun 指出,虽然事务性数据库也在发展,但它们在很大程度上仍然与分析分离,将两者合并的尝试未能得到广泛采用。Sun 补充道:

 

即使在今天的解耦数据堆栈中,需求仍然是相同的:对新鲜事务数据进行快速的 OLAP 查询。现在,这通过流管道网络、云数据湖和实时查询层来实现。它仍然是 HTAP;而是通过组合而不是数据库的整合。

 

为了超越传统的仓库和数据库,数据团队现在正在使用 Sun 所称的“一流”组件组装他们自己的定制系统。这些架构结合了 OLTP 系统和流处理器作为预写日志(WAL), Iceberg 作为存储层,Spark 和 Trino 这样的查询引擎用于数据处理,以及 ClickHouse 或 Elasticsearch 索引这样的实时系统。在Hacker News上,Statsbomb 的创始人、前首席技术官Thom Lawrence,写道:

 

当替代方案如此复杂且有如此多的活动部件时,你不能说 HTAP 已死。大多数企业都在燃烧大量的资源,实际上只是在为零商业价值的数据洗牌。我们的梦想是一个单一的数据网格呈现一个 SQL 用户空间(...),我们接近但还没有到达那里,我们已经接近了,但我们还没有达到那个目标,如果人们停止尝试达到这个终点,我会非常愤怒。

 

Sun 的文章在社区引发了辩论,Percona 的创始人和开源倡导者 Peter Zaitsev总结道

 

没有“一刀切”的解决方案——虽然大型团队意识到紧密耦合是有问题的,但对于小型团队和小型项目来说,拥有一个“一切”都做得相当好的单一数据库实际上是非常方便和实用的,因此我认为 HTAP 作为一个特性非常有意义,但可能不作为一个名称,因为我们需要我们的数据库不仅仅是分析和事务性的。

 

随着近年来 PostgreSQL 的不断成功,许多数据工程师现在都同意曾经很有前途的 HTAP 模型正在被重新审议。随着技术的发展,新的范式正在挑战 HTAP 在现代数据架构中的相关性。

 

原文链接:

https://www.infoq.com/news/2025/06/htap-databases/

2025-06-16 09:293704

评论

发布
暂无评论

[架构实战营] 模块九作业

Geek_0ed632

「架构实战营」

第十节:SpringBoot中的日志管理

入门小站

spring-boot

跨平台应用开发进阶(三): uni-app 实现资源在线升级/热更新

No Silver Bullet

uni-app 更新 版本升级 2月月更

微信朋友圈业务架构分析

Geek_1b4338

#架构实战营 「架构实战营」

程序员,如何避免无效会议?

蜜糖的代码注释

2月月更

微信朋友圈高性能复杂度分析

「架构实战营」

Web Components 系列—— 详解 Slots

CRMEB

验收测试驱动开发后记

Bruce Talk

敏捷 Agile User Story

DevOps进阶(二):DevOps 发展史

No Silver Bullet

DevOps 2月月更

springboot druid 数据库连接池连接失败后一直重连

Jeremy Lai

蜜罐中利用jsonp跨域漏洞和xss漏洞的分析

H

网络安全 安全漏洞

无人管的 InfoQ 每周精选

scruel

InfoQ

华为云IoT体验:基于IoT平台构建智慧路灯应用

乌龟哥哥

2月月更

Go 语言入门很简单:String

宇宙之一粟

Go 语言 2月月更

在线ASCII Banner艺术字生成工具

入门小站

工具

跨平台移动APP开发进阶(一):mui开发注意事项

No Silver Bullet

App 跨平台 2月月更 mui

渗透利器 | 常见的WebShell管理工具

喀拉峻

网络安全

给 zsh 自定义命令添加参数自动补全

mzlogin

Shell zsh

基于 SAP BTP 平台的 AI 项目经验分享 | 社区征文

汪子熙

人工智能 机器学习 AI 新春征文 2月月更

架构实战营模块二作业-微信朋友圈复杂度分析

炎彬

「架构实战营」

iOS开发备战金三银四·突击大厂的算法与底层原理复习方向

iOSer

ios iOS面试 iOS底层 金三银四跳槽 算法面试

深入浅出 ESM 模块 和 CommonJS 模块

局外人

JavaScript node.js 前端 前端开发 模块化

项目遇到突发问题,如何给上级做汇报?

石云升

项目管理 项目经理 2月月更

模块二作业

blazar

「架构实战营」

自省与反思(一)

懒时小窝

反思 反思总结

简析Web3 架构:前端、后端和数据

devpoint

区块链 dapp Solidity Web3.0 2月月更

《人月神话》第十九章阅读笔记:20年后的《人月神话》

panda

人月神话 概念完整性 阅读笔记

Web Components 系列(五)—— 详解 Slots

编程三昧

前端 组件化 2月月更 WebComponent

模块 7 作业

miliving

iOS开发·备战2022金三银四-runtime原理与实践: 消息转发详解篇

iOSer

ios runtime iOS面试 ios开发 金三银四跳槽

如何快速开发 Serverless Devs Package ?

Serverless Devs

Serverless

HTAP:统一数据库系统的兴衰?_大数据_Renato Losio_InfoQ精选文章