2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

HTAP:统一数据库系统的兴衰?

  • 2025-06-16
    北京
  • 本文字数:1279 字

    阅读完需:约 4 分钟

大小:631.70K时长:03:35
HTAP:统一数据库系统的兴衰?

Zhou Sun 最近的文章《HTAP已死》在数据社区引发了一场关于混合事务/分析处理(HTAP)未来的辩论。HTAP 旨在帮助大规模集成历史数据和在线数据,支持更灵活的查询方法,并降低业务复杂性。

 

在这篇文章中,Mooncake Labs 的联合创始人兼首席执行官Sun认为,将事务性和分析性工作负载统一到单一系统中的长期承诺未能实现。Gartner 在十多年前引入了术语 HTAP(混合事务和分析处理),宣布它是“下一个大型数据库架构”,其目标是缩小运维系统和分析系统之间的差距。

 

文章追溯了 OLTP 和 OLAP 数据库工作负载的历史,它们在 20 世纪 70 年代开始是一体的,十年后分离,HTAP 在 2010 年代试图再次将它们合并。Sun 认为,资源竞争、复杂性和不断演变的硬件架构等实际挑战使得专用的、专业的系统成为更可行的前进道路。Sun 写道:

 

云也开始从紧密耦合的仓库转向基于对象存储构建的模块化数据湖。在试图摆脱传统的仓库/数据库时,数据团队开始组装自己的定制系统。

 

多年前,HTAP 被认为是定价、欺诈检测和个性化等新兴工作负载的需求,而 SingleStoreDB 和 TiDB 是市场上的主要参与者。作者认为,像 Snowflake 和 BigQuery 这样的云数据仓库在 2020 年代通过专注于分析处理并将存储与计算分离,成为明显的赢家,这允许在没有 HTAP 系统复杂性的情况下提供可扩展的、具有成本效益的解决方案。Sun 指出,虽然事务性数据库也在发展,但它们在很大程度上仍然与分析分离,将两者合并的尝试未能得到广泛采用。Sun 补充道:

 

即使在今天的解耦数据堆栈中,需求仍然是相同的:对新鲜事务数据进行快速的 OLAP 查询。现在,这通过流管道网络、云数据湖和实时查询层来实现。它仍然是 HTAP;而是通过组合而不是数据库的整合。

 

为了超越传统的仓库和数据库,数据团队现在正在使用 Sun 所称的“一流”组件组装他们自己的定制系统。这些架构结合了 OLTP 系统和流处理器作为预写日志(WAL), Iceberg 作为存储层,Spark 和 Trino 这样的查询引擎用于数据处理,以及 ClickHouse 或 Elasticsearch 索引这样的实时系统。在Hacker News上,Statsbomb 的创始人、前首席技术官Thom Lawrence,写道:

 

当替代方案如此复杂且有如此多的活动部件时,你不能说 HTAP 已死。大多数企业都在燃烧大量的资源,实际上只是在为零商业价值的数据洗牌。我们的梦想是一个单一的数据网格呈现一个 SQL 用户空间(...),我们接近但还没有到达那里,我们已经接近了,但我们还没有达到那个目标,如果人们停止尝试达到这个终点,我会非常愤怒。

 

Sun 的文章在社区引发了辩论,Percona 的创始人和开源倡导者 Peter Zaitsev总结道

 

没有“一刀切”的解决方案——虽然大型团队意识到紧密耦合是有问题的,但对于小型团队和小型项目来说,拥有一个“一切”都做得相当好的单一数据库实际上是非常方便和实用的,因此我认为 HTAP 作为一个特性非常有意义,但可能不作为一个名称,因为我们需要我们的数据库不仅仅是分析和事务性的。

 

随着近年来 PostgreSQL 的不断成功,许多数据工程师现在都同意曾经很有前途的 HTAP 模型正在被重新审议。随着技术的发展,新的范式正在挑战 HTAP 在现代数据架构中的相关性。

 

原文链接:

https://www.infoq.com/news/2025/06/htap-databases/

2025-06-16 09:297

评论

发布
暂无评论

进入2022年,移动互联网的小程序和短视频直播赛道还有机会吗?

BeeWorks

理想很丰满,现实很骨感,坎坷前行的区块链产业化路在何方?

Akumas

区块链 数字化转型 新基建 十四五规划

2023总结

明明

基础

2022年炙手可热的边缘计算与端智能

战场小包

边缘计算 端智能 3月月更

未来的直播技术将会有哪些新的进化形式?

字节跳动视频云技术团队

互联网 科技革命 直播技术 低延时 音视频技术

无需嵌码的主动式监测:一种预先感知用户体验的最佳实践

博睿数据

一撕得:全员参与低代码开发,全面实现企业数字化管理

一只大光圈

钉钉 低代码 数字化 宜搭 一撕得

NFT音乐盲盒游戏系统开发方案

薇電13242772558

NFT

如何为招聘机构选择CRM系统

低代码小观

低代码 企业管理 企业管理系统 CRM系统

技术实践 | 如何给NVMe做RAID

沃趣科技

raid 硬盘

阿里 BladeDISC 深度学习编译器正式开源

阿里云大数据AI技术

深度学习 开源 编译器

2021 盘点 | 券商 TOP 5 出炉,谁才是最“卷”的券商王者?

博睿数据

飞步科技 x 焱融 YRCloudFile:大幅提升训练效率,开启智驾新纪元

焱融科技

自动驾驶 云计算 分布式 高性能 文件存储

网络安全kali渗透学习 web渗透入门 Metasploit---基于SMB协议收集信息

学神来啦

网络安全 kali kali Linux

2022年软件开发趋势:远程工作已成主流

码语者

投稿开奖丨云服务器ECS征文活动(1月)奖励公布

阿里云弹性计算

阿里云 云服务器 征文投稿开奖 玩转ECS

Shopee Games 游戏引擎演进之路

Shopee技术团队

前端 游戏开发 egret 游戏引擎

网络安全:小记一次代码审计

网络安全学海

网络安全 信息安全 渗透测试 安全漏洞 代码审计

通过蜜罐技术获取攻击者手机号、微信号【网络安全】

H

黑客 网络安全

关于 ZEGO 支撑 100 亿场高质量直播的秘笈

ZEGO即构

后台开发 CDN 音视频技术 音视频引擎

构建测试的体系化思维(进阶篇)

BY林子

测试体系 质量内建

【重磅发布】百度参编信通院《联邦学习场景应用研究报告(2022年)》

百度开发者中心

昇思MindSpore再突破:蛋白质结构预测训练推理全流程开源,助力生物医药发展

Geek_32c4d0

mindspore 昇思 生物医药

直播系统聊天技术(七):直播间海量聊天消息的架构设计难点实践

BeeWorks

2021年信创产业融资分析报告

统小信uos

软件工程能力漫谈:比编码更重要的,是项目管理能力

百度开发者中心

一次代码审计实战案例【思路流程】

H

网络安全

基于Java+SpringMVC+MySql+Layui+H5实现企业门户网站

Geek_7jiynf

网站建设

浙江省人民医院:用宜搭助力党建改革工作,重构医院重大事项议事决策机制

一只大光圈

钉钉 低代码 钉钉宜搭 宜搭 宜搭数字化

自动化测试指南

FunTester

敏捷 性能测试 自动化测试 测试框架 FunTester

技术创想 | Cypress UI 自动化测试框架

领创集团Advance Intelligence Group

HTAP:统一数据库系统的兴衰?_大数据_Renato Losio_InfoQ精选文章