《HarmonyOS:领航者说》技术公开课来啦,大咖分享、实战解码,不容错过 了解详情
写点什么

AI 正在批量 “创建” 数据库:一场由 Agent 引发的千亿级数据架构革命

ProtonBase

  • 2025-06-30
    北京
  • 本文字数:3074 字

    阅读完需:约 10 分钟

大小:1.50M时长:08:45
AI 正在批量 “创建” 数据库:一场由 Agent 引发的千亿级数据架构革命

一场由 AI Agent 掀起的数据库革命,正在瓦解沿用了三十年的数据架构体系。


从 2024 年 10 月到 2025 年 5 月,短短七个月内,AI Agent 创建的数据库数量从 30% 爆涨至 80%,远超人类工程师的工作产出。与此同时,Databricks 以 10 亿美元收购 Neon 的消息震动业界——这家人工智能巨头正在用真金白银抢占下一代数据基础设施入口。


“传统架构正在集体失灵。” 


前 Facebook core infra、阿里搜索数据和机器学习平台,以及达摩院机器智能工程的技术领军人、ProtonBase 创始人兼 CEO 王绍翾指出。


01 崩塌的旧秩序,AI Agent 重写数据规则


假如采用传统 “拼凑式架构”,一个 toC 智能 AI Agent 请求,有时需要穿透 MySQL 用户库、Elasticsearch 日志系统、向量数据库和 ClickHouse 分析系统。当四个系统完成数据拼接时,手机端的用户早已关闭应用界面。


更致命的是成本黑洞。某头部电商的技术总监算过一笔账:为支撑推荐系统的 AI Agent,每年需要支付超过 500 万元,其中包括 Aurora 数据库费用、维护 Elasticsearch 集群的费用、用于向量检索服务的费用,还有工程师团队昼夜不停地系统维护、开发、和调优。根据 IDC 2025 企业云支出报告,电商行业数据架构年成本中位数为 460 万元。


采用拼凑式架构,就像用十台蒸汽机车拼凑高铁。而数据触目惊心背后,真正的颠覆者已经入场。


2025 年或将成为数据基础设施行业的分水岭,巨头们正以资本重注押定下一代技术标准。当 Databricks 豪掷 10 亿美金收购云原生数据库 Neon 时,全球技术圈突然意识到:这场争夺的本质是抢占 AI Agent 的底层入口。几乎同一时间,Snowflake 收购 CrunchyDB,其战略意图直指 PostgreSQL 生态的掌控权。更值得玩味的是,曾以实时数仓著称的 ClickHouse 悄然开始淡化 “数据仓库” 标签,而开始强调 Data Warehouse + Database,全面转向多模数据库。旧时代的技术边界,正被资本与 AI 的双重浪潮彻底冲垮。


02 Data Warebase 技术革命破解不可能三角


旧秩序崩塌,真正的拷问浮出水面:到底怎样的技术架构才能承载 AI 时代的洪流?


答案正从 Data Warebase 架构的工程实战中浮现。金融高频交易和风控引擎、车联网日志和安全报警系统、电商推荐系统、广告实时竞价联盟等多个场景的成功实践,宣告数据架构领域持续十年的 “不可能三角” 困局正在瓦解——实时性、多模态、高并发三大核心能力首次在 Data Warebase 架构中实现融合。


Data Warebase 的概念是将 Data Warehouse 与 Database 融合于一体,构建统一的数据底座,以全面支撑 AI 工作流中从数据高吞吐写入、实时加工、高频的分析和检索的全过程。


这场革命的技术本质,源自几个已被验证的关键突破:


其一,PostgreSQL 的生态统治力成为破局基石。 


几乎所有的新型数据库项目都选择基于 PostgreSQL 构建。刚才提到的 Neon 和 CrunchyDB,只是其中的代表,全球近几年新出现的数据库产品无一例外的选择了 PostgreSQL 作为查询 API。PostgreSQL 靠其强大的可扩展性和生态,赢得了全球所有新兴数据库的青睐。一则非官方报道,OpenAI 内部的一个 PostgreSQL 只读从库就部署了近 50 个实例,这意味着行业确认了 AI 时代的数据接口标准。


Anthropic 进一步在 MCP(Model Context Protocol)中直接内置 PostgreSQL 接口,这进一步印证了 PostgreSQL 在 AI 应用工作负载中的关键作用——它不仅是一种数据库,更是 AI 系统与数据交互的中枢平台。


其二,行列混存,多模索引,存算分离


Data Warebase 实现了数据库和大数据的最重要的三个能力:在存储层,它支持数据的行存、列存以及行列混存;在索引上,它实现了分布式数据库最重要的全局二级索引,以及搜索所需要的倒排索引、向量索引、和分析所需要的列存索引等等;最后,它在高速云存储上做到数据库级别的存算分离。


其三,实时增量物化视图技术正在终结流处理引擎时代。 


这项创新被王绍翾在 AICon 大会定义为 “流批一体的终极形态”。其技术原理在于:感知变更的数据、基于高效索引的增量计算、事务型存储三层能力熔铸在统一架构的 Data Warebase 内核中,让 Instant ingestion-transform-retrieval 得以在一个系统中完成,消除传统方案的冗长链路。正如王绍翾所认为,流计算不应依赖外部引擎,真正的实时性必须内生于一个统一的多模数据库之中。


Data Warebase 的本质是通过 PostgreSQL 生态实现多模态数据的协议统一,借实时物化视图完成流批数据的引擎重构,最终在单一产品内实现分布式计算与分布式存储的高效融合。正是这些多重革命,让曾经撕裂的实时性、多模态、高并发能力发生链式反应,从而在数据库内核中溶解了传统架构单机物理隔离造成的性能鸿沟。


03 万亿级市场爆破:谁在收割数据革命红利?


当 Data Warebase 打破数据架构领域持续数十年的 “不可能三角”,商业世界的价值裂变已然在真实战场爆发——从金融领域的量化交易和实时风控,到车机数据每秒更新并即时进行规则匹配和安全分析...... 技术范式跃迁正沿着三重坐标轴撕开万亿市场的豁口:


AI Agent 战场率先掀起革命。未来大部分服务将依托 AI Agent 进行智能交互,而 AI Agent 需要一个强大的 Data API,Data Warebase 提供了强大的多模查询、极致弹性、以及分支管理的能力,能够很好地支持 AI Agent 的场景。未来的 AI Agent,不需要对接多个 MCP,而是连接一个多模数据库。用一个数据库,一个 MCP 接口,极大降低 LLM 大模型的智力和推理的门槛。

金融量化交易正在兑现亚秒级决策。在金融证券行业的极速战场,当每秒百万级行情数据必须实时写入并立即可见时,某头部券商最初采用分布式 OLAP 数据库遇到数据新鲜度和吞吐瓶颈而腰斩,转用分布式 OLTP 数据库又遇到多维分析查询性能过差而被迫放弃——作为 Data Warebase 范式的典型实现,ProtonBase 以亚秒级 Freshness + 高吞吐 Instant Decision 破解该券商的困局,最终在毫秒定盈亏的金融沙场上,将数据新鲜度代差转化为真金白银的盈亏差。


车联网安全监控实现秒级预警重构。面对百万辆电动车每秒涌入的百万条车机信号,某头部车联网企业遭遇监管存储与安全监控的双重夹击——传统架构下核心信号异常监控延迟高达数分钟,而热失控等风险的响应窗口不足 10 秒。通过 ProtonBase 的 Data Warebase 范式,该企业以实时增量物化视图引擎实现秒级数据加工及风险诊断,在统一架构内同步完成历史数据合规存储与关键信号扫描,终结双系统割裂时代。 

04 Data Warebase 提出者终极预判


商业红利的快速涌现印证了王绍翾的前瞻洞见:生态霸权与协议简化正重塑数据基础设施的未来版图。他斩钉截铁预言——PostgreSQL 将在 AI 时代扮演类似 TCP/IP 的基础协议角色,而 Iceberg 终将成为数据湖领域的终极标准。


此刻的技术淘汰赛已进入倒计时:


  • 三年内无法同时支撑 AI Agent 高吞吐交互与实时决策的数据库厂商必将退场。

  • 未来企业只需两个 API:Data API 喂数据,AI API 出决策。


对创业者而言,生存法则从未如此清晰:必须将技术命脉深扎 PostgreSQL 的扩展生态,同时把商业引擎转向全球海域。“Made in China, Sold Global” 不再只是口号,而是技术代差碾压下的必然利润回流。Data Warebase 的本质,正是支撑这一预判的工程基石——通过 PostgreSQL 生态统一数据基座、利用分布式行列混存和多模态索引提升写入和查询性能、使用实时增量物化视图解决实时数据加工、最后利用极致的存算分离技术解决秒级弹性以及存储和计算的无限水平扩展,将全链路(写入、加工、和查询)亚秒级的决策能力转化为全球企业的生产现实。而它正在点燃的,不止是技术架构的重构之火,更是一场全球产业权力的无声迁徙。

2025-06-30 11:542664

评论

发布
暂无评论

明天!龙蜥邀您参加第二届 eBPF 开发者大会,探索 eBPF 技术的无限可能

OpenAnolis小助手

开发者 ebpf 龙蜥社区 龙蜥操作系统

保护C#代码的艺术:深入浅出代码混淆技术

Golang 状态机设计模式

俞凡

golang 最佳实践 设计模式

让大模型落地有“技”可循

中关村科金

#大模型

Amazon Bedrock 实践系列 | Claude 3 深度探秘

亚马逊云科技 (Amazon Web Services)

生成式AI

和鲸协办2024GAIIC算法挑战赛,基于ModelWhale平台实现模型自动评审,加速结果出分

ModelWhale

人工智能 大数据 全球人工智能技术创新大赛

【PolarDB-X从入门到精通】课程随堂互动获奖公告

阿里云数据库开源

数据库 阿里云 分布式数据库 教程分享 PolarDB-X

参与 PenPad Season 2 获得勋章,还有海量 Scroll 生态稀缺权益

西柚子

一文读懂Partisia Blockchain,被严重低估的隐私区块链生态

西柚子

聚道云助力企业实现高效合同管理新方案!

聚道云软件连接器

案例分享

Golang 并发安全Map容器实践

俞凡

golang

监控系统泛滥:CTO 面临的隐形成本危机

观测云

监控

云手机可以用来进行Temu电商测评吗?

Ogcloud

云手机 海外云手机 云手机海外版 电商云手机 跨境云手机

Partisia Blockchain或被低估,有望在后续市场迎来爆发

加密眼界

三大能力升级!大模型开启智能客服新篇章

中关村科金

智能客服 大模型

对号入座,快看看你的应用系统用了哪些高并发技术?

京东科技开发者

意难平!面试小米,一步之遥...

王磊

Java 面试题

出海企业如何从海外云手机中受益?

Ogcloud

企业出海 云手机 海外云手机 云手机海外版 电商云手机

APP上架流程解析

SD-WAN企业网络部署模式及适用企业类型

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

重磅揭秘:边缘计算平台技术优势为何突出?

3DCAT实时渲染

边缘计算平台

古城煤矿:手机扫一扫,设备“码上”见

草料二维码

二维码 草料二维码 干货分享

AI 正在批量 “创建” 数据库:一场由 Agent 引发的千亿级数据架构革命_DataOps_InfoQ精选文章