
OceanBase 开源首款 AI 数据库 SeekDB
11 月 18 日,OceanBase 正式发布并开源其首款面向 AI 原生场景打造的数据库产品——SeekDB。这是公司首次推出专为新一代人工智能应用设计的数据库系统。
作为开源项目,SeekDB 自发布第一天起就采用 Apache 2.0 协议,源代码已同步上线 GitHub,开发者可自由使用与扩展。
开源地址:https://github.com/oceanbase/seekdb
与传统数据库不同,SeekDB 将向量、文本、结构化与半结构化数据统一纳入同一引擎,提供高性能的混合搜索能力。官方介绍称,SeekDB 能让开发者通过“三行代码”即可构建 AI 应用,并在规模达到数十亿级的多模态数据上实现毫秒级检索。
市场研究机构对这一方向的增长预期十分明显。
根据 Gartner 最新预测,具备生成式 AI 能力的数据库市场规模将在 2025 年达到 650 亿美元,并将在 2028 年增至 2180 亿美元,占到整个数据库市场的 74%(“Gartner Forecast Analysis: GenAI in Database Management Systems”)。与此同时,MIT 媒体实验室发布的《The GenAI Divide: State of AI in Business 2025》报告指出,当前企业内部 95% 的生成式 AI 试点项目仍无法带来可衡量的回报,其核心原因在于企业的多模态数据高度碎片化、系统架构过于复杂,以及数据访问与权限管理难度高。
OceanBase 表示,SeekDB 的研发目标正是瞄准这些行业痛点。
在技术层面,SeekDB 通过融合向量检索、全文检索和标量过滤,实现单条查询内的多阶段检索,以兼顾高准确率和低时延。它基于 OceanBase 已验证的大规模事务引擎构建,具备实时写入能力和完整的 ACID 事务特性,同时与 MySQL 生态保持兼容。SeekDB 还支持标量、向量、文本、JSON、GIS 等多类型数据的统一存储与检索,以适配不断增长的多模态 AI 应用需求。
在易用性方面,SeekDB 的资源需求远低于传统数据库,仅需 1 个 CPU 核心和 2GB 内存即可运行,可通过 pip 一键安装,并支持嵌入式和客户端/服务器两种模式,可灵活集成进 AI Agent、工具链或本地应用,进一步降低开发门槛。
官方称,SeekDB 兼容超过 30 个主流 AI 框架与 Model Context Protocol,包括 HuggingFace、Dify、LangChain,并同时支持 SQL 与 Python SDK。
OceanBase CEO 杨冰在发布会上表示:“当 AI 从前沿创新走向大规模应用,真正的瓶颈不在模型本身,而在于数据能否被高效、安全、实时地使用。面向未来的数据库,需要同时服务人类用户与智能体应用,在同一系统中支撑事务、分析与 AI 工作负载,让可信的实时智能从数据侧直接产生。OceanBase 将持续探索数据库在 AI 时代的新范式。”
回顾 OceanBase 15 年发展历程,AI+数据库是必然选择
会后,OceanBase CEO 杨冰回顾了 OceanBase 的发展轨迹,并将推动公司前进的背景概括为三波具有决定性影响的技术浪潮。
第一波来自互联网爆发所带来的数据规模增长。诞生在阿里和蚂蚁金服这样的环境中,大规模业务压力倒逼团队重新思考数据库系统的底层结构,从第一行代码开始构建分布式数据库架构,解决传统系统难以承受的数据量问题。杨冰认为,这一阶段并非出于主动探索,而是由于传统数据库厂商未曾遇到过类似场景,工程团队必须在极端条件下完成一系列底层创新,也由此奠定了 OceanBase 技术体系的基础。
第二波浪潮出现在过去五六年,即 OceanBase 商业化加速的阶段,这恰逢国内分布式数据库升级与国产替代同步推进。在这段时期,大量核心业务系统需要在极短窗口内完成数据库迁移,行业规模化升级让 OceanBase 的产品从技术原型走向成熟商品的过程显著压缩。高强度的真实业务场景也在倒逼产品进行密集的工程化打磨,使国产数据库在可用性、替换成熟度与长期稳定性上得到了充分验证。
第三波浪潮同时来自全球化扩张与近两年迅速加速的人工智能技术。随着越来越多的中国软件企业、硬件企业与云服务商走向海外,数据库厂商也必须同时面对国内生态与海外生态的融合需求。对于海外客户而言,技术实力本身并不足以构成完整竞争力,他们还会审视数据库背后的客户结构与商业场景,即这一技术是否已经支持全球化的头部企业,是否经过足够复杂业务的验证。
杨冰认为,中国大型企业在全球市场上的份额提升,使国产基础软件在国际市场获得了更强的可信度。同时,AI 技术在两年内快速演化,模型能力与使用方式的变化对底层数据访问提出了前所未有的要求,传统数据库的迭代周期已经难以跟上用户需求变化的速度,这直接促成了 SeekDB 的推出,希望通过更轻量、更开放的方式与客户乃至全球开发者共同构建适合 AI 应用的数据系统。
在谈到新产品 SeekDB 与 AI 技术的关系时,杨冰进一步解释,这一产品的推出并非简单的功能延伸,而是一次结构性调整。
他提到,AI 的发展速度可能超出所有人的预期,而数据库系统作为基础软件,天生受限于工程化复杂度、兼容性、稳定性等因素,迭代速度往往难以与 AI 领域的快节奏同步。
因此,OceanBase 在 SeekDB 上做出的选择是将其完全独立于现有 OceanBase 主线,以一个新的产品分支来应对变化更快的市场需求。杨冰认为,这个决定意味着公司在工程组织和产品体系上都要承受额外压力,包括同时维护多条产品线、持续进行底层架构重构、探索新的数据模型与处理方式等,但团队认为这一步是必要的,因为 AI 的快速演化正在不断挑战数据库的固有边界,任何滞后都可能导致系统无法支撑新一代应用的需求。
他表示,SeekDB 不仅是一次产品迭代,更是对数据库工程化能力的一次重新检验。在保持系统稳定性的同时引入全新的索引方式、检索结构或实时计算机制,都需要在可靠性与创新速度之间寻找平衡。
而与此同时,AI 的发展也在推动数据库从封闭系统走向更开放的架构形态,需要能够支持与开发者、企业客户以及更广泛的技术社区共同构建能力。这些压力叠加起来,使 SeekDB 成为 OceanBase 产品体系里一次新的挑战,也是公司面向未来技术趋势做出的前置布局。












评论