AICon 深圳站聚焦 Agent 技术、应用与生态,大咖分享实战干货 了解详情
写点什么

OceanBase 4.3.3 发布,面向 AI 时代升级向量能力

  • 2024-10-29
    北京
  • 本文字数:1620 字

    阅读完需:约 5 分钟

大小:847.70K时长:04:49
OceanBase 4.3.3发布,面向AI时代升级向量能力

AI 时代,需要怎样的数据库?10 月 23 日,独立数据库厂商 OceanBase 在 2024 年度发布会上推出 OceanBase 4.3.3 GA 版本,升级向量检索与索引功能,实现 SQL+AI 一体化。该版本深度融合 AI 与数据库处理能力,支持多模态数据的融合查询,帮助企业简化 AI 技术栈,提升 AI 应用构建效率。

 

CEO 杨冰表示,OceanBase 持续践行一体化产品战略,为 AI 时代打造易用、好用的数据底座。

 

杨冰:一体化数据库是 AI 时代的数据底座

 

随着 AI 技术发展,越来越多的 AI 应用不再局限于纯文本来生成回答,涉及的数据类型日益复杂,并且常存储于 IT 架构的不同数据库中,这对数据库提出了新的要求,包括提升性能与响应速度,要求数据库处理和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。

 

杨冰认为,伴随着互联网/移动互联网时代向 AI 时代演进,数据库也正从分散走向统一,一体化数据库将成为 AI 时代的数据底座。如何通过一个统一的数据库来处理所有类型的数据,并通过向量融合查询能力,让小团队也可以快速构建 AI 应用,是 OceanBase 一体化产品战略在 AI 时代的核心思考。

 

会上,杨冰演示了一个叫“望小京”的 AI Agent Demo,请“望小京”推荐两公里内评分 4.5 以上、人均消费 25 元以内干净卫生的奶茶店。他介绍,这一 Demo 以 OceanBase 为数据底座,管理和处理结构化、半结构化以及非结构化数据,完成空间查询、关系过滤、向量计算等工作,为 AI 实时查询提供支持。

 

“以往构建一个复杂的 AI 应用,需要依赖多个不同的数据库、管理非常复杂的技术栈,同时还需要一个经验丰富且规模较大的团队。”他介绍,正是因为 OceanBase 具备一体化能力,才得以通过一个数据库高效处理所有查询、并通过极简架构就可以完成数据管理和 AI 应用开发。以 OceanBase 为底座的“望小京”仅依靠几位工程师、用一周时间就开发完成。

 

未来,OceanBase 将成为蚂蚁集团的 AI 数据新底座,支持 AI 生活管家“支小宝”、AI 金融管家“蚂小财”、AI 健康管家三大 AI 应用,及支付宝百宝箱智能体开发平台的数据管理。

 

OceanBase 4.3.3 发布,增加向量能力

 

面对 AI 时代提出的全新挑战,OceanBase 持续推进技术升级。在发布会上,OceanBase 推出 4.3.3 版本,这也是其面向实时 AP 场景的首个 GA 版本。

 

OceanBase CTO 杨传辉介绍,OceanBase 4.3.3 在向量融合查询的关键能力上取得了显著突破,推出全新的向量检索功能,实现 SQL+AI 一体化,深度融合 AI 与数据库处理。

 

具体而言,在对多模态数据的支持层面,4.3.3 进一步扩展了对复杂数据类型的处理能力,新增 Array 类型,并对 Roaringbitmap 类型数据的计算性能进行了优化,为企业处理多样化数据结构提供更高的灵活性。

 

在向量融合查询能力上,4.3.3 新增向量检索能力,支持向量数据类型和向量索引,并基于向量索引提供强大的搜索能力。用户可通过 SQL 及 Python SDK 等方式灵活调用 OceanBase 的向量检索能力,同时结合对海量数据的分布式存储能力、多模数据类型及多类型索引的支持,极大简化 AI 应用的技术栈,助力企业高效构建 AI 应用。

 

在多工作负载方面,OceanBase 4.3.3 对 AP(分析处理)场景进行大幅性能优化,尤其是在海量数据分析时,能够提供更短的响应时间和更高的吞吐能力。同时,4.3.3 引入了列存副本的新形态,实现满足 TP 和 AP 负载的物理资源强隔离。该物理隔离机制可确保系统在处理事务型负载时,不受分析型负载的影响,特别是在实时数据分析和决策场景中,能够保持系统的高性能与稳定性。

 

发布会上,OceanBase 与蚂蚁集团联合开发的向量库在业内标准的 ANN Benchmarks 基准测试中,针对 GIST-960 数据集表现出色。测试结果显示,该向量库在 ANN Benmarks 测试中性能远超其他算法,排名第一。特别是在 90% 以上的召回率区间,查询性能(QPS)相比此前最优算法 glass 提升 100%,相比基线算法 hnswlib 提升 300%。

 

杨传辉还强调,AI 天然拥抱云,OceanBase 作为一体化数据库,不仅具备云上云下一体化能力,同时具备多云原生开放架构,这些优势都能有效地帮助客户实现云与 AI 结合,满足客户在云+AI 时代的数据管理需求。

 

2024-10-29 09:337324

评论

发布
暂无评论
发现更多内容

京东云RASP云原生安全免疫创新实践

京东科技开发者

Web 安全 漏洞 业务安全 企业号 3 月 PK 榜

融云入选中国信通院《高质量数字化转型产品及服务全景图》

融云 RongCloud

产品 数字化 通讯

OceanBase 生态产品:时序数据库CeresDB 正式发布 1.0 版本

OceanBase 数据库

数据库 oceanbase

搬得进来,搬得出去!快来过一把数据迁移的“瘾”

OceanBase 数据库

数据库 oceanbase

Vineyard 论文被 SIGMOD'2023 接收,助力计算引擎之间高效数据交换

阿里巴巴中间件

阿里云 计算引擎

精选案例 | 博睿数据30w+监测节点护航新华网、人民网两会重保工作

博睿数据

可观测性 智能运维 博睿数据 精选案例 主动式拨测

聊聊线上发布这件事

老张

软件测试 权限管理 服务部署

等保联盟是什么机构?有什么用?

行云管家

等保 等级保护 等保联盟

React等前端框架如何与小程序结合

Onegun

前端 前端框架 React Vue 3

Dubbo Triple 协议

昵称不能为null

dubbo RPC triple协议

用户分享 | 达梦第三方客户端DockQuery使用体会

BinTools图尔兹

数据库 用户体验 国产数据库工具

技术沙龙 | 探索软件测试前沿技术及最佳实践,体验ChatGPT在测试领域中的应用

测吧(北京)科技有限公司

测试

探索以小程序提升运维效率

Onegun

运维 小程序容器

云智慧助力中国信通院组装式应用开发平台系列标准建设

云智慧AIOps社区

2022 IoTDB Summit:用友郭关飞《用友在 Apache IoTDB 应用与生态建设方面的探索与实践》

Apache IoTDB

大数据 开源 时序数据库 IoTDB

性能平台数据提速之路

百度Geek说

大数据 百度 提效 企业号 3 月 PK 榜 性能平台

NFTScan:怎么使用 NFT API 开发一个 NFT 数据分析平台?

NFT Research

数据分析 API NFT

秒懂算法 | 搜索基础

TiAmo

DFS BFS 搜索算法

瓴羊Quick BI:“3端4表4擎、3+NPlus”得到众多行业内部人士的认可!

对不起该用户已成仙‖

数据测试实践:从一个bug开始的大数据引擎兼容性探索

京东科技开发者

大数据 bug修复 引擎 测试数据构造 企业号 3 月 PK 榜

2022 IoTDB Summit:天谋科技刘海《Timecho:孵化于Apache IoTDB的开源商业化公司及其核心产品》

Apache IoTDB

大数据 分布式 开源数据库 IoTDB

面试官:请说一下如何优化结构体的性能?

王中阳Go

Go golang 高效工作 学习方法 高效学习

ByteHouse实时导入技术演进

字节跳动数据平台

大数据 数据仓库 Clickhouse 数据仓库服务 企业号 3 月 PK 榜

SSH和VNC的四个区别简单讲解

行云管家

SSH 行云管家

动转静两大升级!一键转静成功率领先,重点模型训练提速18%+

飞桨PaddlePaddle

人工智能 百度 飞桨 PaddlePaddle 框架解析

MMMBSC互助基金系统开发智能合约部署

薇電13242772558

智能合约 dapp

淘宝 APP 网络架构演进与弱网破障实践

阿里技术

架构 网络

TypeScript 与 JavaScript:你应该知道的区别

京东科技开发者

JavaScript typescript 前端 后端 企业号 3 月 PK 榜

Higress on K8s 5分钟开箱即用

阿里巴巴中间件

阿里云 云原生 Higress

小程序技术如何提升企业的移动研发效率?

FinFish

降本增效 小程序容器 移动研发 小程序技术

技术沙龙 | 探索软件测试前沿技术及最佳实践,体验ChatGPT在测试领域中的应用

测试人

软件测试 沙龙 ChatGPT

OceanBase 4.3.3发布,面向AI时代升级向量能力_大数据_OceanBase_InfoQ精选文章