写点什么

蚂蚁集团开源向量索引库 VSAG,支持千维以上向量存储

  • 2024-09-09
    北京
  • 本文字数:875 字

    阅读完需:约 3 分钟

大小:470.54K时长:02:40
蚂蚁集团开源向量索引库VSAG,支持千维以上向量存储

近日,由蚂蚁集团发起的,旨在提高数据库与大模型应用开发效率的“星辰智能社区”新发布了两个项目:AI 原生数据应用开发框架 DB-GPT 新版本与向量索引库 VSAG。


DB-GPT 是一个开源的 AI 原生数据应用开发框架。在数据库领域,如何增强和大语言模型的交互任务,减少大模型的幻觉,为用户提供可靠并且安全的数据理解和分析能力,仍然是一项极具挑战的工作。DB-GPT 通过开发多模型管理(SMMF)、Text2SQL 效果优化、RAG 框架以及优化、Multi-Agents 框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单便捷。


本次开源的新版本 DB-GPT v0.6.0,完整支持了数据驱动的 AI 原生应用生命周期管理(AI Native Data Apps-dbgpts)以及 AI 原生应用仓库,方便开发者构建、发布、分享 AI Native Data Apps,还新增了六大特性,包括将 AWEL 协议升级至 2.0,支持更复杂的编排;结合 TuGraph,能支持图的构建与检索,进一步增强检索的准确性与召回的稳定性,以减少大模型的幻觉,在同样的检索效果下,构建 Graph 的成本比业界的方案少 50%的 Tokens;支持 Agent Memory,如感知记忆、短期/长期记忆、混合记忆等;支持意图识别、槽位填充,支持 Text2NLU、Text2GQL 微调等。


除此之前,社区还新发布了向量索引库 VSAG。VSAG 是蚂蚁集团在向量数据库上一系列的工程优化与向量索引的算法改进成果,适用于高维向量的存储和计算优化,并能提供 C++ 和 Python 的接口以便使用。VSAG 已在蚂蚁内部百亿数据量级业务上使用,在保证同样的召回率情况下,VSAG 可以通过量化和基于磁盘的重排技术,将内存消耗降低到 HNSW(最流行的向量索引)的 1/10,从而实现生产部署成本的大幅降低。VSAG 将结合 DB-GPT,让 RAG 的构建更加简单、高效,同时 VSAG 作为独立开放的向量引擎,也将支持 LangChain、LlamaIndex 构建 RAG 应用。


关于星辰智能社区

“星辰智能社区”由蚂蚁集团发起,专注于 AI 时代数据智能技术的探索,社区在 GitHub 上已获得 17k Star 数,核心成员来自蚂蚁、阿里、美团、京东、唯品会等科技公司和知名海内外高校硕博在校学生。目前已有超过 50 万用户正在学习和使用 DB-GPT,社区活跃人数近 7000 人,开发贡献者 130 人。

2024-09-09 15:417354

评论

发布
暂无评论
发现更多内容

java 虚拟机 GC :G1学习笔记

风翱

GC 9月日更

JavaScript 的 undefined和null 的区别与判断

wudaxue

自研ISP芯片背后:手机厂商的目光在影像之外

脑极体

Redis核心原理与实践--散列类型与字典结构实现原理

binecy

数据结构 源码阅读 Redis 6.0

阿里耗时三月整理的亿级流量百万并发手册,在上传在GitHub上意外获星90K+

Java 架构 面试 程序人生 编程语言

使用 Chrome 调试 Vue3 的 TypeScript 源码

编程三昧

源码 Vue Vue 3 9月日更

面对低碳转型 央行的两条思路和五大措施

CECBC

数据安全与隐私系列08:大数据与电影《少数派报告》

Databri_AI

人工智能

linux之秘钥登录

入门小站

Linux

阿里P8连肝三月,终于整理出的完美Java面试宝典,上传到Git上目前star数达到30K+

Java 架构 面试 程序人生 编程语言

阿里大佬熬了三月,总结出了这套分布式架构手册,在Github上疯传!

Java 架构 面试 程序人生 编程语言

2022前端react高频面试题汇总

buchila11

React

如何做到监控告警的管理?

睿象云

运维 告警 监控告警 运维平台 告警管理

音视频同步!RTCP 协议解析及代码实现

声网

音视频 协议 Wireshark 流媒体

Alibaba内部最新Java架构核心宝典 (全彩版小册开源)

Java 架构 面试 程序人生 编程语言

网络攻防学习笔记 Day149

穿过生命散发芬芳

9月日更 网络管理

字节内部不传之秘:1298页算法刷题笔记(附源码可直接运行)

Java 程序员 面试

推荐一款 Python 微服务框架 - Nameko

星安果

Python 微服务 Nameko

内部群炸了!字节同事写了一篇Leetc刷题心得,高管看见之后,直接给他涨了20K

算法 算法题

内卷把同事逼成了“扫地僧”,把 Github 上所有面试题都整理了一遍~足足 24W 字!

Java 程序员 面试

Log4j2同步打印日志导致线程阻塞问题剖析

快看工程技术中心

Java 线程 log4j java反射 异常处理

剖析反序列化原理基本操作

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞分析

腾讯高工终于把操作系统、TCP/IP、线程与进程、CPU全部讲明白了

Java 架构 面试 操作系统 计算机

靠着狂刷这份面试题跟答案!我从 15K 变成了 30K!

Java 编程 程序员

突发猛进!数字人民币落地推广会召开

CECBC

我仅用了3个月就成功破茧成蝶!从简历被拒到收割8个大厂offer的辛酸历程!

编程 Java、 计算机

Prometheus 2.29.0 新特性

耳东@Erdong

release Prometheus 9月日更

GitHub上120K Stars国内第一的Java多线程PDF到底有什么魅力?

Java 编程 架构 面试 程序人生

如何加速云原生数据应用?这个开源项目备受关注

阿里巴巴云原生

阿里云 开源 云原生 Fluid

多媒体技术之图像频率的概念

轻口味

android 音视频 9月日更

高扩展的系统通常会有什么特性

卢卡多多

系统、 9月日更

蚂蚁集团开源向量索引库VSAG,支持千维以上向量存储_AI&大模型_蚂蚁集团_InfoQ精选文章