写点什么

蚂蚁集团开源向量索引库 VSAG,支持千维以上向量存储

  • 2024-09-09
    北京
  • 本文字数:875 字

    阅读完需:约 3 分钟

大小:470.54K时长:02:40
蚂蚁集团开源向量索引库VSAG,支持千维以上向量存储

近日,由蚂蚁集团发起的,旨在提高数据库与大模型应用开发效率的“星辰智能社区”新发布了两个项目:AI 原生数据应用开发框架 DB-GPT 新版本与向量索引库 VSAG。


DB-GPT 是一个开源的 AI 原生数据应用开发框架。在数据库领域,如何增强和大语言模型的交互任务,减少大模型的幻觉,为用户提供可靠并且安全的数据理解和分析能力,仍然是一项极具挑战的工作。DB-GPT 通过开发多模型管理(SMMF)、Text2SQL 效果优化、RAG 框架以及优化、Multi-Agents 框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单便捷。


本次开源的新版本 DB-GPT v0.6.0,完整支持了数据驱动的 AI 原生应用生命周期管理(AI Native Data Apps-dbgpts)以及 AI 原生应用仓库,方便开发者构建、发布、分享 AI Native Data Apps,还新增了六大特性,包括将 AWEL 协议升级至 2.0,支持更复杂的编排;结合 TuGraph,能支持图的构建与检索,进一步增强检索的准确性与召回的稳定性,以减少大模型的幻觉,在同样的检索效果下,构建 Graph 的成本比业界的方案少 50%的 Tokens;支持 Agent Memory,如感知记忆、短期/长期记忆、混合记忆等;支持意图识别、槽位填充,支持 Text2NLU、Text2GQL 微调等。


除此之前,社区还新发布了向量索引库 VSAG。VSAG 是蚂蚁集团在向量数据库上一系列的工程优化与向量索引的算法改进成果,适用于高维向量的存储和计算优化,并能提供 C++ 和 Python 的接口以便使用。VSAG 已在蚂蚁内部百亿数据量级业务上使用,在保证同样的召回率情况下,VSAG 可以通过量化和基于磁盘的重排技术,将内存消耗降低到 HNSW(最流行的向量索引)的 1/10,从而实现生产部署成本的大幅降低。VSAG 将结合 DB-GPT,让 RAG 的构建更加简单、高效,同时 VSAG 作为独立开放的向量引擎,也将支持 LangChain、LlamaIndex 构建 RAG 应用。


关于星辰智能社区

“星辰智能社区”由蚂蚁集团发起,专注于 AI 时代数据智能技术的探索,社区在 GitHub 上已获得 17k Star 数,核心成员来自蚂蚁、阿里、美团、京东、唯品会等科技公司和知名海内外高校硕博在校学生。目前已有超过 50 万用户正在学习和使用 DB-GPT,社区活跃人数近 7000 人,开发贡献者 130 人。

2024-09-09 15:417664

评论

发布
暂无评论
发现更多内容

别再说你不懂Java内存模型了!!!

Java 内存模型 JMM 并发

大厂面试难?对标大厂“Java系统性能优化实战”二面阿里轻松搞定

Java你猿哥

面试 性能优化 SSM框架 Java性能优化

MySQL的varchar字段最大长度真的是65535吗?

Java你猿哥

MySQL 后端 SSM框架 varchar

进击的 Java !

OpenAnolis小助手

Java 开源 云原生 GOTC 龙蜥技术

一次「找回」TraceId的问题分析与过程思考

Java 中间件 raceId

破防了!阿里用17个真实企业级项目阐述Java系统分析与架构设计

Java你猿哥

微服务架构 架构设计 Java系统性能 Redis开发与运维 MySQl部署

数智融合,生态链接丨 亚信科技“信伙伴”交流会(成都站)成功举办

亚信AntDB数据库

AntDB AntDB数据库 企业号 4 月 PK 榜

等级保护5个级别详细说明-行云管家

行云管家

网络安全 等保 等级保护

chatGPT衣食住行10种场景系列教程(01)chatGPT热点事件汇总+开发利器

非喵鱼

java openai AIGC ChatGPT 三周年连更

微服务 Spring Boot 整合Redis分布式锁 实现优惠卷秒杀 一人一单

Bug终结者

redis 底层原理 三周年连更

css实现瀑布流效果

格斗家不爱在外太空沉思

CSS 三周年连更

【4.14-4.21】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

震撼!阿里架构师全新产出Java面试突击宝典。Github标星疯涨!

Java你猿哥

spring Spring Boot JVM mybatis java面试

零样本文本分类应用:基于UTC的医疗意图多分类,打通数据标注-模型训练-模型调优-预测部署全流程。

汀丶人工智能

人工智能 自然语言处理 深度学习 文本分类 小样本学习

第二届中国国际软件发展大会|华为:构筑坚实软件根基,赋能数字经济高质量发展

极客天地

火山引擎DataTester 3大功能升级:聚焦敏捷、智能与易用,帮助企业降本增效

字节跳动数据平台

大数据 AB testing实战 A/B 测试 对比实验

搭建一站式OpenHarmony设备开发Windows开发环境。

坚果

OpenHarmony 三周年连更

ChatGPT 真能带货吗?晒一下 SQL Chat 上线 3 周以来的真实运营数据📊

Bytebase

MySQL sql postgres ChatGPT SQL Server

薪资结构重铸: Zebec将业务范围扩大到Web2薪资管理领域

鳄鱼视界

膜拜!华为内部都在强推的783页大数据处理系统:Hadoop源代码

Java 大数据 hadoop

大数据Hadoop之——HDFS小文件问题与处理实战操作

Openlab_cosmoplat

hdfs 开源社区 大数据Hadoop

深度学习基础入门篇[六(1)]:模型调优:注意力机制[多头注意力、自注意力],正则化【L1、L2,Dropout,Drop Connect】等

汀丶人工智能

人工智能 机器学习 深度学习

2023年免费堡垒机软件推荐-行云管家堡垒机免费版

行云管家

网络安全 堡垒机

海通证券与易观千帆达成合作,构建优质客户生态圈

易观分析

金融 证券 经济

校企共建|阿里云与重庆大学人才培养交流会顺利举行

云布道师

阿里云

中移链合约常用开发介绍(三)工程化开发智能合约

BSN研习社

BSN-DDC基础网络详解(九):跨链机制

BSN研习社

和 if else说再见,SpringBoot 这样做参数校验才足够优雅!

Java你猿哥

Java spring Spring Boot ssm if-else

解决90%的面试!GitHub新兴“java面试手册 2023” 一网打尽BAT大厂

Java你猿哥

Java MySQL Spring Boot JVM MySQL面试

DataEase 对接明道云展示表格应用数据

搞大屏的小北

数据可视化 明道云 对接api 展示明道云

蚂蚁集团开源向量索引库VSAG,支持千维以上向量存储_AI&大模型_蚂蚁集团_InfoQ精选文章