写点什么

蚂蚁集团向量检索技术的挑战与实践|QCon 北京

  • 2025-03-30
    北京
  • 本文字数:940 字

    阅读完需:约 3 分钟

蚂蚁集团向量检索技术的挑战与实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


蚂蚁集团资深技术专家贾玮已确认出席并发表题为《蚂蚁集团向量检索技术的挑战与实践》的主题分享,介绍蚂蚁集团在向量检索上的实践,主要涵盖向量检索成本优化、极致性能优化等方面所做的一系列工作。同时,贾玮还会分享最新的学术研究成果和工业界技术进展,以及这些成果如何在实际业务中得到应用和落地。最后介绍蚂蚁开源向量索引库 VSAG 的最新进展。


贾玮自 2016 年加入蚂蚁集团,专注于存储基础设施领域,负责蚂蚁在线存储系统的设计研发工作,目前是蚂蚁在线 KV 存储 / 内存存储 和 向量数据库的技术负责人,对计算存储基础设施、中间件、向量检索有一定实践经验。他在本次会议的详细演讲内容如下:


演讲提纲

1. 蚂蚁在向量检索上的挑战

  • 成本挑战

  • 针对不同冷热数据的优化

2. 业务应用案例

  • 稀疏向量在 RAG 的应用

  • 向量索引分区优化

  • 超高 QPS 场景性能优化

3. 最新学术研究与技术应用

  • Binary 量化优化

  • LSM-Tree Merge 索引优化

  • HGraph 层次化图索引

  • HNSW + DiskANN 混合索引上的改进

  • VSAG 在 ANN Benchmark 打榜优化

4. VSAG 开源进展(PyVSAG、SQLite 集成、GrepTime 集成、Redis 集成)


您认为,这样的技术在实践过程中有哪些痛点?

  • 向量检索面临 在成本、性能和精度 三个方向的新 CAP 挑战


演讲亮点

  • 介绍蚂蚁集团在向量数据库领域的最新探索和实践(学术研究+工程实践)


听众收益

  • 向量数据库领域的最新发展

  • 最新的学术前沿方向以及工程应用经验


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


报名或了解详情可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-30 19:465177

评论

发布
暂无评论

后端老司机的跨域之旅

勇哥java实战分享

后端 CORS

金融云原生漫谈(一)|银行业如何快速提升应用研发效能和交付效率?

York

金融云原生漫谈(三)|银行云原生基础设施构建:裸金属VS虚拟机

York

云原生 金融科技 新基建

Rainbond 对接 Istio 原理讲解和代码实现分析

北京好雨科技有限公司

Kubernetes istio PaaS rainbond

【MongoDB白皮书】DIRT和复杂性的高成本

MongoDB中文社区

mongodb

纯 MongoDB 实现中文全文搜索

MongoDB中文社区

mongodb

金融云原生漫谈(四)|如何构建高可用、高并发、高性能的云原生容器网络?

York

云原生 金融科技 高性能网络

资讯|WebRTC M96 更新

网易云信

大数据 WebRTC 开发

Swift 在手淘商品评价的技术重构与实践

阿里巴巴终端技术

ios swift 移动开发 客户端

音视频开发:FFmpeg时间戳详解

赖猫

音视频 ffmpeg

恒源云(GPUSHARE)_云GPU服务器如何使用FinRL?

恒源云

算法 框架 PyTorch

APICloud 入门教程窗口篇

YonBuilder低代码开发平台

前端 APP开发 APICloud 跨端开发

定了!皮皮APP助力电子竞技游戏师职业技能标准发布!

联营汇聚

推荐一款少见开源的支付类项目(Spring Boot+Shiro+MyBatis+Redis)

北游学Java

Java redis spring mybatis

金融云原生漫谈(二)|中小银行破局之道:云原生架构转型全攻略

York

2022开篇之作,Docker与微服务实战教程

编程江湖

「死磕」传统工业软件路径不通 他们给自己造了把梯子

ToB行业头条

Git fork的学习笔记

Changing Lin

1月月更

基于Paddle Serving&百度智能边缘BIE的边缘AI解决方案

百度开发者中心

飞桨

防火墙是什么?怎么理解?

行云管家

运维 网络安全 防火墙 堡垒机

Flutter VS React Native,跨端方案大 PK

融云 RongCloud

flutter React Native Discord

为什么要避免在 Go 中使用 ioutil.ReadAll?

AlwaysBeta

Go 源码 io Go 语言

流式数据质量监控的技术调研及选型思考

字节跳动数据平台

sql 字节跳动 数据质量 流式数据 flik

堡垒机和防火墙的区别是什么?能防删库跑路吗?

行云管家

运维 网络安全 防火墙 堡垒机

2021年度优质创作者评选名单公布!

InfoQ写作社区官方

热门活动

直播系统聊天技术(六):百万人在线的直播间实时聊天消息分发技术实践

JackJiang

消息推送 即时通讯 IM 直播技术 直播聊天室

肝了三个月Linux内核,面试薪资直接翻番,我才明白TA的重要性!

Yt

c++ Linux服务器开发 Linux内核 驱动开发

【网络安全】文件上传绕过思路

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

创业公司COO:用宜搭落地管理思想,打破数据壁垒|《102个开发者故事》第五期

一只大光圈

低代码 数字化转型 企业管理 钉钉宜搭

常见的跨域场景

郑州埃文科技

数据库 IP 跨域

Apache APISIX 社区双周报 | 功能亮点更新进行中

API7.ai 技术团队

开源 云原生 API网关 社区 Apache APISIX

蚂蚁集团向量检索技术的挑战与实践|QCon 北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章