写点什么

蚂蚁集团向量检索技术的挑战与实践|QCon 北京

  • 2025-03-30
    北京
  • 本文字数:940 字

    阅读完需:约 3 分钟

蚂蚁集团向量检索技术的挑战与实践|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


蚂蚁集团资深技术专家贾玮已确认出席并发表题为《蚂蚁集团向量检索技术的挑战与实践》的主题分享,介绍蚂蚁集团在向量检索上的实践,主要涵盖向量检索成本优化、极致性能优化等方面所做的一系列工作。同时,贾玮还会分享最新的学术研究成果和工业界技术进展,以及这些成果如何在实际业务中得到应用和落地。最后介绍蚂蚁开源向量索引库 VSAG 的最新进展。


贾玮自 2016 年加入蚂蚁集团,专注于存储基础设施领域,负责蚂蚁在线存储系统的设计研发工作,目前是蚂蚁在线 KV 存储 / 内存存储 和 向量数据库的技术负责人,对计算存储基础设施、中间件、向量检索有一定实践经验。他在本次会议的详细演讲内容如下:


演讲提纲

1. 蚂蚁在向量检索上的挑战

  • 成本挑战

  • 针对不同冷热数据的优化

2. 业务应用案例

  • 稀疏向量在 RAG 的应用

  • 向量索引分区优化

  • 超高 QPS 场景性能优化

3. 最新学术研究与技术应用

  • Binary 量化优化

  • LSM-Tree Merge 索引优化

  • HGraph 层次化图索引

  • HNSW + DiskANN 混合索引上的改进

  • VSAG 在 ANN Benchmark 打榜优化

4. VSAG 开源进展(PyVSAG、SQLite 集成、GrepTime 集成、Redis 集成)


您认为,这样的技术在实践过程中有哪些痛点?

  • 向量检索面临 在成本、性能和精度 三个方向的新 CAP 挑战


演讲亮点

  • 介绍蚂蚁集团在向量数据库领域的最新探索和实践(学术研究+工程实践)


听众收益

  • 向量数据库领域的最新发展

  • 最新的学术前沿方向以及工程应用经验


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


报名或了解详情可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-30 19:465389

评论

发布
暂无评论

猫头虎 推荐:国产开源AI工具 爱派(AiPy)|支持本地部署、自动化操作本地文件的AI办公神器

猫头虎

人工智能 大模型 AI编程 AI 编程 猫头虎

配得准才是真降本:AI破解零售补调困局

第七在线

Google Search Console 做SEO分析之“已发现未编入” 与 “已抓取未编入” 有什么区别?

村头的猫

搜索引擎 SEO 建站 SEO工具 SEO 优化

中烟创新参编的《数据企业评估规范》标准正式发布

中烟创新

体育活动LED大屏:点燃赛场激情

Dylan

LED LED display 世界杯 体育 LED屏幕

宋泽致“全体员工”的一封信——野火不惧寒风,山花终将灿烂

中烟创新

施工SaaS创业的血泪教训:现金流不健康,我们是怎么陷进去的

前鼻音

非凸底仓增强算法上线国盛证券,开启智能交易新纪元

非凸科技

CTF竞赛教会我的那些大学没教的事:从理论到实战的蜕变

qife122

CTF竞赛 实战技能

从Rust模块化探索到DLB 2.0实践|得物技术

得物技术

rust DLB

WebGL 开发数字孪生项目的难点

北京木奇移动技术有限公司

软件外包公司 数字孪生开发 webgl开发

vivo Pulsar 万亿级消息处理实践(3)-KoP指标异常修复

vivo互联网技术

Java 大数据 消息队列 pulsar Kafk

CST圆极化贴片天线阵列 --- 时域T-solver, 分组激励法 By zone(Grouping)

思茂信息

电磁 天线 CST Studio Suite

技术分享 | 基于 Amazon Codepipeline 的静态网站自动部署

伊克罗德信息科技

反向海淘系统新篇!Hoobuy同款系统来袭

tbapi

淘宝代购系统 反向海淘系统 淘宝代购系统开发 反向海淘集运系统 hoobuy系统

法律AI或将颠覆行业,AlphaGPT带来法律工具新革命

科技汇

在AI时代挖掘真实需求:从CSV转HTML工具看用户痛点与创新方向

qife122

数据分析 需求挖掘

Spring框架中的Component与Bean注解

码界行者

Java spring bean Component

A Better Finder Attributes 7 for Mac文件批量重命名工具

Geek贝

开发加密货币预付卡 App

北京木奇移动技术有限公司

软件外包公司 区块链外包公司 区块链支付

SQLPro for MSSQL for Mac(MSSQL数据库客户端)

晨光熹微

AutoAgent:全自动零代码LLM智能体框架

qife122

自动化 LLM

助力律师团队持续增长,iCourt跨界论坛走进华为探讨法律行业发展方向

科技汇

NocoBase 本周更新汇总:支持自定义聚合变量

NocoBase

开源 低代码 零代码 无代码 版本更新

【社招】斑马、问界、长城、一汽、鉴智招人

Y11

安全 简历优化 找工作

苹果电脑杀毒软件哪个最好用?MacBook如何杀毒?

阿拉灯神丁

恶意软件 Mac电脑使用教程 mac电脑维护工具 杀毒软件 CleanMyMac X中文

淘宝API文档:淘宝商品详情API接口

tbapi

淘宝数据采集 淘宝API 淘宝商品详情API接口 天猫API 天猫商品详情api

AI 在英语口语练习中的核心应用

北京木奇移动技术有限公司

软件外包公司 AI口语练习 AI英语学习

Vectorworks 2023 for mac(3D建筑设计软件)

晨光熹微

数字藏品 NFT 系统的开发

北京木奇移动技术有限公司

NFT开发 软件外包公司 音乐NFT

大数据-36 HBase 增删改查 列族详解 实测

武子康

Java 大数据 hadoop 分布式 HBase

蚂蚁集团向量检索技术的挑战与实践|QCon 北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章