2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

成本节省 40%,作业帮检索系统重构实践分享 | QCon 北京

  • 2025-03-22
    北京
  • 本文字数:1696 字

    阅读完需:约 6 分钟

成本节省40%,作业帮检索系统重构实践分享 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


作业帮智能技术实验室工程架构团队负责人程童已确认出席并发表题为《作业帮检索系统重构:Havenask 实践案例分享》的主题分享。作业帮的 OCR 与检索系统自 2015 年上线以来,一直为作业帮各项业务提供高效算法能力支持。然而,随着流量、数据规模和业务形态的不断增长,原有召回引擎虽在时延和吞吐上有优势,但在容量及功能上的瓶颈逐渐显现。 从 2020 年开始,团队探索了多种优化方案,最终使用开源替换,新系统上线后,业务实现了 40% 以上的成本节省,系统能力天花板大幅提升。这一过程不仅推动了 Havenask 项目开源,也为相关技术选型提供了新方案,通过大规模系统落地验证了其可用性和可靠性。本次演讲将重点分享作业帮 OCR 与检索系统在面对业务增长和技术瓶颈时的优化历程,包括选择和推动开源项目 Havenask 的落地,以及通过技术优化实现性能提升的实践经验,为 AI 时代下的检索系统选型提供参考。


程童 2012 年毕业后入职百度,2015 年跟随作业帮分拆出来至今,见证了作业帮从初创至今十年的发展历程,经历了 OCR 和检索系统从 0 到 1 并持续迭代优化的全过程,主要参与工程架构方向的工作,重点负责系统的性能和稳定性。他在本次会议的详细演讲内容如下:


演讲提纲

1. 结果很重要:十年系统能力重塑,拥抱 AI 时代

  • 大规模检索系统成本节省 40+%

  • 低成本支撑数据爆发增长

  • 业务多元化,高效支持 AI 功能需求

2. 面对的问题

  • 业务背景

  • 传统题目检索场景

  • 系统架构和约束条件

  • 提炼核心矛盾

  • 特定查询范式下的时延要求

  • 单位吞吐支撑的索引容量

  • 高性能向量检索

3. 思路和决策

  • 现有基础上迭代优化

  • 彻底重构:自研 vs 开源

  • 用户视角的 Havenask 开源历程

4. 实践过程

  • 难点:性能效果双红线

  • Bad Case:压测、Query Cache

  • Good Case:索引排序、numa 绑定、大页内存、粗排优化、排序模型适配、部署方案适配、Subquery 生成和执行优化

5. 总结

  • 业务层面

  • 新版系统效果更好,成本更低,能力更强 - 有效支撑业务快速探索的需求

  • 技术层面

  • 此次实践催化了 Havenask 项目的开源,为技术选型提供了一种新的方案

  • 通过大规模系统落地验证了其可用性可靠性,可作为参考案例


您认为,这样的技术在实践过程中有哪些痛点?

  • 风险很高:一切都是不确定的,推动一个商业项目的核心引擎开源本身就很不确定;即便开源,在一个核心业务核心系统里启用未经验证过的项目,也是一个非常激进的想法。成,很难说功成名就,但败大概率职业生涯会大受影响。这个案例的前半部分我觉得无法复制, Havenask 的开源存在一定偶然性。我们再实施过程中也是边走边看,不断准备 PLAN B 甚至 C。直到我们落地改造前,没有哪一方是能掌控事情的发展的。

  • 替换难度:即便 Havenask 开源了,也不是说开箱可用,用了就会出现奇效,动一个核心系统底层本身就有难度,再和一个新项目磨合问题就会更多,在实施过程中我们也遇到了因判断错误引发的问题,一度影响士气,甚至到了质疑自己不求有收益只求能平安上线的地步。问题解决都是一步一步磨过来的,没有多么的高大上和云淡风轻,我觉得比较难熬,但这个项目落地以后,证明这条路是可行的,搜广推还有一套新的技术方案可选,当前的不足后续的人一定会有更好的办法解决。


演讲亮点

  • 拍搜检索属于一个垂类检索,与通用网页搜索行为存在较大差异,也很少对外介绍,通过这个案例可以了解一些业务场景上和实践上的区别

  • 这个案例也是 Havenask 开源后首个大规模的系统落地实践,相当于是一个参考案例


听众收益

  • 一定程度了解作业帮 OCR & 检索系统的工作场景

  • 了解此次系统升级的发展过程,我们是如何对比判断以及决策的


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-22 12:114391

评论

发布
暂无评论

2021金九银十Java面试经历:腾讯5面(已拿offer)

Java 编程 程序员 架构 面试

横空出世!IDEA画图神器来了,比Visio快10倍

收到请回复

Java IDEA idea插件

飞桨与海光人工智能加速卡DCU系列完成互证,助力国产AI加速 卡人工智能应用创新

百度大脑

人工智能 深度学习 飞桨

通关宝典!Java 面试核心知识让你面试过,过,过!

Java 程序员 面试 后端 构架

无敌!学透美团老哥的这套微服务进阶学习手册拿个P7还是so easy!

Java 架构 面试 程序人生 编程语言

Rtmp Message 与 Chunk格式

webrtc developer

RTMP

总结出这份学习笔记,帮助朋友成功跳槽!六年阿里工作,苦熬到 P7经验分享!

Java 程序员 架构 后端 工程师

双非本科猛斩6个offer,秘籍公开!

Java 程序员 架构 面试 后端

怒肝 Linux 学习路线,这回不难

程序员鱼皮

Linux 编程 后端 开发 java

凌晨加班回家路上捡到阿里技术人限产的MySQL高级笔记及面试宝典,从此我的人生像开挂一样!

Java 架构 面试 程序人生 编程语言

被疫情“带飞”的家庭健身市场,是时候卷起来了

脑极体

Java高级、架构师必备!Lucene+ElasticStack入门至项目实战!

Java 架构 面试 程序人生 编程语言

互动视频和5G的相互成就

脑极体

ToB产品如何自传播(上)

石云升

产品经理 产品设计 产品思维 10月月更

自定义View:如何绘制一个饼图

Changing Lin

10月月更

RUOYI 框架教程 15|若依框架中 Mysql 操作 | 日期处理

Java_若依框架教程

Java 技术 Ruoyi 框架 若依

区块链通证经济和传统经济的区别,如何实现

CECBC

没想到!阿里技术大佬独家收藏的pring全家桶小册,竟被我意外发现!

Java 架构 面试 程序人生 编程语言

RUOYI 框架教程 16|关于若依RuoYi.jar卡顿,僵死,假死,系统无反映解决方案

Java_若依框架教程

技术 Ruoyi 开发 框架 若依

Leetcode题目解析:274. H 指数

程序员架构进阶

面试 算法 LeetCode 10月月更

TypeScript 中的 Index Signatures

Regan Yue

typescript ReganYue 10月月更

基于HarmonyOS分布式技术,他们让绘画体验更为出色

Geek_283163

鸿蒙

面试多次被拒,“两个月”61天,我收到了蚂蚁金服P7级的offer

Java spring 程序员 架构 编程语言

一女程序员因薪酬问题离职,rm -f * 删库,瘫痪6个小时,被判9个月

收到请回复

Java 程序员 面试 面经

gitee上提交PR和issue流程和注意事项

Geek_6cdeb6

机器学习 深度学习 git

区块链通证经济的意义

CECBC

神马操作!Kafka 竟然宣布弃用 Java 8

收到请回复

Java kafka 后端 java8

观测云产品更新|新增主机网络性能监测、图表矩形树图、多监测关联查询等功能

观测云

功能更新

4年CRUD小职员,五面阿里艰苦经历(定薪45K),回馈一波心得体会

收到请回复

Java 程序员 面试 后端 面经

这么卷吗?大三学生喜获阿里提前批

Java 程序员 架构 后端

升级了 Windows 11 正式版,有坑吗?

王磊

成本节省40%,作业帮检索系统重构实践分享 | QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章