写点什么

成本节省 40%,作业帮检索系统重构实践分享 | QCon 北京

  • 2025-03-22
    北京
  • 本文字数:1696 字

    阅读完需:约 6 分钟

成本节省40%,作业帮检索系统重构实践分享 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


作业帮智能技术实验室工程架构团队负责人程童已确认出席并发表题为《作业帮检索系统重构:Havenask 实践案例分享》的主题分享。作业帮的 OCR 与检索系统自 2015 年上线以来,一直为作业帮各项业务提供高效算法能力支持。然而,随着流量、数据规模和业务形态的不断增长,原有召回引擎虽在时延和吞吐上有优势,但在容量及功能上的瓶颈逐渐显现。 从 2020 年开始,团队探索了多种优化方案,最终使用开源替换,新系统上线后,业务实现了 40% 以上的成本节省,系统能力天花板大幅提升。这一过程不仅推动了 Havenask 项目开源,也为相关技术选型提供了新方案,通过大规模系统落地验证了其可用性和可靠性。本次演讲将重点分享作业帮 OCR 与检索系统在面对业务增长和技术瓶颈时的优化历程,包括选择和推动开源项目 Havenask 的落地,以及通过技术优化实现性能提升的实践经验,为 AI 时代下的检索系统选型提供参考。


程童 2012 年毕业后入职百度,2015 年跟随作业帮分拆出来至今,见证了作业帮从初创至今十年的发展历程,经历了 OCR 和检索系统从 0 到 1 并持续迭代优化的全过程,主要参与工程架构方向的工作,重点负责系统的性能和稳定性。他在本次会议的详细演讲内容如下:


演讲提纲

1. 结果很重要:十年系统能力重塑,拥抱 AI 时代

  • 大规模检索系统成本节省 40+%

  • 低成本支撑数据爆发增长

  • 业务多元化,高效支持 AI 功能需求

2. 面对的问题

  • 业务背景

  • 传统题目检索场景

  • 系统架构和约束条件

  • 提炼核心矛盾

  • 特定查询范式下的时延要求

  • 单位吞吐支撑的索引容量

  • 高性能向量检索

3. 思路和决策

  • 现有基础上迭代优化

  • 彻底重构:自研 vs 开源

  • 用户视角的 Havenask 开源历程

4. 实践过程

  • 难点:性能效果双红线

  • Bad Case:压测、Query Cache

  • Good Case:索引排序、numa 绑定、大页内存、粗排优化、排序模型适配、部署方案适配、Subquery 生成和执行优化

5. 总结

  • 业务层面

  • 新版系统效果更好,成本更低,能力更强 - 有效支撑业务快速探索的需求

  • 技术层面

  • 此次实践催化了 Havenask 项目的开源,为技术选型提供了一种新的方案

  • 通过大规模系统落地验证了其可用性可靠性,可作为参考案例


您认为,这样的技术在实践过程中有哪些痛点?

  • 风险很高:一切都是不确定的,推动一个商业项目的核心引擎开源本身就很不确定;即便开源,在一个核心业务核心系统里启用未经验证过的项目,也是一个非常激进的想法。成,很难说功成名就,但败大概率职业生涯会大受影响。这个案例的前半部分我觉得无法复制, Havenask 的开源存在一定偶然性。我们再实施过程中也是边走边看,不断准备 PLAN B 甚至 C。直到我们落地改造前,没有哪一方是能掌控事情的发展的。

  • 替换难度:即便 Havenask 开源了,也不是说开箱可用,用了就会出现奇效,动一个核心系统底层本身就有难度,再和一个新项目磨合问题就会更多,在实施过程中我们也遇到了因判断错误引发的问题,一度影响士气,甚至到了质疑自己不求有收益只求能平安上线的地步。问题解决都是一步一步磨过来的,没有多么的高大上和云淡风轻,我觉得比较难熬,但这个项目落地以后,证明这条路是可行的,搜广推还有一套新的技术方案可选,当前的不足后续的人一定会有更好的办法解决。


演讲亮点

  • 拍搜检索属于一个垂类检索,与通用网页搜索行为存在较大差异,也很少对外介绍,通过这个案例可以了解一些业务场景上和实践上的区别

  • 这个案例也是 Havenask 开源后首个大规模的系统落地实践,相当于是一个参考案例


听众收益

  • 一定程度了解作业帮 OCR & 检索系统的工作场景

  • 了解此次系统升级的发展过程,我们是如何对比判断以及决策的


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-22 12:113949

评论

发布
暂无评论

研发流程管理中,如何实现项目管理与代码信息的协同?

LigaAI

研发管理 解决方案 #GitLab LigaAI 企业号十月PK榜

细说Js中的this

hellocoder2029

JavaScript

图解ReentrantReadWriteLock读写锁的实现原理

JAVA旭阳

Java 并发 10月月更

GameFi链游系统开发(NFT链游)

薇電13242772558

NFT

odejs+Redis实现简易消息队列

coder2028

node.js

制造业转型加速密钥——低代码开发平台

力软低代码开发平台

APICloud AVM 框架 纵向滚动通知栏组件

YonBuilder低代码开发平台

SAP | abap基本语法规则

暮春零贰

SAP abap 10月月更

Qt示例 | 数字时钟 Digital Clock Example

YOLO.

qt 10月月更 C++

SmartBear与龙智宣布建立战略合作伙伴关系

龙智—DevSecOps解决方案

合作 龙智

Vue 2x 中使用 render 和 jsx 的最佳实践 (3)

默默的成长

前端 Vue 3 10月月更

推荐有礼 | 京东云推荐返利活动说明

京东科技开发者

京东云 云推客 代理商 分销 渠道

2022-webpack5实战教程

Geek_02d948

webpack

CEF | 探索实现基于CEF框架的客户端

YOLO.

qt 10月月更 C++

一文读懂NodeJs知识体系和原理浅析

coder2028

node.js

彻底搞懂JS原型与原型链

hellocoder2029

JavaScript

保10万涨薪、保Offer、保大厂,1V1私教服务上线啦

测试人

软件测试 涨薪 测试开发

TypeScript介绍和使用

默默的成长

typescript 前端 10月月更

细说js变量、作用域和垃圾回收

hellocoder2029

JavaScript

面向函数编程:关于函数式组件、dialog的api化

默默的成长

前端 Vue 3 10月月更

常用的文本检测与识别方法 - 第一节【文本检测与识别-白皮书-第三章】

合合技术团队

人工智能 机器学习 AI 文字识别 文字擦除

模块二作业

知足🐏

AIGC时代到来?聊聊其中最出圈的语言模型GPT-3

Baihai IDP

AI NLP 大模型 AIGC GPT-3

Java 19中新推出的虚拟线程到底是怎么回事儿?

Hollis

Java

ITSM | Forrester发布报告,7大重要见解总结IT运营状况

龙智—DevSecOps解决方案

IT运维

Nodejs相关ORM框架分析

coder2028

node.js

浅谈理想中的业务开发模式

久歌

架构 开发 技术架构 服务编排

BizWorks助力企业应用的高效开发与复用

阿里云E2企业云服务

阿里云 开发者 云原生 低代码

IP设计是什么?为什么它很重要?

龙智—DevSecOps解决方案

知识产权 IP 芯片开发 IP核 IP核设计

Nodejs中的进程间通信

coder2028

node.js

代码静态测试 | MISRA是什么?如何使用它来改进嵌入式编码?

龙智—DevSecOps解决方案

c 嵌入式设计 嵌入式开发

成本节省40%,作业帮检索系统重构实践分享 | QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章