写点什么

成本节省 40%,作业帮检索系统重构实践分享 | QCon 北京

  • 2025-03-22
    北京
  • 本文字数:1696 字

    阅读完需:约 6 分钟

成本节省40%,作业帮检索系统重构实践分享 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


作业帮智能技术实验室工程架构团队负责人程童已确认出席并发表题为《作业帮检索系统重构:Havenask 实践案例分享》的主题分享。作业帮的 OCR 与检索系统自 2015 年上线以来,一直为作业帮各项业务提供高效算法能力支持。然而,随着流量、数据规模和业务形态的不断增长,原有召回引擎虽在时延和吞吐上有优势,但在容量及功能上的瓶颈逐渐显现。 从 2020 年开始,团队探索了多种优化方案,最终使用开源替换,新系统上线后,业务实现了 40% 以上的成本节省,系统能力天花板大幅提升。这一过程不仅推动了 Havenask 项目开源,也为相关技术选型提供了新方案,通过大规模系统落地验证了其可用性和可靠性。本次演讲将重点分享作业帮 OCR 与检索系统在面对业务增长和技术瓶颈时的优化历程,包括选择和推动开源项目 Havenask 的落地,以及通过技术优化实现性能提升的实践经验,为 AI 时代下的检索系统选型提供参考。


程童 2012 年毕业后入职百度,2015 年跟随作业帮分拆出来至今,见证了作业帮从初创至今十年的发展历程,经历了 OCR 和检索系统从 0 到 1 并持续迭代优化的全过程,主要参与工程架构方向的工作,重点负责系统的性能和稳定性。他在本次会议的详细演讲内容如下:


演讲提纲

1. 结果很重要:十年系统能力重塑,拥抱 AI 时代

  • 大规模检索系统成本节省 40+%

  • 低成本支撑数据爆发增长

  • 业务多元化,高效支持 AI 功能需求

2. 面对的问题

  • 业务背景

  • 传统题目检索场景

  • 系统架构和约束条件

  • 提炼核心矛盾

  • 特定查询范式下的时延要求

  • 单位吞吐支撑的索引容量

  • 高性能向量检索

3. 思路和决策

  • 现有基础上迭代优化

  • 彻底重构:自研 vs 开源

  • 用户视角的 Havenask 开源历程

4. 实践过程

  • 难点:性能效果双红线

  • Bad Case:压测、Query Cache

  • Good Case:索引排序、numa 绑定、大页内存、粗排优化、排序模型适配、部署方案适配、Subquery 生成和执行优化

5. 总结

  • 业务层面

  • 新版系统效果更好,成本更低,能力更强 - 有效支撑业务快速探索的需求

  • 技术层面

  • 此次实践催化了 Havenask 项目的开源,为技术选型提供了一种新的方案

  • 通过大规模系统落地验证了其可用性可靠性,可作为参考案例


您认为,这样的技术在实践过程中有哪些痛点?

  • 风险很高:一切都是不确定的,推动一个商业项目的核心引擎开源本身就很不确定;即便开源,在一个核心业务核心系统里启用未经验证过的项目,也是一个非常激进的想法。成,很难说功成名就,但败大概率职业生涯会大受影响。这个案例的前半部分我觉得无法复制, Havenask 的开源存在一定偶然性。我们再实施过程中也是边走边看,不断准备 PLAN B 甚至 C。直到我们落地改造前,没有哪一方是能掌控事情的发展的。

  • 替换难度:即便 Havenask 开源了,也不是说开箱可用,用了就会出现奇效,动一个核心系统底层本身就有难度,再和一个新项目磨合问题就会更多,在实施过程中我们也遇到了因判断错误引发的问题,一度影响士气,甚至到了质疑自己不求有收益只求能平安上线的地步。问题解决都是一步一步磨过来的,没有多么的高大上和云淡风轻,我觉得比较难熬,但这个项目落地以后,证明这条路是可行的,搜广推还有一套新的技术方案可选,当前的不足后续的人一定会有更好的办法解决。


演讲亮点

  • 拍搜检索属于一个垂类检索,与通用网页搜索行为存在较大差异,也很少对外介绍,通过这个案例可以了解一些业务场景上和实践上的区别

  • 这个案例也是 Havenask 开源后首个大规模的系统落地实践,相当于是一个参考案例


听众收益

  • 一定程度了解作业帮 OCR & 检索系统的工作场景

  • 了解此次系统升级的发展过程,我们是如何对比判断以及决策的


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-22 12:114068

评论

发布
暂无评论

设备租借系统(源码+文档+部署+讲解)

深圳亥时科技

信创堡垒机品牌推荐-行云软件

行云管家

信创 等保 堡垒机

ByteHouse直播预告:揭秘基于OLAP降本增效的四大硬招

字节跳动数据平台

大数据 活动

仓储管理系统-生产企业版(源码+文档+部署+讲解)

深圳亥时科技

场地预约系统(源码+文档+部署+讲解)

深圳亥时科技

软件测试学习笔记丨Pytest的使用

测试人

软件测试

灵活用工招聘平台(源码+文档+部署+讲解)

深圳亥时科技

本地生活小程序(源码+文档+部署+讲解)

深圳亥时科技

Autodesk AutoCAD 2025 简体中文版下载【Mac/win】

Rose

TDengine 与新奥新智达成合作,支撑海量设备、亿级数据

TDengine

数据库 tdengine 时序数据库

仓储管理系统-贵金属(源码+文档+部署+讲解)

深圳亥时科技

HyperMesh打开保存文件与面板功能使用

智造软件

Hypermesh 保存 功能使用

项目管理全流程平台(源码+文档+部署+讲解)

深圳亥时科技

LED全彩显示屏的9大优点

Dylan

广告 LED display LED显示屏 市场 体育

智慧灌区系统(源码+文档+部署+讲解)

深圳亥时科技

品讯HRO系统(源码+文档+部署+讲解)

深圳亥时科技

深入探讨 TDengine S3:让你的数据管理更轻松

TDengine

数据库 时序数据库 #TDengine

AI语音模型在家宽业务中的应用

鲸品堂

企业号 2024年10月PK榜

人工智能如何改变企业运营:实际应用案例分析

天津汇柏科技有限公司

AI人工智能

劳务争议调解平台(源码+文档+部署+讲解)

深圳亥时科技

智慧停车系统(源码+文档+部署+讲解)

深圳亥时科技

溯源管理系统(源码+文档+部署+讲解)

深圳亥时科技

diskdrill激活码分享 优秀的数据恢复工具

Rose

电子病历系统(源码+文档+部署+讲解)

深圳亥时科技

2024新疆等级保护测评机构名单汇总

行云管家

等保 新疆 等保测评

巡检任务管理系统(源码+文档+部署+讲解)

深圳亥时科技

就业驿站管理系统(源码+文档+部署+讲解)

深圳亥时科技

品牌线下连锁商城(源码+文档+部署+讲解)

深圳亥时科技

拍立淘API返回值算法深度解析:智能化按图搜索的奥秘

代码忍者

pinduoduo API API 性能测试

简体中文版excel2019-正版激活-永久使用

Rose

无人机管理系统(源码+文档+部署+讲解)

深圳亥时科技

成本节省40%,作业帮检索系统重构实践分享 | QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章