写点什么

成本节省 40%,作业帮检索系统重构实践分享 | QCon 北京

  • 2025-03-22
    北京
  • 本文字数:1696 字

    阅读完需:约 6 分钟

成本节省40%,作业帮检索系统重构实践分享 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


作业帮智能技术实验室工程架构团队负责人程童已确认出席并发表题为《作业帮检索系统重构:Havenask 实践案例分享》的主题分享。作业帮的 OCR 与检索系统自 2015 年上线以来,一直为作业帮各项业务提供高效算法能力支持。然而,随着流量、数据规模和业务形态的不断增长,原有召回引擎虽在时延和吞吐上有优势,但在容量及功能上的瓶颈逐渐显现。 从 2020 年开始,团队探索了多种优化方案,最终使用开源替换,新系统上线后,业务实现了 40% 以上的成本节省,系统能力天花板大幅提升。这一过程不仅推动了 Havenask 项目开源,也为相关技术选型提供了新方案,通过大规模系统落地验证了其可用性和可靠性。本次演讲将重点分享作业帮 OCR 与检索系统在面对业务增长和技术瓶颈时的优化历程,包括选择和推动开源项目 Havenask 的落地,以及通过技术优化实现性能提升的实践经验,为 AI 时代下的检索系统选型提供参考。


程童 2012 年毕业后入职百度,2015 年跟随作业帮分拆出来至今,见证了作业帮从初创至今十年的发展历程,经历了 OCR 和检索系统从 0 到 1 并持续迭代优化的全过程,主要参与工程架构方向的工作,重点负责系统的性能和稳定性。他在本次会议的详细演讲内容如下:


演讲提纲

1. 结果很重要:十年系统能力重塑,拥抱 AI 时代

  • 大规模检索系统成本节省 40+%

  • 低成本支撑数据爆发增长

  • 业务多元化,高效支持 AI 功能需求

2. 面对的问题

  • 业务背景

  • 传统题目检索场景

  • 系统架构和约束条件

  • 提炼核心矛盾

  • 特定查询范式下的时延要求

  • 单位吞吐支撑的索引容量

  • 高性能向量检索

3. 思路和决策

  • 现有基础上迭代优化

  • 彻底重构:自研 vs 开源

  • 用户视角的 Havenask 开源历程

4. 实践过程

  • 难点:性能效果双红线

  • Bad Case:压测、Query Cache

  • Good Case:索引排序、numa 绑定、大页内存、粗排优化、排序模型适配、部署方案适配、Subquery 生成和执行优化

5. 总结

  • 业务层面

  • 新版系统效果更好,成本更低,能力更强 - 有效支撑业务快速探索的需求

  • 技术层面

  • 此次实践催化了 Havenask 项目的开源,为技术选型提供了一种新的方案

  • 通过大规模系统落地验证了其可用性可靠性,可作为参考案例


您认为,这样的技术在实践过程中有哪些痛点?

  • 风险很高:一切都是不确定的,推动一个商业项目的核心引擎开源本身就很不确定;即便开源,在一个核心业务核心系统里启用未经验证过的项目,也是一个非常激进的想法。成,很难说功成名就,但败大概率职业生涯会大受影响。这个案例的前半部分我觉得无法复制, Havenask 的开源存在一定偶然性。我们再实施过程中也是边走边看,不断准备 PLAN B 甚至 C。直到我们落地改造前,没有哪一方是能掌控事情的发展的。

  • 替换难度:即便 Havenask 开源了,也不是说开箱可用,用了就会出现奇效,动一个核心系统底层本身就有难度,再和一个新项目磨合问题就会更多,在实施过程中我们也遇到了因判断错误引发的问题,一度影响士气,甚至到了质疑自己不求有收益只求能平安上线的地步。问题解决都是一步一步磨过来的,没有多么的高大上和云淡风轻,我觉得比较难熬,但这个项目落地以后,证明这条路是可行的,搜广推还有一套新的技术方案可选,当前的不足后续的人一定会有更好的办法解决。


演讲亮点

  • 拍搜检索属于一个垂类检索,与通用网页搜索行为存在较大差异,也很少对外介绍,通过这个案例可以了解一些业务场景上和实践上的区别

  • 这个案例也是 Havenask 开源后首个大规模的系统落地实践,相当于是一个参考案例


听众收益

  • 一定程度了解作业帮 OCR & 检索系统的工作场景

  • 了解此次系统升级的发展过程,我们是如何对比判断以及决策的


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-22 12:113964

评论

发布
暂无评论

行业热点丨AI 与机器学习:解读AI术语,抢占数据时代发展先机

Altair RapidMiner

机器学习 AI 数据分析 数据科学 RapidMiner

Avid Sibelius Ultimate for mac(西贝柳斯音乐记谱软件)v2025.2 无限试用版

小玖_苹果Mac软件

最好用的项目流程管理工具OmniPlan Pro 4 for Mac中文激活版

小玖_苹果Mac软件

Termius for mac(终端模拟器/SSH/SFTP客户端)v9.15.2激活版

小玖_苹果Mac软件

Cocktail for Mac(系统清理)(15以上系统适用)v18.3注册激活版

小玖_苹果Mac软件

智慧疾控物资管理系统(源码+文档+讲解+演示)

深圳亥时科技

等保合规从哪些方面助力企业通过安全审查满足法规要求?

黑龙江陆陆信息测评部

等保测评 哈尔滨 黑龙江

Aiseesoft PDF Converter Pro for mac(一体化 PDF 转换器)v3.3.67激活版

小玖_苹果Mac软件

Topaz Gigapixel AI for Mac(AI图片无损缩放工具)v8.2.2激活版

小玖_苹果Mac软件

阿拉伯地区LED广告屏采购全攻略

Dylan

广告 信息 LED LED display LED显示屏

B2C分销管理系统(源码+文档+讲解+演示)

深圳亥时科技

Dropshare for mac(专业的网络文件共享工具)v6.0.4激活版

小玖_苹果Mac软件

Rectangle Pro for Mac(光标快速移动和管理窗口的工具)

小玖_苹果Mac软件

Dynamic Wallpaper for Mac(Mac动态壁纸桌面)v21.1中文版

小玖_苹果Mac软件

Little Snitch for Mac(小飞贼防火墙软件)v6.2.1激活版

小玖_苹果Mac软件

“零信任+AI”将持续激发网络安全领域技术创新活力

芯盾时代

统一身份认证 零信任 AI模型

中烟创新灯塔大模型应用开发平台入选“2024年度百大AI产品”

中烟创新

gpt4all for mac(Mac本地部署deepseek)附详细教程

小玖_苹果Mac软件

建材服务商城(源码+文档+讲解+演示)

深圳亥时科技

AutoMQ 可观测性实践:如何使用 OpenTelemetry 监控 Kafka 和底层流存储

AutoMQ

云计算 大数据 kafka 架构 云原生

百行代码实现 Kafka 运行在 S3 之上

AutoMQ

云计算 kafka 架构 云原生 对象存储

EMQX + DeepSeek:使用 LLM 构建可观测性数据智能分析工具

EMQ映云科技

人工智能 可观测性 物联网

图引擎在智能体开发场景的应用实践

百度Geek说

人工智能 AI 图引擎服务 agent

成本节省40%,作业帮检索系统重构实践分享 | QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章