2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

成本节省 40%,作业帮检索系统重构实践分享 | QCon 北京

  • 2025-03-22
    北京
  • 本文字数:1696 字

    阅读完需:约 6 分钟

成本节省40%,作业帮检索系统重构实践分享 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


作业帮智能技术实验室工程架构团队负责人程童已确认出席并发表题为《作业帮检索系统重构:Havenask 实践案例分享》的主题分享。作业帮的 OCR 与检索系统自 2015 年上线以来,一直为作业帮各项业务提供高效算法能力支持。然而,随着流量、数据规模和业务形态的不断增长,原有召回引擎虽在时延和吞吐上有优势,但在容量及功能上的瓶颈逐渐显现。 从 2020 年开始,团队探索了多种优化方案,最终使用开源替换,新系统上线后,业务实现了 40% 以上的成本节省,系统能力天花板大幅提升。这一过程不仅推动了 Havenask 项目开源,也为相关技术选型提供了新方案,通过大规模系统落地验证了其可用性和可靠性。本次演讲将重点分享作业帮 OCR 与检索系统在面对业务增长和技术瓶颈时的优化历程,包括选择和推动开源项目 Havenask 的落地,以及通过技术优化实现性能提升的实践经验,为 AI 时代下的检索系统选型提供参考。


程童 2012 年毕业后入职百度,2015 年跟随作业帮分拆出来至今,见证了作业帮从初创至今十年的发展历程,经历了 OCR 和检索系统从 0 到 1 并持续迭代优化的全过程,主要参与工程架构方向的工作,重点负责系统的性能和稳定性。他在本次会议的详细演讲内容如下:


演讲提纲

1. 结果很重要:十年系统能力重塑,拥抱 AI 时代

  • 大规模检索系统成本节省 40+%

  • 低成本支撑数据爆发增长

  • 业务多元化,高效支持 AI 功能需求

2. 面对的问题

  • 业务背景

  • 传统题目检索场景

  • 系统架构和约束条件

  • 提炼核心矛盾

  • 特定查询范式下的时延要求

  • 单位吞吐支撑的索引容量

  • 高性能向量检索

3. 思路和决策

  • 现有基础上迭代优化

  • 彻底重构:自研 vs 开源

  • 用户视角的 Havenask 开源历程

4. 实践过程

  • 难点:性能效果双红线

  • Bad Case:压测、Query Cache

  • Good Case:索引排序、numa 绑定、大页内存、粗排优化、排序模型适配、部署方案适配、Subquery 生成和执行优化

5. 总结

  • 业务层面

  • 新版系统效果更好,成本更低,能力更强 - 有效支撑业务快速探索的需求

  • 技术层面

  • 此次实践催化了 Havenask 项目的开源,为技术选型提供了一种新的方案

  • 通过大规模系统落地验证了其可用性可靠性,可作为参考案例


您认为,这样的技术在实践过程中有哪些痛点?

  • 风险很高:一切都是不确定的,推动一个商业项目的核心引擎开源本身就很不确定;即便开源,在一个核心业务核心系统里启用未经验证过的项目,也是一个非常激进的想法。成,很难说功成名就,但败大概率职业生涯会大受影响。这个案例的前半部分我觉得无法复制, Havenask 的开源存在一定偶然性。我们再实施过程中也是边走边看,不断准备 PLAN B 甚至 C。直到我们落地改造前,没有哪一方是能掌控事情的发展的。

  • 替换难度:即便 Havenask 开源了,也不是说开箱可用,用了就会出现奇效,动一个核心系统底层本身就有难度,再和一个新项目磨合问题就会更多,在实施过程中我们也遇到了因判断错误引发的问题,一度影响士气,甚至到了质疑自己不求有收益只求能平安上线的地步。问题解决都是一步一步磨过来的,没有多么的高大上和云淡风轻,我觉得比较难熬,但这个项目落地以后,证明这条路是可行的,搜广推还有一套新的技术方案可选,当前的不足后续的人一定会有更好的办法解决。


演讲亮点

  • 拍搜检索属于一个垂类检索,与通用网页搜索行为存在较大差异,也很少对外介绍,通过这个案例可以了解一些业务场景上和实践上的区别

  • 这个案例也是 Havenask 开源后首个大规模的系统落地实践,相当于是一个参考案例


听众收益

  • 一定程度了解作业帮 OCR & 检索系统的工作场景

  • 了解此次系统升级的发展过程,我们是如何对比判断以及决策的


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-22 12:114438

评论

发布
暂无评论

如何进行需求管理

易成研发中心

需求管理

加速数字化转型:运营商产品加载流程优化

鲸品堂

流程 运营商 优化工具 企业号 2024年12月PK榜

实施模式变革,汉得实施HAP的最佳实践

明道云

2024 X-GAME 上海智能新能源汽车大数据竞赛决赛顺利举行,和鲸Heywhale连续五年助推新能源汽车产业发展

ModelWhale

人工智能 大数据 新能源汽车 新能源

Google PaliGemma 2 新增情绪识别能力;OpenAI 即将发布全新 Sora 视频生成器丨 RTE 开发者日报

RTE开发者社区

“伙伴+华为”,看见千行万业数智化的最优解

Alter

商业银行基于容器云的分布式数据库架构设计与创新实践

PingCAP

数据库 #TiDB 分布式, TiDB Operator

国内好用的AI工具有哪些?这5款AI别错过!

职场工具箱

人工智能 AI 办公软件 AIGC AI生成PPT

SD-WAN为企业国际业务提供坚实网络支持

Ogcloud

SD-WAN SD-WAN组网 SD-WAN国际专线 海外网络专线 海外网络访问

【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit(7)

HarmonyOS SDK

harmoyos

怎么清理苹果电脑上的内存和垃圾,苹果电脑第三方清理软件哪个好

阿拉灯神丁

存储空间 mac文件清理工具 清理工具 CleanMyMac X中文版 系统优化软件

2025中国口腔展|2025山东国际口腔设备及材料展会

秋硕展览

去中心化交易所崛起:为什么DEX是未来加密交易的最佳选择?

chainwiseweb3

区块链技术 交易所开发 去中心化交易所 dex cex交易所

HyperMesh CFD功能详解:后处理功能Part 2

Altair RapidMiner

汽车 仿真 altair Hypermesh CFD

快速集成外部业务数据:观测云如何颠覆传统监控的边界

观测云

数据库 监控

Apache Doris 3.0.3 版本正式发布

SelectDB

数据仓库 数据分析、 湖仓一体 大数据 开源 实时数据库

如何构建安全可靠的 HarmonyOS 应用

网罗开发

HarmonyOS

息壤商用落地,天翼云智能生花

脑极体

云计算

个人网盘领域首个获批!百度网盘获颁“个人信息保护认证证书”

百度安全

黑神话悟空是魂类游戏吗?苹果电脑怎么玩黑神话悟空

阿拉灯神丁

Mac 软件 苹果电脑 3A游戏 CrossOver 24 黑神话悟空

成本节省40%,作业帮检索系统重构实践分享 | QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章