写点什么

成本节省 40%,作业帮检索系统重构实践分享 | QCon 北京

  • 2025-03-22
    北京
  • 本文字数:1696 字

    阅读完需:约 6 分钟

成本节省40%,作业帮检索系统重构实践分享 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


作业帮智能技术实验室工程架构团队负责人程童已确认出席并发表题为《作业帮检索系统重构:Havenask 实践案例分享》的主题分享。作业帮的 OCR 与检索系统自 2015 年上线以来,一直为作业帮各项业务提供高效算法能力支持。然而,随着流量、数据规模和业务形态的不断增长,原有召回引擎虽在时延和吞吐上有优势,但在容量及功能上的瓶颈逐渐显现。 从 2020 年开始,团队探索了多种优化方案,最终使用开源替换,新系统上线后,业务实现了 40% 以上的成本节省,系统能力天花板大幅提升。这一过程不仅推动了 Havenask 项目开源,也为相关技术选型提供了新方案,通过大规模系统落地验证了其可用性和可靠性。本次演讲将重点分享作业帮 OCR 与检索系统在面对业务增长和技术瓶颈时的优化历程,包括选择和推动开源项目 Havenask 的落地,以及通过技术优化实现性能提升的实践经验,为 AI 时代下的检索系统选型提供参考。


程童 2012 年毕业后入职百度,2015 年跟随作业帮分拆出来至今,见证了作业帮从初创至今十年的发展历程,经历了 OCR 和检索系统从 0 到 1 并持续迭代优化的全过程,主要参与工程架构方向的工作,重点负责系统的性能和稳定性。他在本次会议的详细演讲内容如下:


演讲提纲

1. 结果很重要:十年系统能力重塑,拥抱 AI 时代

  • 大规模检索系统成本节省 40+%

  • 低成本支撑数据爆发增长

  • 业务多元化,高效支持 AI 功能需求

2. 面对的问题

  • 业务背景

  • 传统题目检索场景

  • 系统架构和约束条件

  • 提炼核心矛盾

  • 特定查询范式下的时延要求

  • 单位吞吐支撑的索引容量

  • 高性能向量检索

3. 思路和决策

  • 现有基础上迭代优化

  • 彻底重构:自研 vs 开源

  • 用户视角的 Havenask 开源历程

4. 实践过程

  • 难点:性能效果双红线

  • Bad Case:压测、Query Cache

  • Good Case:索引排序、numa 绑定、大页内存、粗排优化、排序模型适配、部署方案适配、Subquery 生成和执行优化

5. 总结

  • 业务层面

  • 新版系统效果更好,成本更低,能力更强 - 有效支撑业务快速探索的需求

  • 技术层面

  • 此次实践催化了 Havenask 项目的开源,为技术选型提供了一种新的方案

  • 通过大规模系统落地验证了其可用性可靠性,可作为参考案例


您认为,这样的技术在实践过程中有哪些痛点?

  • 风险很高:一切都是不确定的,推动一个商业项目的核心引擎开源本身就很不确定;即便开源,在一个核心业务核心系统里启用未经验证过的项目,也是一个非常激进的想法。成,很难说功成名就,但败大概率职业生涯会大受影响。这个案例的前半部分我觉得无法复制, Havenask 的开源存在一定偶然性。我们再实施过程中也是边走边看,不断准备 PLAN B 甚至 C。直到我们落地改造前,没有哪一方是能掌控事情的发展的。

  • 替换难度:即便 Havenask 开源了,也不是说开箱可用,用了就会出现奇效,动一个核心系统底层本身就有难度,再和一个新项目磨合问题就会更多,在实施过程中我们也遇到了因判断错误引发的问题,一度影响士气,甚至到了质疑自己不求有收益只求能平安上线的地步。问题解决都是一步一步磨过来的,没有多么的高大上和云淡风轻,我觉得比较难熬,但这个项目落地以后,证明这条路是可行的,搜广推还有一套新的技术方案可选,当前的不足后续的人一定会有更好的办法解决。


演讲亮点

  • 拍搜检索属于一个垂类检索,与通用网页搜索行为存在较大差异,也很少对外介绍,通过这个案例可以了解一些业务场景上和实践上的区别

  • 这个案例也是 Havenask 开源后首个大规模的系统落地实践,相当于是一个参考案例


听众收益

  • 一定程度了解作业帮 OCR & 检索系统的工作场景

  • 了解此次系统升级的发展过程,我们是如何对比判断以及决策的


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-22 12:114418

评论

发布
暂无评论

海外社交媒体分析赋能舆情监测,打造声誉防火墙

沃观Wovision

跨境电商 社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

帮助求职者优化简历的6个ChatGPT提示

秃头小帅oi

鸿蒙ArkUI-X简介

最新动态

迈向下一代智能运维!2025年嘉为蓝鲸自动运维中心V3.1:双场景新增融合大模型赋能,推动平台全面升级

嘉为蓝鲸

自动化运维 IT自动化运维 智能巡检 IT巡检 自动化运维系统

终极预告 2025 云栖大会“操作系统开源与 AI 进化”分论坛全议程揭晓

OpenAnolis小助手

开源 AI 操作系统 云栖大会 龙蜥社区

一毛钱好友商城系统介绍

微擎应用市场

2025嘉为蓝鲸IT服务管理中心V4.6:低代码变更配置+AI工单转知识,五大优化破效率瓶颈

嘉为蓝鲸

ITSM 低代码平台 IT服务管理 工单系统 IT变更管理

鸿蒙安全控件之位置控件简介

最新动态

分布式管理核心功能解析:网络服务和数据传输的实现

最新动态

365锦鲤助手系统详情

微擎应用市场

Braintree iOS Drop-in SDK - 一站式支付解决方案

qife122

ios sdk 支付集成

玩转n8n测试自动化:核心节点详解与测试实战指南

测试人

【指标查询调优实践案例】ArgoDB助力某银行实现性能全面提升

星环科技

instagram为什么没有官方下载功能?

So...

Instagram

鸿蒙开发Hvigor任务简介

最新动态

网页转小程序封装机系统介绍

微擎应用市场

大模型评测实践与思考

百度Geek说

大模型评估

舆情监测系统与海外社交媒体分析结合:从碎片化信息到系统化洞察

沃观Wovision

跨境电商 社交媒体 沃观Wovision 舆情监测系统 海外舆情监测

让天下没有难查的故障:2025 阿里云 AI 原生编程挑战赛正式启动

阿里巴巴云原生

阿里云 AI 云原生 可观测

大咖来袭 操作系统开源与 AI 进化分论坛亮点剧透|2025 云栖大会

OpenAnolis小助手

开源 AI 操作系统 云栖大会 龙蜥社区

DAT(数位资产金库)入门指南:从零了解数字资产新趋势

TechubNews

通义灵码产品演示: 数据库设计与数据分析

阿里云云效

阿里云 通义灵码

龙蜥伙伴活动推荐:Chitu First Meetup 在杭州召开,欢迎参加

OpenAnolis小助手

活动 龙蜥社区 龙蜥生态

重磅活动推荐:第 20 届「中国 Linux 内核开发者大会」征稿开始啦

OpenAnolis小助手

Linux 操作系统 内核 CLK大会

从简单查找到代理推理:聊聊智能RAG系统的兴起

伤感汤姆布利柏

鸿蒙hvigor构建任务依赖与生命周期简介

最新动态

原点安全入选《中国汽车网络与数据安全行业全景图》

原点安全

原生APP与H5 APP开发的对比

北京木奇科技有限公司

APP开发 软件外包公司 APP外包

通义灵码产品演示: 数据库设计与数据分析

阿里巴巴云原生

阿里云 云原生 通义灵码

我用Comate搭建「公园找搭子」神器,再也不孤单啦~

Comate编码助手

小程序 AI编程 文心快码 文心快码Zulu

鸿蒙用户首选项数据持久化

最新动态

成本节省40%,作业帮检索系统重构实践分享 | QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章