燃爆上海 5·23-24,AICon 大模型实战风暴,50+ 干货一网打尽,即将开幕~ 了解详情
写点什么

成本节省 40%,作业帮检索系统重构实践分享 | QCon 北京

  • 2025-03-22
    北京
  • 本文字数:1696 字

    阅读完需:约 6 分钟

成本节省40%,作业帮检索系统重构实践分享 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


作业帮智能技术实验室工程架构团队负责人程童已确认出席并发表题为《作业帮检索系统重构:Havenask 实践案例分享》的主题分享。作业帮的 OCR 与检索系统自 2015 年上线以来,一直为作业帮各项业务提供高效算法能力支持。然而,随着流量、数据规模和业务形态的不断增长,原有召回引擎虽在时延和吞吐上有优势,但在容量及功能上的瓶颈逐渐显现。 从 2020 年开始,团队探索了多种优化方案,最终使用开源替换,新系统上线后,业务实现了 40% 以上的成本节省,系统能力天花板大幅提升。这一过程不仅推动了 Havenask 项目开源,也为相关技术选型提供了新方案,通过大规模系统落地验证了其可用性和可靠性。本次演讲将重点分享作业帮 OCR 与检索系统在面对业务增长和技术瓶颈时的优化历程,包括选择和推动开源项目 Havenask 的落地,以及通过技术优化实现性能提升的实践经验,为 AI 时代下的检索系统选型提供参考。


程童 2012 年毕业后入职百度,2015 年跟随作业帮分拆出来至今,见证了作业帮从初创至今十年的发展历程,经历了 OCR 和检索系统从 0 到 1 并持续迭代优化的全过程,主要参与工程架构方向的工作,重点负责系统的性能和稳定性。他在本次会议的详细演讲内容如下:


演讲提纲

1. 结果很重要:十年系统能力重塑,拥抱 AI 时代

  • 大规模检索系统成本节省 40+%

  • 低成本支撑数据爆发增长

  • 业务多元化,高效支持 AI 功能需求

2. 面对的问题

  • 业务背景

  • 传统题目检索场景

  • 系统架构和约束条件

  • 提炼核心矛盾

  • 特定查询范式下的时延要求

  • 单位吞吐支撑的索引容量

  • 高性能向量检索

3. 思路和决策

  • 现有基础上迭代优化

  • 彻底重构:自研 vs 开源

  • 用户视角的 Havenask 开源历程

4. 实践过程

  • 难点:性能效果双红线

  • Bad Case:压测、Query Cache

  • Good Case:索引排序、numa 绑定、大页内存、粗排优化、排序模型适配、部署方案适配、Subquery 生成和执行优化

5. 总结

  • 业务层面

  • 新版系统效果更好,成本更低,能力更强 - 有效支撑业务快速探索的需求

  • 技术层面

  • 此次实践催化了 Havenask 项目的开源,为技术选型提供了一种新的方案

  • 通过大规模系统落地验证了其可用性可靠性,可作为参考案例


您认为,这样的技术在实践过程中有哪些痛点?

  • 风险很高:一切都是不确定的,推动一个商业项目的核心引擎开源本身就很不确定;即便开源,在一个核心业务核心系统里启用未经验证过的项目,也是一个非常激进的想法。成,很难说功成名就,但败大概率职业生涯会大受影响。这个案例的前半部分我觉得无法复制, Havenask 的开源存在一定偶然性。我们再实施过程中也是边走边看,不断准备 PLAN B 甚至 C。直到我们落地改造前,没有哪一方是能掌控事情的发展的。

  • 替换难度:即便 Havenask 开源了,也不是说开箱可用,用了就会出现奇效,动一个核心系统底层本身就有难度,再和一个新项目磨合问题就会更多,在实施过程中我们也遇到了因判断错误引发的问题,一度影响士气,甚至到了质疑自己不求有收益只求能平安上线的地步。问题解决都是一步一步磨过来的,没有多么的高大上和云淡风轻,我觉得比较难熬,但这个项目落地以后,证明这条路是可行的,搜广推还有一套新的技术方案可选,当前的不足后续的人一定会有更好的办法解决。


演讲亮点

  • 拍搜检索属于一个垂类检索,与通用网页搜索行为存在较大差异,也很少对外介绍,通过这个案例可以了解一些业务场景上和实践上的区别

  • 这个案例也是 Havenask 开源后首个大规模的系统落地实践,相当于是一个参考案例


听众收益

  • 一定程度了解作业帮 OCR & 检索系统的工作场景

  • 了解此次系统升级的发展过程,我们是如何对比判断以及决策的


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-22 12:113987

评论

发布
暂无评论

极盾·析策XDR,助力顶级汽车集团构建安全运营中台

极盾科技

网络安全 安全 信息安全 数据安全 xdr

百度App 低端机优化-启动性能优化(概述篇)

百度Geek说

性能优化 运维 服务器

人工智能应用落地的两难

felix

人工智能 开放api 算法模型

JS【数组合并】的性能差异对比

掘金安东尼

JavaScript 前端 8月月更

今日头条三天点击破亿!四天精通springcloud微服务架构

退休的汤姆

社招 java架构师 秋招 #java spring、

ONES 团队版50人以下免费,助力中小企业「弯道超车」

万事ONES

使用 yo 命令行向导创建 SAP UI5 应用

汪子熙

前端开发 SAP SAP UI5 ui5 8月月更

Zebec社区利好频传,Galaxy Project上领取专属Zebec OAT

小哈区块

RedisSyncer同步引擎的设计与实现

京东科技开发者

同步代码 key 引擎 redis 底层原理

DR600VX-Atheros-QCA9880-2T2R-MIMO-802.11ac-Mini-PCIe-Wi-Fi-Module-Dual-Band-2.4GHz-5GHz

wallys-wifi6

灏天农业签约旺链科技,推动中药材产业健康发展

旺链科技

区块链 产业区块链 中药材

MobTech ShareSDK Android端快速集成

MobTech袤博科技

android Android Studio SDK 教程

这个让全网眼红的红利行业,还需要人才吗

千锋IT教育

高效的工作从取消汇报开始|敏捷实践

LigaAI

高效工作 Scrum 敏捷开发 研发团队 每日站会

SpringBoot 整合 MyBatis-Plus

SpringBoot 2 Mybatis-Plus 8月月更

HMS Core Discovery第17期直播预告|音随我动,秒变音色造型师

HarmonyOS SDK

藏不住了,数据分类分级利器「极盾·智辨」发布

极盾科技

网络安全 安全 数据 数据分类 数据安全

工程师如何拥抱数字化转型?

星策开源社区

工程师 产业数字化 数字化时代 智能化转型

静态IP是什么意思?和动态IP 有什么区别

郑州埃文科技

静态IP 动态IP IP地址

我想搞信息资讯聚合类产品,如何编写PHP爬虫?

智伍应用

Apache顶级项目Ranger和Alluxio的最佳实践(附教程)

Alluxio

Ranger Alluxio Apache 分布式 大数据 开源 8月月更

中仑网络全站 Dubbo 2 迁移 Dubbo 3 总结

阿里巴巴中间件

阿里云 开源 云原生 dubbo

搜索引擎分布式系统思考实践

得物技术

搜索引擎 分布式系统

DR882-Qualcomm-Atheros-QCA9882-2T2R-MIMO-802.11ac-Mini-PCIe-Wi-Fi-Module-5G-high-powe

wallys-wifi6

图灵访谈 | Vue.js官方团队成员霍春阳:跨专业做程序员,是什么感受?

图灵社区

vue.js 代码人生

Kubernetes 1.25 发布!博云带你玩转新特性

BoCloud博云

容器 云平台 #k8s

阿里云丁宇:以领先的云原生技术,激活应用构建新范式

阿里巴巴中间件

阿里云 Serverless 容器 RocketMQ 云原生

攻击面管理:企业向主动安全转变的开始

SEAL安全

攻击技术 黑客攻击 软件供应链安全

大咖说 | 云采销助力中小企业获客提升300%,交易提效58%

大咖说

数字化升级 云采销

【python】通用的json_diff方法

转转技术团队

测试工具

成本节省40%,作业帮检索系统重构实践分享 | QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章