写点什么

快手大时长应用可观测挑战及应对实践 | QCon 北京

  • 2025-04-03
    北京
  • 本文字数:1632 字

    阅读完需:约 5 分钟

大小:872.59K时长:04:57
快手大时长应用可观测挑战及应对实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


快手客户端架构师王辉已确认出席并发表题为《快手大时长应用可观测挑战及应对实践》的主题分享。在大时长应用的可观测性中,超长且复杂的链路是一个重要的体现。长链路归因是流量领域的常见挑战之一,小到订单路径大到流量拆分,从算法的内容策略归因到资源成本分摊,都高度依赖于长链路埋点基建。长链路归因强依赖埋点透传机制,那么在客户端如何界定透传的业务架构与平台架构的边界?新的埋点标准如何在保持统一性的同时提高效率?面对众多存量场景导致的高替换成本,以及增量业务迭代的不收敛,如何实现存量与增量的全面覆盖?这些问题都是解决长链路归因埋点问题时需要权衡的典型问题。在本次分享中,王辉将基于在快手牵头长链路埋点标准建设、数据治理及架构建设的经验,与大家深入探讨这些问题。


2021 年至今,王辉在快手负责快手系埋点架构及研发数据基建。在埋点体系建设、长链路归因、变更归因方面有较深入的探索。2015 年至 2020 年,在去哪儿网负责门票玩乐技术团队期间,带领团队在移动端动态化、统一埋点、One Data 体系、推荐体系、智能营销系统方面有一定突破。他在本次会议的详细演讲内容如下:


演讲提纲

1. 超长路径带来的关键问题

  • 大时长意味着超长路径

  • 关键问题 1:长路径归因问题(面向分析师)

  • 关键问题 2:算法内容归因问题(面向算法)

  • 关键问题 3:故障定位问题(面向研发)

2. 可观测体系构建

  • 横向组织阵型建设:用委员会机制凝聚共识,科学推进

  • 规范化建设及治理:有效的问题分类、分级,保障基建高效彻底落地

  • 平台化建设:通过自动化、自助化实现极值的埋点、应用效率

3. 长路径归因解法实践

  • URT 染色:用自动化透传机制解决长路径订单归因问题

  • STID 策略 ID:用多通道透传机制,解决内容分发、算法归因问题

  • 相关性变更归因:在 80% 故障场景下,用相关性归因替代 Trace 归因

4. 总结与展望

  • 推进效果及反思

  • 未来展望,更全面的落地,更高的效率


您认为,这样的技术在实践过程中有哪些痛点?

  • 破旧立新 vs. 在问题中演进。由于数据消费的复杂性,我们采用的是快速演进的方式,演进中逐步替代老基建。

  • 新标准如何在可控成本下进行增量覆盖及存量替代。我们采取的是基于现有架构对不同业务形态提出不同的收敛架构,从而实现存量平滑覆盖及增量需求卡口。

  • 高精度 vs. 成本可控。动辄万亿条级别的数据,我们选择的是基于应用场景等级进行不同级别采样的方案。


演讲亮点

  • 统一的长链路埋点架构,让业务团队不再关注透传需求,透传机制及质量保障由 SDK 负责,从而实现效率和质量的双重保障。

  • 新型归因平台,覆盖线上 80%的故障,提供了分钟级归因定位能力,为移动端故障止损提供了基础支撑。


听众收益

通过收听本次演讲,您将至少在以下方面了解到我们最新的探索进展及收获:

  • 在埋点领域,搭建自动化长链路机制,并且兼顾分析师、算法、研发多种决策的归因诉求等方面的建设经验。

  • 在排障领域,移动端如何用变更归因架构替代 Trace 机制,从而获得更好的精度及时效性的建设经验。


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-03 12:008630

评论

发布
暂无评论
发现更多内容

如何使用Postman调试HMS Core推送接口?

HarmonyOS SDK

移动推送

FreeRTOS记录(二、FreeRTOS任务API认识和源码简析)

矜辰所致

源码分析 FreeRTOS 9月月更 任务API

易周金融分析 | 多家银行试水特色网点揽客;自动驾驶颠覆传统车险模式

易观分析

自动驾驶 金融 银行 网点

软件测试 | 测试开发 | 想测试入门就必须要懂的软件开发流程

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 如何模拟真实使用场景?mock 技术来帮你

测吧(北京)科技有限公司

测试

i++需要多少QPS才能测出BUG

FunTester

C语言_2 变量

泾箐

c 9月月更

小六六学Netty系列之Netty群聊

自然

Netty 网络 9月月更

行业案例|长安汽车质量管理数据分析实践

Kyligence

质量管理 数据管理 长安汽车

源于加速,不止加速-阿里云加速引擎的10年演化之路

阿里云CloudImagine

CDN CDN加速 CDN技术

中文稀疏GPT大模型落地——通往低成本&高性能多任务通用自然语言理解的关键里程碑

阿里云大数据AI技术

自然语言处理 多任务 企业号九月金秋榜 GPT

SAP UI5 ManagedObject 的 Association 讲解

汪子熙

JavaScript typescript SAP UI5 ui5 9月月更

小六六学Netty系列之Java 零拷贝

自然

Netty 网络 9月月更

数据治理的内核:数据标准

小鲸数据

数据治理 大数据平台 数据管理平台 数据标准 大数据仓库

长沙!《学习的学问》长沙分享会

博文视点Broadview

OpenHarmony中的HDF单链表及其迭代器

OpenHarmony开发者

Open Harmony

软件测试 | 测试开发 | 数据持久化技术(Java)

测吧(北京)科技有限公司

测试

主流定时任务解决方案全横评

阿里巴巴云原生

阿里云 Serverless 云原生

小六六学Netty系列之Java NIO(二)

自然

Netty 网络 9月月更

找准风口,如何从运维转向 DevOps?

飞算JavaAI开发助手

云游戏产业链深度解析

Finovy Cloud

云计算 5G 云渲染 云游戏

阿里云弹性计算技术专家樊毅伟:云上成本优化实践

阿里云弹性计算

自动化运维 资源利用

Netty高并发处理架构设计介绍

孙大卫

架构 Netty 开发框架 9月月更

「趣学前端」骨架屏,分享一波前端UI组件开发的经验

叶一一

JavaScript 前端 组件 9月月更

C语言_3 选择结构

泾箐

c 9月月更

TOP 5!望繁信科技获评WAIC2022全球创新项目路演优胜项目

望繁信科技

WAIC2022

「工作小记」多个批量操作的链式实现

叶一一

前端 设计思维 React Hooks 9月月更

软件测试 | 测试开发 | Jenkins 踩坑(三)| Email 配置与任务邮件发送

测吧(北京)科技有限公司

测试

微信Windows端IM消息数据库的优化实践:查询慢、体积大、文件损坏等

JackJiang

sqlite 微信 网络编程 即时通讯 IM

蒙特卡洛方法与蒙特卡洛搜索树(一)

Joshua

机器学习 算法 蒙特卡洛

软件测试 | 测试开发 | 一文带你了解K8S 容器编排(上)

测吧(北京)科技有限公司

测试

快手大时长应用可观测挑战及应对实践 | QCon北京_大数据_QCon全球软件开发大会_InfoQ精选文章