从「AI For What」到「Value From AI」,100+可落地实践案例打通 AI 实战最后一公里!
4 月 16 日-4 月 18 日,QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑,聚焦 Agentic AI、多智能体协作、算力优化、技术债治理、多模态和 AI 原生基础设施等前沿话题,邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家,带来百余项真实落地案例,系统性分享前沿洞察与实战干货,以技术共创探索 AI 落地新路径。
火山引擎应用观测技术负责人钱世俊已确认出席 “Agent 可观测性与评估工程” 专题,并发表题为《给 Agent 做“CT”:大规模 Agent 的可观测与质量保障体系》的主题分享。Agent 在生产环境中的应用,因其“模型 + 数据 + 工具链”的复杂黑盒特性,普遍面临故障排查困难、性能优化缓慢、成本与质量难以平衡的挑战。为解决此问题,火山引擎构建了一套从端到端可观测到工程化闭环的 Agent 质量保障体系。方案通过统一探针 OneAgent 实现从 App/Web/小程序到 AI 网关、Agent、工具乃至 LLM 的全链路 MTL 统一采集,打通了观测数据的孤岛。基于此,他们建立起从观测数据加工与转换、到故障排查与性能优化的工程闭环,实现从埋点到根因的快速定位。同时,观测数据的回流与离线/在线评测、Agent 轨迹评测相结合,驱动了 Agent 的持续改进与成本优化,为 Agent 的可靠、高效、经济运行提供坚实保障。

钱世俊,字节跳动火山引擎云基础应用观测技术负责人,曾就职于蚂蚁、eBay 等企业,长期投入云计算与可观测等领域的架构设计与落地实践,并积极投身各项基础设施开源项目的维护工作,曾多次在 Open Source Summit、KubeCon 等会议进行主题分享。他在本次会议的详细演讲内容如下:
演讲提纲
背景与挑战:当 Agent 遇上生产环境
Agent 的“黑盒”特性:不只是代码,更是模型与数据的结合体
我们面临的核心问题:排障难、优化慢、成本失控、质量不可靠
端到端可观测
全链路 Trace 打通:从用户终端(App/Web/小程序) -> AI 网关 -> Agent -> 工具调用 -> LLM 的全链路追踪
MTL 统一采集:通过统一探针 OneAgent,实现 Log、Trace、Metric 数据的高效采集
观测数据加工、转换和管理:如何灵活的进行加工转换,生成更贴近观测目标的数据,并提供体系化的指标管理能力
故障排查与性能优化:观测数据之上的故障排查与性能优化分析能力
统一与预置:提升可观测性平台的工程效率
全栈可观测门户:在一个界面看尽所有,从业务大盘到单次 Trace 到云产品观测
统一的集成中心:提供标准化的数据接入与治理能力,支持不同来源、不同形态的观测数据统一接入,通过预置的解析与校验规则,确保多源数据的口径一致性与高质量
预置看板:为典型 Agent 场景(如 RAG、代码生成)提供开箱即用的分析视图
预置告警规则注入:新 Agent 服务上线时,自动获得一套基础告警规则(如高延迟、高失败率)
数据回流与评测:Agent 的质量保障体系
数据回流:打通观测体系与评测体系的最后一公里
在离线评测:如何利用观测数据回流的评测集,对 Agent 进行效果比对与回归检测
Agent 轨迹评测:如何验证 Agent 决策链条的合理性
总结与展望
您认为,这样的技术在实践过程中有哪些痛点?
跨端 Trace 关联复杂
采样策略与性能开销的平衡
观测口径不一致
AI 指标的定义与验证难
评测体系的置信度与维护成本
演讲亮点
从“黑盒 Agent”到“可解释系统”的端到端打通
从端侧(App/Web/小程序)一路打到 AI 网关、Agent、工具、LLM,配合 OneAgent 的 MTL 统一采集,让本来高度黑盒的 Agent 链路变得可追踪、可还原、可解释。
观测数据加工 + 故障排查的工程化闭环
不停留在“看到数据”,而是通过观测数据加工和转换,叠加故障排查与性能分析能力,给出一套“从埋点到数据、从数据到根因”的工程实践,而不是泛泛而谈的可观测性概念。
统一门户 + 集成中心 + 预置化能力,支撑多场景复用
通过全栈可观测门户和统一集成中心,将服务端、客户端、云产品、AI 应用观测打在一个界面,并用预置看板、预置告警规则,把典型 Agent 场景沉淀成可复用资产,降低新团队、新 Agent 的接入门槛。
数据回流驱动的评测体系,而不是“拍脑袋调参”
依托观测数据回流构建评测集,在离线评测阶段做版本对比与回归,在在线评测阶段基于真实 Trace 做持续质量监控,再结合 Agent 轨迹评测验证决策链条,把“观测”变成“可量化的优化循环”,真正形成质量保障闭环。
听众收益
一套可落地的 Agent 可观测性架构蓝图
可直接复用的工程实践清单与踩坑经验
观测—数据回流—评测一体化的思路模板
除此之外,本次大会还策划了Agentic Engineering、多模态理解与生成的突破、记忆觉醒:智能体记忆系统的范式重塑与产业落地、具身智能与物理世界交互、Agent Infra 架构设计、AI 重塑数据生产与消费、AI 原生基础设施、AI 驱动的技术债治理、小模型与领域适配模型、大模型算力优化、Agent 可观测性与评估工程、AI for SRE等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京站现场带来前沿技术洞察和一线实践经验。
更多详情可扫码或联系票务经理 18514549229 进行咨询。






