9 月 13 日,2025 Inclusion・外滩大会「开源嘉年华」正在限量报名中! 了解详情
写点什么

阿里云算法专家李也博士确认出席 QCon 上海,分享阿里云智能运维 Agent 评测体系实践

  • 2025-09-10
    北京
  • 本文字数:1538 字

    阅读完需:约 5 分钟

大小:811.84K时长:04:37
阿里云算法专家李也博士确认出席 QCon 上海,分享阿里云智能运维 Agent 评测体系实践

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


阿里云算法专家李也博士已确认出席并发表题为突破泛化瓶颈:阿里云智能运维 Agent 评测体系实践的主题分享。大模型 Agent 在智能运维场景落地时常常遇到“做 demo 容易,泛化难”的问题。借鉴编程智能体中可验证环境的成功经验,阿里云构建了智能运维领域的可验证实验环境和高质量评测集。阿里云可观测团队对云原生应用的运行态进行了详尽的理论建模,构建了覆盖 APM/容器/云服务/操作系统/LLM 应用等领域的实验环境,设计了全面的故障注入机制,并在此基础上制作了大规模高质量的评测集。


本次分享李也博士将介绍这个实验环境并发布评测集,深入探讨如何利用评测集验证并提升基于 Agent 的智能运维算法泛化性。



李也,阿里云云原生可观测算法专家,香港中文大学计算机博士,在智能运维和数据驱动的决策方向有近 10 年科研和落地经验。主导的异常检测和根因定位等 AIOps 算法在阿里云大规模落地。在 ASPLOS、SIGMOD、WWW、VLDB、TKDE、TON 等顶会顶刊发表过多篇 AIOps 算法论文,并在这些国际会议上做报告。目前他专注于大模型 Agent 及其强化学习在智能运维场景的落地。他在本次会议的详细演讲内容如下:


演讲提纲

1. 智能运维泛化之痛

  • 传统的基于规则的智能运维难泛化

  • 受限于基础大模型能力限制,基于 Prompt Engineering 和大模型 Workflow 的智能运维在泛化性上也会遇到瓶颈

  • 用大模型 Agent 做 demo 容易,上生产难

2. 智能运维领域的评测集介绍

  • 评测集的规模:数据量级与场景多样性

  • 评测集的覆盖度:跨领域的全面性

3. 如何构建高质量的评测集

  • 在解决智能运维场景泛化性问题之前,我们需要想清楚要泛化到哪些场景

    对智能运维 Agent 评测问题的理论建模——把问题边界想清楚

  • 实验环境的架构设计和实现

  • 构建评测集过程中踩过的坑与经验教训

4. 基于评测集的智能运维 Agent 能力提升实践

  • 如何用评测集验证智能运维 Agent 的泛化性及其可信度

  • 阿里云智能运维 Agent 在评测集上的表现

  • 如何用实验环境和评测集提升智能运维 Agent 的泛化性


您认为,这样的技术在实践过程中有哪些痛点?

  • 对系统状态的建模和故障注入的覆盖度有一定的假设


演讲亮点

  • 工程实践:阿里云可观测团队构建 AIOps 评测集的技术实践

  • 方法论创新:把问题想清楚——关于如何构建评测集覆盖尽可能多真实问题的深度思考

  • 实战指南:如何用评测集验证并提升智能运维 Agent 的泛化性


听众收益

  • 了解一个可以用于验证并提升智能运维 Agent 泛化性的高质量评测集

  • 掌握如何用高质量评测集提升 Agent 泛化性的方法

  • 获得构建企业级 AIOps 评测体系的实践经验


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,,详情可联系票务经理 18514549229 咨询。


2025-09-10 09:259

评论

发布
暂无评论

火山引擎DataLeap计算治理自动化解决方案实践和思考

字节跳动数据平台

大数据 数据中台 数据治理

怎样阅读 h2 数据库源码 | 京东物流技术团队

京东科技开发者

数据库 源码 h2database 企业号11月PK榜

从混乱到优雅:基于DDD的六边形架构的代码翻新指南 | 京东物流技术团队

京东科技开发者

架构 DDD 分层架构 企业号11月PK榜

Java表达式引擎选型调研分析 | 京东云技术团队

京东科技开发者

Java 后端 企业号11月PK榜 表达式引擎 Java表达式

纯CSS实现魔法渐变边框卡片

南城FE

CSS css3 前端 用户体验

Mac电脑快速切换工具 One Switch激活中文最新版

胖墩儿不胖y

Mac软件 切换工具 Mac软件切换软件

纺织行业如何利用数智人力迈向新型工业化

用友BIP

数智人力

ROLA-IP在HTTP海外IP代理市场的优势

Geek_ccdd7f

OpenHarmony 4.0 Release版本发布,新增4000+ API

新消费日报

解决制造业痛点,数据化方案助力高效生产!

搞大屏的小北

数据分析 数据可视化 制造业

数据可视化新秀 DataEase 可否替代 Tableau?

搞大屏的小北

数据可视化 Tableau 替换 DataEase

国内外四款强大的远控使用体验:ToDesk、向日葵、AnyDesk、Microsoft 远程桌面横向比较

挚爱光小胖

远程控制 ToDesk 居家办公软件

许多朋友问我有没有好用的海外代理IP

Geek_ccdd7f

一台亚马逊EC2对开发者而言意味着什么?

申屠鹏会

构建全面预算体系,加强企业风险管理

智达方通

企业风险管理 风险控制 全面预算管理 全面预算体系

如何构建可视化设计中的视觉层次?

搞大屏的小北

数据可视化 视觉交互 大屏设计 设计规范

SpringBoot 项目优雅实现读写分离 | 京东云技术团队

京东科技开发者

数据库 spring Spring Boot 读写分离 企业号11月PK榜

SpringCloud全链路灰色发布具体实现!

王磊

Java SpringCloud

TDengine 与煤科院五大系统实现兼容性互认,助力煤矿智能化安全体系搭建

TDengine

tdengine 时序数据库

阿里云算法专家李也博士确认出席 QCon 上海,分享阿里云智能运维 Agent 评测体系实践_AI&大模型_QCon全球软件开发大会_InfoQ精选文章