2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

阿里云算法专家李也博士确认出席 QCon 上海,分享阿里云智能运维 Agent 评测体系实践

  • 2025-09-10
    北京
  • 本文字数:1538 字

    阅读完需:约 5 分钟

大小:811.84K时长:04:37
阿里云算法专家李也博士确认出席 QCon 上海,分享阿里云智能运维 Agent 评测体系实践

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


阿里云算法专家李也博士已确认出席并发表题为突破泛化瓶颈:阿里云智能运维 Agent 评测体系实践的主题分享。大模型 Agent 在智能运维场景落地时常常遇到“做 demo 容易,泛化难”的问题。借鉴编程智能体中可验证环境的成功经验,阿里云构建了智能运维领域的可验证实验环境和高质量评测集。阿里云可观测团队对云原生应用的运行态进行了详尽的理论建模,构建了覆盖 APM/容器/云服务/操作系统/LLM 应用等领域的实验环境,设计了全面的故障注入机制,并在此基础上制作了大规模高质量的评测集。


本次分享李也博士将介绍这个实验环境并发布评测集,深入探讨如何利用评测集验证并提升基于 Agent 的智能运维算法泛化性。



李也,阿里云云原生可观测算法专家,香港中文大学计算机博士,在智能运维和数据驱动的决策方向有近 10 年科研和落地经验。主导的异常检测和根因定位等 AIOps 算法在阿里云大规模落地。在 ASPLOS、SIGMOD、WWW、VLDB、TKDE、TON 等顶会顶刊发表过多篇 AIOps 算法论文,并在这些国际会议上做报告。目前他专注于大模型 Agent 及其强化学习在智能运维场景的落地。他在本次会议的详细演讲内容如下:


演讲提纲

1. 智能运维泛化之痛

  • 传统的基于规则的智能运维难泛化

  • 受限于基础大模型能力限制,基于 Prompt Engineering 和大模型 Workflow 的智能运维在泛化性上也会遇到瓶颈

  • 用大模型 Agent 做 demo 容易,上生产难

2. 智能运维领域的评测集介绍

  • 评测集的规模:数据量级与场景多样性

  • 评测集的覆盖度:跨领域的全面性

3. 如何构建高质量的评测集

  • 在解决智能运维场景泛化性问题之前,我们需要想清楚要泛化到哪些场景

    对智能运维 Agent 评测问题的理论建模——把问题边界想清楚

  • 实验环境的架构设计和实现

  • 构建评测集过程中踩过的坑与经验教训

4. 基于评测集的智能运维 Agent 能力提升实践

  • 如何用评测集验证智能运维 Agent 的泛化性及其可信度

  • 阿里云智能运维 Agent 在评测集上的表现

  • 如何用实验环境和评测集提升智能运维 Agent 的泛化性


您认为,这样的技术在实践过程中有哪些痛点?

  • 对系统状态的建模和故障注入的覆盖度有一定的假设


演讲亮点

  • 工程实践:阿里云可观测团队构建 AIOps 评测集的技术实践

  • 方法论创新:把问题想清楚——关于如何构建评测集覆盖尽可能多真实问题的深度思考

  • 实战指南:如何用评测集验证并提升智能运维 Agent 的泛化性


听众收益

  • 了解一个可以用于验证并提升智能运维 Agent 泛化性的高质量评测集

  • 掌握如何用高质量评测集提升 Agent 泛化性的方法

  • 获得构建企业级 AIOps 评测体系的实践经验


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,,详情可联系票务经理 18514549229 咨询。


2025-09-10 09:252927

评论

发布
暂无评论

实现一个javaagent需要几步?

BUG侦探

Java javaagent IAST

带你熟悉鸿蒙轻内核Kconfig使用指南

华为云开发者联盟

Python 鸿蒙 LiteOS-M Kconfig kconfiglib

前端开发SpringBoot之接口文档的生成

@零度

前端开发 springboot

在线JSON转Mongoose工具

入门小站

工具

Orillusion | 第一个WebGPU中文社区

Orillusion

WebGL 渲染 元宇宙 Metaverse webgpu

物联网之智慧农业应用分析&大数据之数据挖掘技术的应用

亚马逊云科技 (Amazon Web Services)

人工智能 云计算 大数据 物联网

Linux中如何设置SSH密钥提升登陆安全性

恒生LIGHT云社区

Linux SSH

Linux之find命令

入门小站

Linux

☕【权限设计系列】「认证授权专题」史上最全的权限认证服务的权限模型大全

码界西柚

架构设计 12月日更 权限设计 功能设计

深入Java线程池:从设计思想到源码解读

Ayue、

线程池

风云再起之国产数据库风云榜-2021年12月

墨天轮

数据库 opengauss TiDB 国产数据库

【架构师训练营】模块三作业

樰巳-堕~Horry

架构实战营 「架构实战营」

58 K8S之集群日志系统

穿过生命散发芬芳

k8s 28天写作 12月日更

25年,初心未改。

澳鹏Appen

人工智能 机器学习 训练数据 数据训练

多因子认证是什么意思?与双因子认证有什么区别?

行云管家

身份认证 双因子认证 账户安全

恒源云(GPUSHARE)_有关【图像平滑】的论文小记

恒源云

深度学习 CV 图像处理

Token机制相对于Cookie机制的优势

郑州埃文科技

数据库 IP Token API

白帽近距离|TimeLine Sec安全团队威猛先生

火线安全

大数据埋点如何实现、验证和管理

融云 RongCloud

百度APP视频播放中的解码优化

百度开发者中心

视频 解码技术

应用落地 智创未来 | 2021新一代人工智能院士高峰论坛昇腾人工智能应用专场成功举办

OpenI启智社区

人工智能 昇腾

2022年之前,你不得不了解的一些 DevOps 趋势

飞算JavaAI开发助手

融云荣获“2021 数字化服务创新成长企业”奖

融云 RongCloud

有没有好用的低代码平台,支持本地私有化部署的?

优秀

低代码 私有化部署

泉州有几家正规等保测评公司?在哪里?叫什么名字?

行云管家

网络安全 等保 等级保护 等保测评

艾瑞发布《2021 年全球互联网通信云行业研究报告》,融云持续领跑市场

融云 RongCloud

模型黑盒|机器学习模型的“可解释性”研究

索信达控股

神经网络 机器学习 神经网络模型

遥遥无期

Tiger

28天写作

基于DataX的数据同步(上)-DataX介绍以及安装

恒生LIGHT云社区

MySQL 数据库 数据同步 DataX

直播连麦的人工智能回声消除技术探索

融云 RongCloud

从了解洞态 IAST 到加入开源社区

火线安全

DevSecOps IAST

阿里云算法专家李也博士确认出席 QCon 上海,分享阿里云智能运维 Agent 评测体系实践_AI&大模型_QCon全球软件开发大会_InfoQ精选文章