写点什么

数据驱动的智能诊断系统:多智能体系统在生产环境中的技术落地与实践|AICon 北京

  • 2025-11-21
    北京
  • 本文字数:1870 字

    阅读完需:约 6 分钟

大小:1009.80K时长:05:44
数据驱动的智能诊断系统:多智能体系统在生产环境中的技术落地与实践|AICon北京

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


阿里云 Serverless 基础架构负责人 & AgentRun 产研负责人赵庆杰将在「Data+AI / Agent 落地实践」专题发表题为数据驱动的智能诊断系统:多智能体系统在生产环境中的技术落地与实践的主题分享。随着云原生架构与大规模分布式系统的广泛应用,系统复杂性急剧上升,传统基于规则或单点模型的运维诊断手段已难以应对高动态、高维度的生产环境挑战。本演讲将深入剖析阿里云如何构建一套数据驱动的智能诊断系统,通过融合全栈可观测性数据(包括指标、日志、链路与 eBPF 事件)、大语言模型(LLM)推理能力与多智能体协同架构,在真实生产环境中实现端到端的故障感知、根因分析与修复建议生成。


本次演讲将详细介绍系统的核心设计原则:1)角色化智能体分工机制——包括感知 Agent、推理 Agent、验证 Agent 与执行 Agent,各司其职并动态协作;2)数据 - 模型 - 动作闭环——如何将实时运维数据转化为智能体可理解的语义上下文,并驱动自动化决策;3)与现有 SRE 体系的无缝集成——在保障安全合规的前提下,逐步替代人工巡检与告警响应流程。


该系统已在阿里云多个 Serverless 核心产品线(中规模化落地,实测数据显示:平均故障恢复时间(MTTR)降低 40% 以上,无效告警减少 65%,人工干预频次下降 60%。此外,我们还将分享在模型幻觉控制、智能体通信协议设计、冷启动场景优化等方面的工程实践与关键教训。


赵庆杰是现任阿里云云原生 Serverless 基础架构负责人 &AgentRun 产品研发负责人,专注于 Serverless 架构、AI Agent、平台即服务(PaaS)及大规模分布式系统等核心技术方向。其工作聚焦于构建新一代 Serverless AI 技术平台,旨在通过技术创新降低云原生 AI 应用的开发与运维门槛,推动先进平台能力向更广泛开发者群体普惠化落地。


他在加入阿里云之前,曾就职于百度,担任核心 PaaS 平台负责人,主导建设了公司内部规模最大的 PaaS 系统,该平台稳定支撑百度约 80% 的在线业务,在高并发、高可用、弹性伸缩及资源调度等方面积累了深厚实践经验。其在后端分布式系统架构设计、微服务治理及云原生基础设施优化等领域具备扎实的技术功底与丰富的工程落地经验。


目前,他在阿里云致力于探索 Serverless 与人工智能技术的深度融合,特别是在 AI Agent 与无服务器计算协同演进的新范式下,推动 PaaS 平台向智能化、自动化和极致弹性方向持续演进。他在本次会议的详细演讲内容如下:


演讲提纲:

1.引言:运维智能化的新挑战

  • 云原生时代系统复杂性激增,传统 AIOps 方法面临瓶颈

  • 从“单模型辅助”到“多智能体协同”的范式演进必要性

2.整体架构设计:构建数据驱动的多智能体诊断系统

  • 系统核心组成:可观测数据层、智能体协调引擎、动作执行层

  • 智能体角色划分:感知 Agent(数据采集与异常检测)、推理 Agent(根因分析)、验证 Agent(假设检验)、执行 Agent(修复建议/自动化操作)

  • 数据闭环:指标、日志、链路与 eBPF 事件如何统一建模为智能体上下文

3.关键技术实现

  • 多智能体通信与协作机制:基于任务分解与共识协商的动态工作流

  • LLM 与领域知识融合:Prompt 工程、工具调用(Tool Use)与幻觉抑制策略

  • 安全与可靠性保障:权限控制、操作审计、人工熔断机制设计

4.生产环境落地实践

  • 应用场景:Serverless 平台冷启动异常、数据库慢查询风暴、容器集群资源争抢

  • 落地成效:MTTR 降低 40%+,无效告警减少 65%,人工干预下降 60%

  • 工程经验:从 POC 到规模化部署的关键路径、冷启动优化、成本与延迟权衡

  1. 总结与展望

听众收益:

  • 获得企业级智能体系统可靠性建设的方法论框架

  • 掌握多智能体可观测性设计模式与开源工具链集成方案

  • 探讨智能体诊断标准(如 OpenAgentTracing)的演进方向


除此之外,本次大会还策划了LLM 时代的软件研发新范式Context EngineeringData+AI / Agent 落地实践大模型系统工程企业级 Agent 的设计与落地大模型时代下的搜广推系统实践多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-11-21 17:556073

评论

发布
暂无评论

要低代码,但不要低能力,低代码产品能否成为企业的增效神器?

优秀

低代码 低代码平台 低代码平台比较

鸿蒙网络编程系列28-服务端证书锁定防范中间人攻击示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列33-TLS回声服务器示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

2024年西藏等保测评机构名单汇总

行云管家

等保 等保测评 西藏

项目管理这些问题,你是不是忍了很久?

天津汇柏科技有限公司

项目管理 低代码开发 软件定制开发

软件测试学习笔记丨Selenium学习笔记:元素定位与操作

测试人

软件测试

2025北京国际自动驾驶技术展览会

AIOTE智博会

自动驾驶展 自动驾驶展会

单月30k+ Downloads!一款头部Embedding开源模型

合合技术团队

开源 工具 科技

Altair官方文档——HyperMesh模型管理

智造软件

教程 CAE软件 altair Hypermesh

数据驱动未来:淘宝商品详情API在电商实战中的实时监控力量

代码忍者

API 接口 pinduoduo API

最新测评,6款好用的在线代码编辑器推荐

是但求其发

云计算 云原生 高效工具 云 IDE 敏捷开发工具

修复一个kubernetes集群

不在线第一只蜗牛

Kubernetes 容器 云原生

IEPL专线:企业网络的高速保障

Ogcloud

企业组网 企业网络 IEPL 企业网络专线 网络专线

糟糕,当我上班用deepin,被老板看到了我的桌面后......!

nn-30

Linux 操作系统 deepin 桌面应用 桌面

BOE(京东方)携手雷神联合发布全球首款仿生蜂鸟屏 以全新升级ACR技术引领显示产业高端化的升维发展

科技汇

百度智能云千帆 AppBuilder 大模型应用开发解读

Baidu AICLOUD

应用开发 AI原生应用 大模型应用

智能合约开发中的LP分红系统

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 代币开发

荣耀 MagicOS 9.0 发布会及开发者大会,现正直播中

荣耀开发者服务平台

人工智能 AI 开发者大会 荣耀

智联招聘×Milvus:向量召回技术提升招聘匹配效率

Zilliz

人工智能 AI Milvus Zilliz 向量数据库

MariaDB 和 GreatSQL 性能差异背后的真相

GreatSQL

鸿蒙网络编程系列30-断点续传下载文件示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

去中心化衍生品入门:模型、挑战与机遇

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 钱包开发 代币开发

【FAQ】HarmonyOS SDK 闭源开放能力 —IAP Kit(3)

HarmonyOS SDK

HarmonyOS

CNCC | 倒计时3天!CCF-网易雷火联合基金研讨会:议程嘉宾交通参会指南一图掌握

网易伏羲

人工智能 网易伏羲 cncc 具身智能 群体智能

数据为王,实时监控显神威 —— 淘宝商品详情API的电商实战应用

技术冰糖葫芦

API 接口 API 文档 API 测试 pinduoduo API

鸿蒙网络编程系列32-基于拦截器的性能监控示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列29-RCP下载到文件和流示例

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

鸿蒙网络编程系列31-使用RCP调用OpenAI接口实现智能助手

长弓三石

DevEco Studio 开发实例 HarmonyOS NEXT 网络与连接

数据驱动的智能诊断系统:多智能体系统在生产环境中的技术落地与实践|AICon北京_大会快讯_AICon 全球人工智能开发与应用大会_InfoQ精选文章