生成式AI领域的最新成果都在这里!抢 QCon 展区门票 了解详情
写点什么

百度 AIOps 黄金指标异常检测技术实践

  • 2019-08-29
  • 本文字数:653 字

    阅读完需:约 2 分钟

百度 AIOps 黄金指标异常检测技术实践

请求量、响应时间、错误数和容量是运维领域的四大黄金指标,针对黄金指标的异常检测技术是故障发现和故障诊断的基础。但一直以来,黄金指标异常检测技术都是一个复杂的问题。一方面,需要算法针对不同指标训练不同的模型,并且要能满足 Oncall 工程师对高准确召回率的要求,另一方面,历史数据集中的故障数据比例不高,数据标注成本较大,这就要求算法自己有能力识别并排除噪声数据,第三,故障发现、诊断、自愈等场景对于准确率和召回率的倾向不同,算法需要具备按场景调节的能力。 本次演讲,我们将介绍百度 AIOps 黄金指标异常检测技术。我们的算法已经覆盖了百度所有业务线的故障发现,并且也在故障诊断和自愈场景有了很多的实践。 百度资深软件研发工程师王博即将在 QCon 全球软件开发大会(上海站)2019分享《百度 AIOps 黄金指标异常检测技术实践

内容大纲

  1. 黄金指标监控背景

  2. 黄金指标监控体系


2.1 基于高斯核密度估计的延迟监控方法


2.2 基于 Beta 分布核密度估计的容量监控方法


2.3 基于二项分布的错误数监控方法


2.4 基于泊松分布的流量监控方法


  1. 应用效果

  2. 总结及展望

听众受益

  1. 运维黄金指标的传统监控方法及其缺陷;

  2. 基于概率统计的运维黄金指标监控方法。


嘉宾介绍


王博,2014 年 6 月于北京理工大学取得计算机硕士学位,加入百度后一直从事 AIOps 算法与架构方面的工作,致力于黄金指标异常检测体系、AIOps 前沿算法研究与落地、新一代报警系统等相关工作。本次演讲希望能给大家分享百度在黄金指标异常检测策略研究过程中的经验,与大家共同探讨提高。


更多智能运维的相关分享请访问 QCon 上海 2019 官网。


2019-08-29 12:169131

评论

发布
暂无评论
发现更多内容

AOP 注解详解

武师叔

7月月更

百问百答第46期:极客有约——可观测四类问题的核心思想解析

博睿数据

APM 智能运维 博睿数据 可观测 性能监测

DNS稳定性建设实战-从主机到k8s

boaker

k8s DNS 成本优化 DNS故障 稳定性保障

大数据基础知识介绍

Lansonli

大数据 7月月更 大数据基础

JS 逆向 SMZDM 的登录加密,你学过全文扣JS代码解密吗?

梦想橡皮擦

Python 爬虫 7月月更

将 Terraform 生态粘合到 Kubernetes 世界

阿里巴巴云原生

阿里云 容器 云原生 KubeVela terrafrom

数据治理实施前必须准备的21条锦囊妙计

雨果

数据治理

得物App数据模拟平台的探索和实践

得物技术

大前端 方案设计 Mooncake 数据模拟平台

ShardingSphere 云上实践:开箱即用的 ShardingSphere-Proxy 集群

SphereEx

数据库 云原生 ShardingSphere

新思科技聚焦开源治理 助力提升中国开源产业安全及合规水平

InfoQ_434670063458

开源 软件 供应链 新思科技

阿里云机器学习平台PAI论文高效大模型训练框架Whale入选USENIX ATC'22

阿里云大数据AI技术

深度学习 分布式训练 异构计算

web前端培训4个常见的算法问题分享

@零度

算法 前端开发

Node.js异步编程之Promise

是乃德也是Ned

node.js 前端 7月月更

新思科技助力提升开源治理水平

InfoQ_434670063458

开源 新思科技 软件供应链

离线批处理的咽喉——Flume基础配置简析

怀瑾握瑜的嘉与嘉

flume 7月月更

官宣|九章云极DataCanvas核心产品通过 “可信大数据”权威评测

九章云极DataCanvas

人工智能 大数据 数据处理 中国信通院 实时决策

想低成本保障软件安全?5大安全任务值得考虑

SEAL安全

安全左移

java培训如何防止 jar 被反编译

@零度

JAVA开发 jar被反译

『51单片机』十分钟学会定时器

謓泽

7月月更

查找——概念了解

乔乔

7月月更

软件架构-概述

架构

数据架构师、数据分析师、数据工程师哪个工资更高?

雨果

数据分析师 数据工程师 数据架构师

干货分享 | 数据仓库如何应对资源不足?9招解除故障

雨果

数据仓库

JAVA编程规范之命名风格

源字节1号

软件开发

《看完就懂系列》聊聊CSS3的 calc() 函数

南极一块修炼千年的大冰块

7月月更

一文搞懂│工厂模式、单例模式、策略模式、适配器模式、观察者模式的原理和使用

设计模式 策略模式 观察者模式 适配器模式 7月月更

一文读懂:本地数据湖丨数据仓库丨云数据湖的利与弊

雨果

数据仓库 数据湖

互联网裁员潮来袭,这5类职场人最容易被淘汰

雨果

互联网裁员

国产EDA验证调试工具实现破局 助力芯片设计效率提升

科技热闻

TiFlash 面向编译器的自动向量化加速

PingCAP

TiDB

6月月更开奖!速来领取你的奖品!

InfoQ写作社区官方

热门活动 6月月更

百度 AIOps 黄金指标异常检测技术实践_QCon_王博_InfoQ精选文章