写点什么

百度变更发布检查从人工到智能进阶

  • 2019-09-21
  • 本文字数:762 字

    阅读完需:约 3 分钟

百度变更发布检查从人工到智能进阶

CNUTCon上海2018大会上,陈云讲师做了《百度变更发布检查从人工到智能进阶》主题演讲,主要内容如下。


演讲简介


互联网产品迭代速度非常之快,百度每年有数以万计的程序变更。但变化伴随着风险,据统计 54%的服务故障来源于发布。为了减少变更发布故障带来的损失,更好的管理海量规模的发布变更过程,百度智能变更(BID)产品应运而生。BID 提供了包含自动化部署、分级发布和变更检查的完整解决方案。


本次演讲将重点讲述如何对变更进行检查。随着模块监控逐渐完善,很多模块都有数以十万计监控数据,依靠人工配置检查指标列表是不可完成的任务。为了应对海量指标检查的需求,我们利用 AIOps 相关技术,设计出了一套可根据历史变更及对照组情况自动判断指标状态的智能检测算法。该算法不需要人工配置参数,通过自动训练参数并准确地判断异常,并且具备较好的普适性。最后,我们将展示智能发布检查在百度的具体实践效果。


主要内容:


  1. 故障来源及分布;

  2. 分级发布机制;

  3. 智能发布检查算法(异常定义、算法流程、基于 T 检验的指标变化度量、基于历史变更的异常变化检测、基于对照组的异常变化检测);

  4. 百度变更发布智能检查实践。


听众收益:


  1. 学习尽可能限制变更过程中异常影响范围的机制;

  2. 理解变更检查在变更过程中的重要地位和作用;

  3. 学习如果利用 AIOps 相关技术对变更过程中指标状态进行智能判断的方法。


讲师介绍


陈云


百度 智能云事业部资深研发工程师


陈云,毕业于中国科学院,2015 年加入百度,目前在百度云从事智能运维 AIOps 相关领域的工作,前后参与负责了时序指标的异常检测,发布智能检查,报警收敛等工作,期间共发表 5 篇专利。设计研发的智能参数配置平台为百度百万监控指标自动配置算法、参数;发布智能检查平台成功拦截数百次异常变更,减少业务损失。












完整演讲 PPT 下载链接


https://cnutcon.infoq.cn/2018/shanghai/#schedule


2019-09-21 15:182619

评论 1 条评论

发布
用户头像
标题这么大,内容这么草率。。。
2021-02-25 10:36
回复
没有更多了
发现更多内容

天猫商品评论API指南

tbapi

天猫商品评论接口 天猫API 天猫评论数据采集 天猫评论API

安全加密的即时通讯,企业IM内部聊天软件即时通讯工具推荐

BeeWorks

即时通讯 IM 私有化部署

什么是企业级IM,IM工具选型怎么选?

BeeWorks

即时通讯 IM 私有化部署

基于 Amazon Q Developer CLI 进行智能混沌工程实验

亚马逊云科技 (Amazon Web Services)

室外全彩LED广告牌一体化解决方案

Dylan

广告 LED LED display LED显示屏 LED屏幕

【IoTDB 线上小课 18】Apache 软件基金会是什么?开源世界的“超级孵化器”!

Apache IoTDB

使用DPO在SageMaker中定制Nova模型

qife122

人工智能 DPO优化

FocalPO:通过聚焦正确偏好排序增强偏好优化技术

qife122

机器学习 偏好优化

今日立秋 | 夏尽秋来,万物从容

中烟创新

评估LLM标注可靠性:人口偏见与模型解释

qife122

自然语言处理 可解释AI

哈尔滨等保价格指南:影响成本的4大因素与省钱策略

等保测评

用 Go 写桌面应用?试试 Wails 吧!

左诗右码

慢SQL优化实战:从一例线上慢SQL探究执行引擎工作过程

vivo互联网技术

数据库 索引 MySQL调优

DataKit 采集器敏感信息加密最佳实践

观测云

可观测性

在Python代码中安全隔离依赖项的沙箱技术

qife122

Python安全 依赖隔离

Sunrun漏洞披露计划(VDP)正式上线 - 携手共建更安全的未来

qife122

漏洞赏金 漏洞披露

CST软件新功能介绍:EMI接收机仿真

思茂信息

仿真 EMI滤波电路 电磁仿真 CST Studio Suite

知识蒸馏提升多任务学习收敛效果

qife122

机器学习 多任务学习

《AI-Assisted Programming》读后感

codists

Python

哈尔滨等保流程优化:如何缩短测评周期至30天?

等保测评

HR Path战略性收购PredictiveHR

财见

GitHub 上 Star 数量前 20 的开源 AI 项目

NocoBase

GitHub 开源 AI openai MCP

大模型训练故障恢复效率提升方案

qife122

机器学习 容错机制

大数据-62 Kafka Topic 管理与运维实战:命令详解 + 副本分配策略 + JavaAPI

武子康

Java 大数据 kafka 架构 分布式

解锁硬件潜能:Java向量化计算,性能飙升W倍!

poemyang

Java虚拟机 simd JIT编译器 #java 向量化

ONES 参编|《央国企数智化转型发展报告(2025)》重磅发布

万事ONES

中国信通院 行业报告 央国企数智化转型 ONES研发管理

强化大型语言模型复杂指令推理能力的新方法

qife122

大型语言模型 指令跟随

语音技术跨学科研究新趋势

qife122

语音识别 自然语言理解

基于偏置图采样的关联产品推荐优化

qife122

图神经网络 数据采样

小样本学习在语言理解任务中的突破

qife122

自然语言处理 小样本学习

Golang笔记之Redis

Hunter熊

golang redis 哈希 有序集合

百度变更发布检查从人工到智能进阶_CNUTCon_Geek_cc9ec7_InfoQ精选文章