抖音技术能力大揭密!钜惠大礼、深度体验,尽在火山引擎增长沙龙,就等你来! 立即报名>> 了解详情
写点什么

超大规模服务的故障“弹性自愈”

2019 年 8 月 29 日

超大规模服务的故障“弹性自愈”

QCon上海2018大会上,罗蛟讲师做了《超大规模服务的故障“弹性自愈”》主题演讲,主要内容如下。


演讲简介


超大规模在线分布式系统,每时每刻都响应着无数的用户真实请求,在服务大规模异常的时刻,尽可能的响应用户请求,而不是拒绝,尽可能快的自动化止损甚至自愈,尽可能准的根因定位甚至自动化智能化,这些都给我们的工作提出了越来越高的要求和挑战。


为此,我们在系统架构、流式数据处理、动态决策等多个层面进行了系统化的设计。借助这一套系统,我们实现了分钟级到十秒级最终到秒级的感知和决策止损系统,大幅度的的减少了故障时刻的损失量级和故障持续时间。本次分享,也主要集中在以上几个方面我们的一些实战经验。


讲师介绍


罗蛟


百度 共享技术平台部经理


百度六年运维工作经验,目前担任搜索在线服务运维团队经理,负责百度搜索服务的可靠性,接入质量,性能,防攻击,拥抱业务等等方面的工作。在接入领域,有五年的积累和沉淀。主导设计和研发了百度第一代基于实时容量的内网全自动流量调度系统;作为核心成员设计和实现了中国首家复杂网站百度搜索的全站 HTTPS 改造,引领了中国互联网 HTTPS 的热潮。在接入技术领域引入机器学习技术,目前团队设计和开发的百度智能流量识别系统,每天实时的对超千亿的流量进行识别和过滤,为系统提供高质量的保护和服务。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2018/shanghai/schedule


2019 年 8 月 29 日 12:03689

评论

发布
暂无评论
发现更多内容

问题排查 | 客户端突如其来的“白屏”等待

蚂蚁集团移动开发平台 mPaaS

html5 移动开发 mPaaS 离线包

跟随报文,开启一段奇妙之旅

华为云开发者社区

报文 Windows主机 路由器 Linux主机 路由表

力扣(LeetCode)刷题,简单题(第15期)

不脱发的程序猿

LeetCode 编程之路 28天写作 算法面经 3月日更

Flink架构体系

大数据技术指南

大数据 flink 28天写作 3月日更

非常遗憾!靠着这份Redis深度笔记,我面进了阿里

互联网架构师小马

Java 数据库 nosql redis 面试

技术实践丨Prometheus+Grafana搭建HBase监控仪表盘

华为云开发者社区

开源 Grafana Prometheus HBase 开源数据库

Flink SQL 在网易云音乐的产品化实践

Apache Flink

flink

java好还是嵌入式好?做IT开发该如何选择

cdhqyj

Java 编程 发展 开发 嵌入式

开发也要防“沉迷”?IDEA插件教程详解

京东科技开发者

Java 开发 IntelliJ IDEA

对于移动开发,人工智能的到来意味着什么?

故胤道长

人工智能 机器学习 ios开发 Android开发

啃透这份399页Java架构知识点笔记,已从13K涨到25K

Crud的程序员

Java 程序员 架构

彩色图像的二值化,取经之旅第 6 天

梦想橡皮擦

28天写作 3月日更

【LeetCode】位1的个数Java题解

HQ数字卡

算法 LeetCode 3月日更

书单|互联网企业面试案头书之架构师篇

博文视点Broadview

架构

力扣(LeetCode)刷题,简单题(第16期)

不脱发的程序猿

LeetCode 面试刷题 28天写作 算法面经 3月日更

【Doris Weekly】2020.03.08~2021.03.21

ApacheDoris

【Doris Weekly】

终于有阿里高工把SpringBoot+SpringCloud+Docker+MQ整合在一起了

Java架构追梦

Java 架构 微服务 springboot SpringCloud

揭秘盒马鲜生,如何打破收益增长天花板!

博文视点Broadview

vivo 应用商店推荐系统探索与实践

vivo互联网技术

架构 推荐系统 服务器

EGG公链强势来袭!去中心化社交革命先驱EFTalk

币圈那点事

精选2021互联网大厂Java核心面试题库(金三银四面试必备)

比伯

Java 编程 架构 面试 程序人生

字节跳动单点恢复功能及 Regional CheckPoint 优化实践

Apache Flink

flink

【遇见Doris】基于Apache Doris的小米增长分析平台实践

ApacheDoris

一文了解数据库资源管理技术

华为云开发者社区

数据库 存储 GaussDB(DWS) 资源管理

Cobar SQL审计的设计与实现

捉虫大师

Disruptor Skywalking cobar 数据库中间件

数据库周刊62丨央企2021年数据库成交公告,国产占90%;流数据库HStreamDB开源;MySQL主从双写导致数据丢失;Oracle 19c升级最佳实践;PG日常工作分享;MySQL MGR运维指南;SQL语法手册……

墨天轮

MySQL 数据库 sql postgre

墨天轮精选:数据库问答集萃第一期-2021

墨天轮

MySQL 数据库 sql dba

基于感染原理判断图的连通性算法

大奎

图算法 子图 连通性

uni-app跨端开发H5、小程序、IOS、Android(六):uni-app事件绑定

黑马腾云

微信小程序 uni-app 前端框架 iOS Developer 3月日更

ThreadLocal 慌不慌?

叫练

JVM ThreadLocal 引用 软引用

【IstioCon 2021】最佳实践:从Spring Cloud 到 Istio

华为云原生团队

开源 Kubernetes 云原生 istio 服务网格

Study Go: From Zero to Hero

Study Go: From Zero to Hero

超大规模服务的故障“弹性自愈”-InfoQ