写点什么

从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon 北京

  • 2025-04-05
    北京
  • 本文字数:1108 字

    阅读完需:约 4 分钟

大小:609.86K时长:03:28
从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


中国联通软件研究院副总架构师吴天昊已确认出席并发表题为《从被动“救火”到主动防御:中国联通 SRE 应急保障实践》的主题分享,围绕安全生产保障体系建设思路,以及端到端全流程的系统全生命周期稳定性保障工具建设视角,介绍中国联通超大规模 IT 系统稳定性保障实践经验。



吴天昊目前在中国联通软件研究院任副总架构师,主要负责中国联通安全生产保障体系建设,中国联通数字化监控平台整体功能技术架构设计、优化及演进。具备多年运维研发经验,致力于完善“平台+应用” 生态体系,打造联通集团自动化生产和智慧化运营的生产运营平台,助力系统稳定性持续提升。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景挑战:超大规模系统的稳定性困局

  • 云原生下系统安全生产面临的挑战

  • 系统应急保障的常见问题痛点

2. 体系能力:应急保障主动防御架构设计

  • 应急保障体系整体解决方案

  • 监控预警与故障诊断

  • 故障调度快速抢通

  • 应急演练主动预防

3. 案例分享:应急保障场景落地实践

  • 故障自愈的经典场景

  • 自动化应急处置案例

4. 总结与展望

  • 应用实施落地效果

  • 未来 AI 大模型赋能


您认为,这样的技术在实践过程中有哪些痛点?

  • 超大规模 IT 系统下的超大数据量处理实时性与告警诊断准确性的平衡博弈

  • 生产运维确定性稳态与 AI 生成式大模型的不确定性的平衡博弈


演讲亮点

  • 技术体系与核心能力结合视角,介绍系统稳定性保障落地思路

  • 结合具体案例,系统性的介绍中国联通超大规模 IT 系统稳定性保障实践


听众收益

  • 深度解读安全生产稳定性保障落地思路,获得可复用的稳定性保障架构设计方法论

  • 获取稳定性保障实战的关键技术细节和踩坑经验,规避共性问题陷阱,了解行业技术演进趋势


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-05 14:006427

评论

发布
暂无评论

Java培训如何选择靠谱

小谷哥

小程序技术解决桌面应用敏捷迭代的一种思路

Speedoooo

小程序 移动开发 小程序容器 桌面应用

函数递归习题(easy版)

芒果酱

c++ C语言 7月月更

好书推荐|《产业数字化转型精要:方法与实践》

李洋

职业 数字化转型 数字经济 书籍 CIO的秘密武器

大数据培训机构怎么选?

小谷哥

百问百答第47期:极客有约——中信建投当前的监控体系建设情况

博睿数据

智能运维 博睿数据 中信建投 监控体系 系统监测

编程技巧│超实用 nginx 中常见的配置合集

nginx 运维 经验分享 7月月更

小李:“有没有特别简单的Python解密rsa的案例?”“还真有”

梦想橡皮擦

Python 爬虫 7月月更

软件研发效能度量的成功要素

思码逸研发效能

研发管理 研发效能 软件研发

庖丁解牛,复盘 HiveServer2 连接频繁卡顿问题

移动云大数据

大数据 hive

SDL文字显示

柒号华仔

7月月更

嵌入式操作系统多任务调度原理分析与RUST参考实现

Geek_0185b7

云原生(七) | Docker篇之深入Docker Compose

Lansonli

云原生 7月月更

MySync——企点通用MySQL数据同步解决方案

腾讯企点技术团队

MySQL 数据库 日志 Binlog 同步

性能领域:你知道的越多,不知道的也就越多

博文视点Broadview

DevOps 实践多年,最痛的居然是?

飞算JavaAI开发助手

大数据入门学习指南

Lansonli

大数据 7月月更 大数据基础 大数据基础知识 大数据核心

LP双币质押流动性挖矿dapp系统开发逻辑分析

开发微hkkf5566

百度APP Android包体积优化实践(一)总览

百度Geek说

Java 安卓

火爆各平台的拼团功能,宝子们在多商户系统中玩过吗?

CRMEB

SAP 实施项目中涉及到编程方式操作 Excel 的几种场景介绍

汪子熙

Excel automation SAP abap 7月月更

直播预告 | 多云时代如何建设企业云管理平台?

BoCloud博云

cmp 云管理平台 云管理

巧用RoaringBitMap处理海量数据内存diff问题

得物技术

Java HBase BitMap

云原生、Intel Arch及云原生机密计算 3 大 SIG 在线分享!今天见 | 第 32-34 期

OpenAnolis小助手

开源 云原生 虚拟化 龙蜥大讲堂 SIG双周会

怎么选择好的web前端开发培训课程

小谷哥

web前端开发技术就业前景怎么样

小谷哥

JAVA编程规范之注释规约

源字节1号

后端开发

学习web前端开发有哪些好的方法

小谷哥

浅析 Apache Kafka 分区重分配的实现原理

移动云大数据

kafka 开源

JS class 并不只是简单的语法糖!

掘金安东尼

JavaScript 前端 设计模式 7月月更

从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon北京_软件工程_QCon全球软件开发大会_InfoQ精选文章