写点什么

从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon 北京

  • 2025-04-05
    北京
  • 本文字数:1108 字

    阅读完需:约 4 分钟

大小:609.86K时长:03:28
从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


中国联通软件研究院副总架构师吴天昊已确认出席并发表题为《从被动“救火”到主动防御:中国联通 SRE 应急保障实践》的主题分享,围绕安全生产保障体系建设思路,以及端到端全流程的系统全生命周期稳定性保障工具建设视角,介绍中国联通超大规模 IT 系统稳定性保障实践经验。



吴天昊目前在中国联通软件研究院任副总架构师,主要负责中国联通安全生产保障体系建设,中国联通数字化监控平台整体功能技术架构设计、优化及演进。具备多年运维研发经验,致力于完善“平台+应用” 生态体系,打造联通集团自动化生产和智慧化运营的生产运营平台,助力系统稳定性持续提升。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景挑战:超大规模系统的稳定性困局

  • 云原生下系统安全生产面临的挑战

  • 系统应急保障的常见问题痛点

2. 体系能力:应急保障主动防御架构设计

  • 应急保障体系整体解决方案

  • 监控预警与故障诊断

  • 故障调度快速抢通

  • 应急演练主动预防

3. 案例分享:应急保障场景落地实践

  • 故障自愈的经典场景

  • 自动化应急处置案例

4. 总结与展望

  • 应用实施落地效果

  • 未来 AI 大模型赋能


您认为,这样的技术在实践过程中有哪些痛点?

  • 超大规模 IT 系统下的超大数据量处理实时性与告警诊断准确性的平衡博弈

  • 生产运维确定性稳态与 AI 生成式大模型的不确定性的平衡博弈


演讲亮点

  • 技术体系与核心能力结合视角,介绍系统稳定性保障落地思路

  • 结合具体案例,系统性的介绍中国联通超大规模 IT 系统稳定性保障实践


听众收益

  • 深度解读安全生产稳定性保障落地思路,获得可复用的稳定性保障架构设计方法论

  • 获取稳定性保障实战的关键技术细节和踩坑经验,规避共性问题陷阱,了解行业技术演进趋势


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-05 14:006483

评论

发布
暂无评论

写给产品经理的信(5):谈谈项目管理(青铜-王者)

punkboy

产品 极客时间,项目管理 项目管理 产品经理 项目

地铁上看书的老外引发的思考

小天同学

写作 读书 个人感想 日常思考

做好领路人——写给技术新人的导师建议

南方

管理 新人

重学 Java 设计模式:实战原型模式

小傅哥

Java 设计模式 小傅哥 复杂代码优化 重构

Python deepcopy一个优化

么么哒

Python

如何通过样本数据推断其分布

张利东

Python

机器学习项目是如何开发和部署的?

陆道峰

人工智能 学习

GitHub 上十个好用的软件

彭宏豪95

GitHub 效率 工具

偏头疼告诉我的,我想告诉每一个人

zkback

团队与领导力健康检查 | 体检表

Bob Jiang

团队建设

互联网省份数据大揭秘,看看哪些地方是互联网的戈壁滩?

非著名程序员

程序员 互联网 IT

写代码没几天,遇到一堆报错,我该怎么办

刘早起😶

Python 程序员 程序人生

纯CSS“返回顶部”特效

寇云

CSS css3

券商也“网红”,证券行业IT服务运维发展按下“快进键”

博睿数据

运维 APM 证券 券商 行情

这场大数据+AI Meetup,一次性安排了大数据当下热门话题

Apache Flink

大数据 flink 流计算 实时计算

自定义列表样式

寇云

CSS css3

HTML中实现合并单元格

JDoe

html

python实现·十大排序算法之基数排序(Radix Sort)

南风以南

Python 排序算法 基数排序

“新基建”方兴未艾,Smartbi Mining如何为产业数字化转型赋能?

infoq小陈

一款开源且具有交互视图界面的实时 Web 日志分析工具!

JackTian

开源 GoAccess 实时 Web 日志分析工具 交互式查看器

git | IDEA 中如何压缩提交(压缩commit后再push 图文演示)

YoungZY

开发者工具 IDEA 开发工具

关于软件测试的三点思考

卓然

软件测试 测试 测试的价值 联现技术咖

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十一)JUnit概述

编程道与术

Java 编程 软件测试 TDD 单元测试

Server Queue 提高 QPS

风含叶

Python kafka 后端 队列

只用CSS实现响应式Full-Width img 2种方法

寇云

CSS css3

为什么要学习 Markdown?究竟有什么用?

JackTian

markdown markdown语法 markdown编辑器

自定义构造python白名单__builtins__

么么哒

Python

如何设计数据中台

数据社

大数据 数据中台 数据仓库

前端工程化之创建项目

春生

大前端 全栈工程师

最香远程开发解决方案!手把手教你配置VS Code远程开发工具,工作效率提升N倍

程序员柠檬

Linux 后台开发 vscode 后端

为什么第三方联调应该先行?

大伟

从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon北京_软件工程_QCon全球软件开发大会_InfoQ精选文章