写点什么

从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon 北京

  • 2025-04-05
    北京
  • 本文字数:1108 字

    阅读完需:约 4 分钟

大小:609.86K时长:03:28
从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


中国联通软件研究院副总架构师吴天昊已确认出席并发表题为《从被动“救火”到主动防御:中国联通 SRE 应急保障实践》的主题分享,围绕安全生产保障体系建设思路,以及端到端全流程的系统全生命周期稳定性保障工具建设视角,介绍中国联通超大规模 IT 系统稳定性保障实践经验。



吴天昊目前在中国联通软件研究院任副总架构师,主要负责中国联通安全生产保障体系建设,中国联通数字化监控平台整体功能技术架构设计、优化及演进。具备多年运维研发经验,致力于完善“平台+应用” 生态体系,打造联通集团自动化生产和智慧化运营的生产运营平台,助力系统稳定性持续提升。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景挑战:超大规模系统的稳定性困局

  • 云原生下系统安全生产面临的挑战

  • 系统应急保障的常见问题痛点

2. 体系能力:应急保障主动防御架构设计

  • 应急保障体系整体解决方案

  • 监控预警与故障诊断

  • 故障调度快速抢通

  • 应急演练主动预防

3. 案例分享:应急保障场景落地实践

  • 故障自愈的经典场景

  • 自动化应急处置案例

4. 总结与展望

  • 应用实施落地效果

  • 未来 AI 大模型赋能


您认为,这样的技术在实践过程中有哪些痛点?

  • 超大规模 IT 系统下的超大数据量处理实时性与告警诊断准确性的平衡博弈

  • 生产运维确定性稳态与 AI 生成式大模型的不确定性的平衡博弈


演讲亮点

  • 技术体系与核心能力结合视角,介绍系统稳定性保障落地思路

  • 结合具体案例,系统性的介绍中国联通超大规模 IT 系统稳定性保障实践


听众收益

  • 深度解读安全生产稳定性保障落地思路,获得可复用的稳定性保障架构设计方法论

  • 获取稳定性保障实战的关键技术细节和踩坑经验,规避共性问题陷阱,了解行业技术演进趋势


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-05 14:006372

评论

发布
暂无评论

【2022深圳ArchSummit 】大数据架构稳定性保障实践

zuozewei

深圳 ArchSummit

助力企业部署国产云原生数据库 XSKY星辰天合与云猿生完成产品互兼容认证

XSKY星辰天合

0经验,我是如何做大数据测试开发的?

京东零售技术

大数据 测试 企业号 4 月 PK 榜

首个!腾讯云ES通过中国信通院检索增强生成(RAG)技术要求专项测试

极客天地

🎉重大更新!开源无代码 / 低代码平台 NocoBase v1.0 正式发布!

NocoBase

开源 低代码 开发工具 无代码 无代码平台

最新版XMind for mac思维导图软件 v24.04.05171中文版

Rose

降本增效,火山引擎ByteHouse助力短剧广告投放效率提升5倍

极客天地

国外服务器选购技巧大揭秘!别再盲目选择,先学会这些

一只扑棱蛾子

国外服务器选购

深圳发布重大开源项目申报指南,助推OpenHarmony生态发展

科技热闻

华为音乐空间音频出行歌单新鲜上线,打造五一沉浸式听音之旅

最新动态

解决@MapKey is required

源字节1号

开源 软件开发 前端开发 后端开发 小程序开发

模块3作业

小畅

架构实战营 - 模块四 - 作业

小畅

华为云云原生FinOps解决方案,释放云原生最大价值

华为云开发者联盟

云原生 华为云 华为云开发者联盟 华为云云原生 企业号2024年4月PK榜

程序员都在用哪些神器提升工作效率

小魏写代码

利用人工智能ChatGPT批量生成测试数据,测试工作再也不愁数据!

测试人

软件测试 测试开发

性能基础之速读【性能之巅:洞悉系统、企业与云计算】

zuozewei

性能 书籍推荐

BOE(京东方)ADS Pro专场技术策源地论坛举办 聚焦行业领先技术共研显示新未来

爱极客侠

NFTScan | 04.22~04.28 NFT 市场热点汇总

NFT Research

NFT NFTScan

低代码技术在构建质量管理系统中的应用与优势

天津汇柏科技有限公司

质量管理 低代码 质量管理系统

一文读懂Partisia Blockchain 的互操作方案:Oracle 服务框架

西柚子

Go-Zero从0到1实现微服务项目开发(二)

王中阳Go

Go 分布式 微服务 Go进阶 gozero

单个大模型的训练成本,两年后或涨至近百亿美元

算AI

人工智能 AI

Guitar Pro 8 Mac 吉他编曲学习软件 8.1.2-32 直装版

Rose

Node.js fs 模块详尽分析与实际应用

Apifox

node.js 程序员 前端 后端 FS

低代码与定制开发相结合:构建质量管理系统的新途径

天津汇柏科技有限公司

创业 低代码 软件开发定制 质量管理系统 质量管理QMS系统

从被动“救火”到主动防御:中国联通 SRE 应急保障实践 | QCon北京_软件工程_QCon全球软件开发大会_InfoQ精选文章