写点什么

首次深度揭秘,小米米家稳定性保障与故障应急实践 | QCon 北京

  • 2025-04-05
    北京
  • 本文字数:1111 字

    阅读完需:约 4 分钟

大小:605.33K时长:03:26
首次深度揭秘,小米米家稳定性保障与故障应急实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


小米 手机 IoT 团队 SRE 负责人付冰尧已确认出席并发表题为《稳中求胜:小米米家稳定性保障与故障应急实践》的主题分享,通过米家历史故障案例,介绍近 2-3 年米家是如何通过完善应急保障体系和运维自动化平台,逐步提升业务稳定性,侧重分享业务架构优化、基础组件升级、质量加固经验以及故障预案的制定与实施。



付冰尧在运维领域积累了较丰富经验。曾任职世界 200 强央企,负责 OA、邮箱、SAP 部署实施运维。后担任闪送运维总监,主导公司基础设施软件架构规划与实施。在小米手机部 SRE 团队,推动运维标准化、自动化,实现降本增效,还负责小米相册百 PB 级数据迁移项目。拥有多年 DevOps 开发经验,掌握 Golang、Python 等技术栈,研究方向聚焦云原生与软件工程管理。他在本次会议的详细演讲内容如下:


演讲提纲

1. 小米 IoT 业务及架构介绍

  • 业务概况

  • 架构详解

2. IoT 业务质量保障遇到的问题和挑战

  • 用户和设备双侧稳定性保障难题

  • 用户对故障的低容忍与应对压力

3. SRE 的故障应急体系的建设与落地

  • 预警机制

  • 预案管理

  • 关键服务的故障自愈

  • 应急指挥 &协作机制

  • 复盘改进

4. 应急案例分享


您认为,这样的技术在实践过程中有哪些痛点?

  • 用户和设备双侧稳定性能力保障能力的建设

  • 自动化运维能力有待提升,后续如何通过 AIOps 能力增强业务稳定性


演讲亮点

  • 全球领先平台的独家经验分享,米家作为全球最大的消费级物联网平台,首次深度揭秘其在 IoT 业务质量保障方面的宝贵经验

  • 故障应急体系建设的方法论结合具体案例,系统性的介绍如何全面提升业务质量


听众收益

  • 深入了解 IoT 业务特性与质量保障精髓

  • 掌握系统性提升业务质量的方法论

  • 探索 IoT 业务与运维系统的平衡之道


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-05 10:006175

评论

发布
暂无评论

YashanDB数据库开发指南:从入门到精通

数据库砖家

YashanDB数据库日志配置与故障诊断技巧

数据库砖家

YashanDB数据库容灾备份设计及实施经验分享

数据库砖家

YashanDB数据库容灾备份自动化实施指南

数据库砖家

YashanDB数据库容灾恢复策略及演练流程

数据库砖家

YashanDB数据库迁移工具及实操教程

数据库砖家

YashanDB数据库开发者常用命令及其解读

数据库砖家

YashanDB数据库日志审计功能及合规应用指南

数据库砖家

见证民族重卡力量!黄河H7震撼上市,智启高效物流新纪元

科技热闻

YashanDB数据库日志审计与安全合规实用教程

数据库砖家

YashanDB数据库内存管理优化实战技巧

数据库砖家

YashanDB数据库企业运维自动化最佳实践分享

数据库砖家

YashanDB数据库全生命周期管理最佳实践分享

数据库砖家

YashanDB数据库热备份与冷备份比较分析

数据库砖家

YashanDB数据库日志分析,提升运维预警能力

数据库砖家

YashanDB数据库权限管理实战攻略

数据库砖家

YashanDB数据库日常维护与监控的实用技巧

数据库砖家

NocoBase 本周更新汇总:优化及缺陷修复

NocoBase

开源 低代码 零代码 版本更新

YashanDB数据库容错机制解析,保障企业数据稳定

数据库砖家

YashanDB数据库跨平台兼容性及应用前景分析

数据库砖家

YashanDB数据库如何帮助企业实现数据价值最大化

数据库砖家

YashanDB数据库热点数据缓存技术详解

数据库砖家

YashanDB数据库容量扩展策略及操作指南

数据库砖家

YashanDB数据库权限设计与安全运营实务

数据库砖家

YashanDB数据库日志分析及性能调优方法

数据库砖家

YashanDB数据库日志分析与安全审计方法

数据库砖家

YashanDB数据库可扩展性设计分析与实现

数据库砖家

YashanDB数据库快速入门教程与实用技巧

数据库砖家

YashanDB数据库连接池配置及性能优化指南

数据库砖家

YashanDB数据库连接管理及资源优化指南

数据库砖家

YashanDB数据库企业级应用中安全合规要求解读

数据库砖家

首次深度揭秘,小米米家稳定性保障与故障应急实践 | QCon北京_软件工程_QCon全球软件开发大会_InfoQ精选文章