写点什么

荷兰银行的 SRE 实践

  • 2018-01-02
  • 本文字数:882 字

    阅读完需:约 3 分钟

来自荷兰国际集团(ING)的 Janna Brummel Robin van Zijll 在伦敦 Velocity 大会上分享了他们是如何通过 SRE 来提升网络银行可用性的。他们组建了一支 SRE 团队,为产品团队(在内部被称为 BizDevOps)提供有关可靠性的工具、咨询和培训。

ING 的 2017 年中指标表明,他们的个人网上银行系统的可用性降到了 96.84%,而其他系统(如个人移动银行)的可用性都在 99.99% 左右。造成这种局面的因素包括:产品团队缺乏监控;集中式的告警系统只在发生重大事件(比如系统崩溃)时才会发出告警,诊断问题需要很长时间(一个主要事故平均需要 69 分钟);缺少事后的事故评审和总结;缺少组件层面的可用性洞见(服务层面的反馈对产品团队来说不够直接)。

集中式的 SRE 团队只提供咨询(他们本身不会参与轮班待命),同时他们作为一个平台团队,也为产品团队提供工具和内部服务,帮助他们提升系统的可靠性。他们根据谷歌SRE 手册中定义的服务可靠性层级来计划和安排产品团队的任务优先级。

目前,SRE 团队主要覆盖金字塔的底下三层。在监控和事故响应方面,他们基于 Prometheus Grafana Mattermost ChatOps )构建了一些工具。他们帮助产品团队进行事故的事后诊断,并提供建议用于识别和修复可靠性问题。Brummel 和 van Zijll 分享了他们是如何花时间和精力扭转之前那种糟糕的局面的。他们建议在增加事故评审频率之前先要多花一些时间搞清楚状况,否则可能会事与愿违。

这些变更是以逐步按需的方式推出的,而不是采取“大爆炸”式的方式进行,让产品团队来决定是否采用他们提供的工具以及是否实践他们的建议。SRE 团队也在从由几个工程师组成的小团队发展成更大的社区(跨国的 SRE 团队,目前有三个 SRE 团队,分别在荷兰、西班牙和澳大利亚)。他们通过演示和内部讨论来发展 SRE 社区。

Brummel 和 van Zijll 关于 SRE 之旅的要点包括:在进行 SRE 招聘时更注重 SRE 思维;为避免出现优先级冲突,SRE 团队需要一个产品负责人;做好花大量时间向产品团队解释和推广 SRE 的准备;工具需要提供商用级别的可用性,而且要切实解决用户的痛点;考虑工具的可扩展性和所有权问题。

查看英文原文 How ING Bank Does SRE

2018-01-02 18:002369
用户头像

发布了 322 篇内容, 共 159.6 次阅读, 收获喜欢 148 次。

关注

评论

发布
暂无评论
发现更多内容

企业海外营销战略白皮书:从市场选择到规模化增长的完整蓝图

Wolink

海外社媒营销 海外营销推广 达人营销

预算有限?中小品牌如何用微型红人矩阵撬动海外巨大流量

Wolink

跨境电商 出海 出海企业 海外营销推广

营销归因分析:如何准确追踪海外多渠道转化路径?

Wolink

跨境电商 出海 品牌宣传 海外营销推广

喜报!华秋电子荣膺第八届“蓝点奖”创新突破奖

华秋电子

Docker+花生壳内网穿透部署PhotoPrism教程,免费实现远程访问

科技经济

主流低代码开发平台有哪些:加速数字化转型的核心力量

科技经济

专业洗车小程序系统:一站式洗车服务数字化解决方案

微擎应用市场

海外营销新规则:TikTok+Instagram海外红人合作避坑指南

Wolink

海外社媒营销 海外营销推广 品牌出海 海外红人营销

RISC-V基金会Data Center SIG月会圆满结束,围绕QoS和TPM展开深入探讨

OpenAnolis小助手

操作系统 risc-v

​触摸算力未来!全球计算联盟(GCC)主办2025全球计算大会(CGC2025)打造沉浸式展区

科技经济

传图取字小程序:高效 OCR 文字识别工具,轻松实现图片转文字

微擎应用市场

华秋电子 × 河南工业大学:产教融合再进阶,共绘电子产业人才与创新双循环新图景

华秋电子

龙蜥社区两大委员会月度会议圆满召开

OpenAnolis小助手

操作系统 龙蜥社区

火热报名中!2025 龙蜥操作系统大会亮点速递

OpenAnolis小助手

AI 操作系统 龙蜥操作系统大会

SD-WAN重塑企业网络架构,推动国际化发展

光联世纪

新麦分销商城小程序系统:一站式分销零售解决方案

微擎应用市场

快递鸟电子面单打印接口技术对接文档

快递鸟

在还为开发成本发愁?七牛云双 11 “后勤保障”请收好!

七牛开发者

Token AI coding

共筑智能时代安全防线!AI 创新与系统安全分论坛议程出炉 | 2025 龙蜥大会

OpenAnolis小助手

AI 操作系统 龙蜥操作系统

六款远程控制软件排名,哪一款最好用?

科技经济

企业海外营销必须规避的5大陷阱与风险

Wolink

出海企业 海外社媒营销 海外营销推广 海外推广 达人营销

2026海外推广新趋势:TikTok营销、AI创意

Wolink

企业出海 内容营销 海外社媒营销 海外营销推广 达人营销

设计师必备:提升CAD审图效率的5个实战技巧​

在路上

cad cad看图 CAD看图王

维语视频微信小程序系统:一站式视频服务解决方案

微擎应用市场

如何通过Python SDK向Collection中插入或更新Doc

DashVector

人工智能 数据库 大数据 AI 大模型

PAI Physical AI Notebook详解1:基于Isaac仿真的操作动作数据扩增与模仿学习

阿里云大数据AI技术

阿里云 PAI Physical AI

2025 国内数据资产管理平台 TOP10 解析:从合规到价值的进化之路

科技经济

业绩逆转之外,Intel 18A与Panther Lake将成为重塑英特尔营收增长逻辑的关键变量

科技经济

律师事务所专属小程序:一站式法律服务数字化解决方案

微擎应用市场

BOE(京东方)亮相2025世界显示产业创新发展大会 AI赋能显示构建视界新生态

爱极客侠

又整理了一场真实Golang面试复盘!全是高频坑+加分话术,面试遇到直接抄

王中阳Go

Go 面试

荷兰银行的SRE实践_DevOps & 平台工程_Manuel Pais_InfoQ精选文章