点击围观!腾讯 TAPD 助力金融行业研发提效、敏捷转型最佳实践! 了解详情
写点什么

从 Catchpoint 的调查结果看网站可靠性工程师的工作

  • 2018-04-24
  • 本文字数:1293 字

    阅读完需:约 4 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

和软件工程师一样,网站可靠性管理工程师需要负责 IT 运营,2003 年 Google 就推出了这一设想,2016 年 Google 推出了《网站可靠性管理,Google 如何运营生产系统》一书,详细介绍了这一方面内容。网站监测服务公司 Catchpoint 最近调查了 416 名网站可靠性管理工程师(SRE),希望借此了解 SRE 的具体工作。

调查的内容包括谁可以担任 SRE(需要的经验水平、背景和技能),他们在哪里工作,他们的工作要做些什么以及他们怎么完成工作(SRE 每天使用的工具和流程,以及他们衡量工作的指标和方法)。39% 的受访者认为自己纯粹是 SRE,剩下的一部分兼任管理、基础运营、开发者和工程师的工作,有 10% 的受访者担任开发运营,另外 1% 做安全方面的工作。超过一半的受访者在技术相关产业的公司工作,而超过 40% 的受访者是服务提供商。超过半数的受访者在至少有 1000 名员工的公司工作,仅有低于 40% 的受访者在拥有 5000 名或以上员工的大企业工作。87% 的受访者来自北美或欧洲。

34% 的受访者说,他们 “从云起步”,32% 的受访者是混合模式的,19% 的受访者迁移到云,而 14% 的人仍然使用自有“数据中心”。65% 的 SRE 将完全或部分基础设施搭建在云上,47% 的受访者每天要部署多次。SRE 的工作需要负责写代码并支持现有系统的运行。公司希望 SRE 可以平均分配时间,写代码和运营的时间五五开,但是现实情况却是钟形曲线,两者时间占比差异显著。

SRE 重点关注应用程序和服务的可用性,84% 的受访者认为可用性是衡量他们服务水平最重要的指标之一。有 64% 的受访者提到了错误率和延迟率。在问题解决环节中,94% 的受访者表示会依赖即时通讯手段,而不是选择研讨室、视频会议、电话和邮件的方式。SRE 认为最重要的三个工具是警报、版本控制和聊天工具。

44% 的公司并不严格遵守错误预算,但是公司越大,发生这种情况的概率越小,所以在拥有 5000 或以上员工公司工作的 44% 受访 SRE 会更加遵守错误预算

92% 的受访者认为 SRE 首要具备自动化技能,然而仅有 18% 的受访者表示他们的团队自动化运行一切。32% 的金融行业 SRE 觉得自己已经把可以自动化的东西都自动化运行了。公司越小,需要自动化的地方就越多,拥有少于 50 名员工的公司需要 22%,而拥有 5000 名或更多员工的公司仅有 12%。

SRE 员工不是新手员工,80% 的 SRE 拥有六年或以上的工作经验,并有较高的学历。但并不完全需要计算机科学或是信息技术的学位,73% 的 SRE 拥有技术方面的学位。在担任 SRE 之前,64% 的受访者担任系统管理员,而 53% 的受访者是开发人员或是软件工程师,17% 的受访者拥有开发运营“混乱之墙”两方面的经验。大多数受访的SRE(55%)在工程部门,仅有31% 的受访者在IT 运营部门。

点击这里查看完整的调查结果。

查看英文原文 What It Means to Be a Site Reliability Engineer According to a Survey from Catchpoint


感谢无明对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2018-04-24 19:00884
用户头像

发布了 218 篇内容, 共 61.6 次阅读, 收获喜欢 73 次。

关注

评论

发布
暂无评论
发现更多内容

重新理解“无容灾不上云”:应用多活将成为云原生容灾新趋势

阿里巴巴云原生

阿里云 开源 云原生

开发运维效率提升 80%,计算成本下降 50%,分众传媒的 Serverless 实践

阿里巴巴云原生

阿里云 Serverless 云原生 合作案例

IntelliJ IDEA 在校验 PHP Debug 配置的时候提示 Xdebug 扩展没有载入

HoneyMoose

尚硅谷MyBatis新版视频教程发布

@零度

Java mybatis

web前端开发nodejs基本原理_前端培训

@零度

node.js 前端开发

亚信科技AntDB数据库参与“国内首款”事务型性能测试工具开源发布会,树立金融技术风向标

亚信AntDB数据库

AntDB 性能基准测试 中国信通院

IntelliJ IDEA 在校验 PHP Debug 配置的时候提示 URL 无法访问

HoneyMoose

灵雀云加入,龙蜥社区迎来国内领先的企业级PaaS服务商

OpenAnolis小助手

Linux 开源 云原生 PaaS

Khronos 会议干货 | WebGPU 1.0 即将发布

Orillusion

开源 WebGL 元宇宙 Metaverse webgpu

大数据开发join的运行原理_大数据培训

@零度

hive 大数据开发

linux服务器是什么?如何快捷安全管理?

行云管家

运维 服务器

fastposter 2.5.0 全新发布 一款电商级海报生成器

物有本末

Java Python 海报 海报生成器

IntelliJ IDEA Ultimate 配置 PHP 拦截器

HoneyMoose

IntelliJ IDEA Ultimate 配置 PHP 拦截器中 Xdebug 扩展应该怎么填

HoneyMoose

如果写作平台不叫写作平台,他应该叫……?

InfoQ写作社区官方

写作平台 创意 话题讨论 热门活动

架构学习【03】——外包学生管理系统的架构文档

tiger

架构实战营

RadonDB MySQL on K8s 2.1.2 发布!

RadonDB

MySQL 数据库 高可用 RadonDB KubeSphere

前后端分离项目,如何解决跨域问题?

沉默王二

Java 前端 后端 跨域

阿里巴巴的Java开发手册(黄山版)来了

翊君

Java 阿里巴巴面经总结

你才二十几岁呀,怎么眼里没有光了呢?

架构精进之路

随笔 日常感悟 2月日更

ShardingSphere 助力当当 WMS:订单效率提升 30%、节约成本上千万

SphereEx

数据库 开源 ShardingSphere wms SphereEx

外包学生管理系统架构设计文档

五月雨

架构实战营 「架构实战营」

数据平台与Flink任务运行原理介绍

云智慧AIOps社区

redis 云计算 大数据 kafka Flink 平台

绿色数据中心“东数西算”全面启动!八大枢纽十大集群 - 涉及高性能计算,数据集群,水冷散热

蓝海大脑GPU

学生管理系统详细架构设计文档

晨亮

「架构实战营」

基于CC2530设计的自动晾衣杆

DS小龙哥

2月月更

一句话告诉您什么是运维?以及如何运维才能事半功倍?

行云管家

运维 IT运维 自动化运维

如何在 Vue 中导出数据至 Excel 表格 - 卡拉云

蒋川

Vue Vue 3 vue admin

uni-app技术分享| uni-app常见问题(一)

anyRTC开发者

uni-app 音视频 WebRTC 移动开发 实时通讯

java面试jvm调优的意义_java培训

@零度

JVM JAVA开发

RocketMQ-Streams 首个版本发布,轻量级计算的新选择

阿里巴巴云原生

从Catchpoint的调查结果看网站可靠性工程师的工作_DevOps_Helen Beal_InfoQ精选文章