NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

运维架构是全站技术架构中不可分割的一部分

  • 2020-03-18
  • 本文字数:1640 字

    阅读完需:约 5 分钟

运维架构是全站技术架构中不可分割的一部分

从这篇文章开始,准备从架构设计层面谈谈 Dev 和 Ops 的关系,而不是单纯从组织架构和协作模式上的 Dev 和 Ops 关系。

一、为什么要起这个话题?

可运维性要在架构设计时就要统筹考虑,从一开始就得考虑进去,而不是到了运维这个环节再去考虑,否则就会出现很多的问题。但实际情况,很多技术团队在这一点上做的并不够,而是将全部的精力放到如何进行服务化或微服务的拆分上,放到分布式架构如分布式服务、分布式消息、分布式 DB 和缓存等等这些设计上,更多的是做了一些纵向的架构分解和技术钻研工作,但是架构的横向延伸和拉通考虑的明显不足。这样恰恰是忽略了整个软件生命周期中最长尾的运维环节,也反映出了很多公司对于运维这件事情的重视程度和理解深度不够。

二、出现的问题

从我个人经历的过程以及观察的情况看,通常的几个现象:


1、应用这个概念,在资源申请、域名申请、VIP 申请、服务注册、发布部署、策略下发、监控等等这些环节不统一,各自独立一套;这个就是最典型的架构设计时,只考虑开发一个环节,没有将架构上拆分后的概念延伸贯穿到整个软件生命周期的问题。这个也将导致下面一系列的问题产生;


2、上面做不到,没有统一的标准和概念,各个平台之间就很难集成和打通,所谓的持续集成、持续发布、持续部署、持续交付等等这些环节仍然靠大量的人肉动作去做,还谈不上持续,效率自然上不去;


3、稳定性保障无从下手,大量的服务化应用,错综复杂的调用依赖,海量链路日志,问题排查困难,一个请求下来,到底跑到哪个应用去了都不知道;故障持续时间长,出现流量激增或基础部件故障,无法快速隔离、降级和恢复;


4、效率跟不上,还经常出问题,进而,团队协作效率降低,相互信任下降,就开始经常听到下面的言论:


开发抱怨:“运维做的不到位,申请个机器老半天,发布效率也提不上去,代码都写好了,上线咋这么费劲,严重降低了我们的工作效率,再有,出了问题还得我们上去定位,运维什么都帮不上。


运维抱怨:“开发的架构这么烂,配置五花八门,还得手工维护,我咋知道这些配置干嘛的,配错一个,就出故障,让我怎么自动化发布;日志放哪儿也不知道,一会这里,一会那里,出问题你说我咋定位。


5、好了,出了问题,就开始撕逼扯皮,相互推诿,背了责任的一方又开始甩出背锅言论,感觉没有被公平对待。团队的氛围也开始出现 bad smell。

三、问题出在哪儿了呢?

其实从开发的角度和运维的角度单独来看,双方的表达都没有问题,做的事情也都没有问题。但是双方都是只站在了自己的角度表达问题和情绪,恰恰都忽略了很重要的一点:运维和开发不是相互割裂的两个组织,运维的技术体系和全站整体的技术体系更是不可分割的,越是把它们割裂开看,越是站在各自的角度看问题,上面说的这些情况就越是无解,整个团队也会限于这种没完没了的、毫无意义的纠缠中,从长期看对团队和个人的发展都是很不利的。


所以根本原因,在于将开发和运维在技术和管理两个层面给割裂开了,详细描述如下:


1、运维阶段要面临的问题没想清楚,从一开始架构设计上就没有考虑清后续的运维阶段要面临的问题和事情,比如这么多应用,资源应该如何分配、发布的效率如何保障等等,而都是在考虑开发自身的需求和问题。不考虑运维面临的问题,这样实际就是把运维割裂在整个架构设计之外了。(这个责任在谁呢?)


2、运维团队的职责定位不清晰,**整个技术架构朝着服务化的方向演进后,整个组织架构对于运维团队的定义也是模糊的,也就是运维到底要做什么,要承担什么样的职责,因为一个合理的架构落地,必然要有合理的组织架构去对应支撑才可以。运维定位不清晰,就相当于将运维团队给割裂在研发团队之外了。

四、未完待续

所以打算下篇就讲讲这个问题应该如何破局,在这样一个技术架构体系下,运维的角色应该要做什么样的转变,才能适应和支撑起对应的技术体系。(如果还是传统的硬件维护、网络维护、脚本编写这样的定位和要求,显然是跟不上技术发展的要求和节奏的。)


本文转载自成哥的世界公众号。


原文链接:https://mp.weixin.qq.com/s/qn9iHEGch5Vz-_M1Od3V6g


2020-03-18 20:07956

评论

发布
暂无评论
发现更多内容

KeyShot 2023 Pro for Mac:专业级渲染工具,助力设计师实现创意

iMac小白

2024中国信通院ICT深度观察报告会 | 政企数字化转型论坛在京召开

信通院IOMM数字化转型团队

数字化转型 IOMM ICT深度观察

手把手教你用python做一个年会抽奖系统

不在线第一只蜗牛

Python 人工智能 编程语言 年会

<火焰杯>测试开发职业竞赛开始报名啦!

测吧(北京)科技有限公司

测试

六个探索性数据分析(EDA)工具,太实用了!

这我可不懂

数据分析 EDA

基于 vue.js 开发构建的可视化低代码平台

这我可不懂

Vue 低代码 表单

Macs Fan Control Pro v1.5.16中文版:智能冷却,高效运行

影影绰绰一往直前

年度总结&计划-做标杆服务协创未来

IoTOS

物联网 IoT eSIM安全 Java技术提升

Github标星第一,堪称最强前端面试指南!

程序员改bug

前端 前端面试 前端开发程序员 前端程序员

低代码如何助力企业数字化转型?

高端章鱼哥

软件开发 低代码 数字化

长文预警,凭借前端面试题精选大全 ,成功混圈阿里字节腾讯

程序员改bug

程序员 前端 开发 IT 计算机

运维人员新身份——背锅侠

尚思卓越

运维

告别高昂存储,高效灵活管理数据

观测云

日志分析 数据备份

如何使用 NFTScan NFT API 在 Base 网络上开发 Web3 应用

NFT Research

API NFT\ NFTScan

AlDente Pro for Mac:让您的Mac电池焕发新生

影影绰绰一往直前

JetBrains PyCharm Pro 2023 for Mac:专业Python开发者的首选

影影绰绰一往直前

稳定币分析的 3 个关键指标

Footprint Analytics

区块链 加密货币 稳定币

Paste 剪切板管理软件 Paste mac中文安装教程

mac

苹果mac Windows软件 Paste 剪切板管理软件

现代 CPU 技术发展

快乐非自愿限量之名

技术 软件开发 cpu

英特尔正式启动人工智能创新应用大赛,助力更多开发者抓住 AI PC新机遇

E科讯

KeyShot 2023 Pro for Mac v12.2.2.4激活版:渲染界的黑马,轻松实现高质量渲染

iMac小白

软件测试/测试开发丨<火焰杯>测试开发职业竞赛开始报名啦!

测试人

软件测试 测试开发

当 ChatGPT 有了身体会怎样?《Nature》预测 2024 科技大事丨 RTE 开发者日报 Vol.112

声网

加速开发与部署:Docker容器与低代码开发的完美结合

不在线第一只蜗牛

Docker 低代码 容器化 部署

大厂 300+ 道前端面试题大全附答案(整理版)+前端常见算法面试题~~全面详细

程序员改bug

程序员 面试 前端 前端开发

我对线上质量监控大盘的思考

老张

质量保障 质量度量 #监控

每日一题:LeetCode-718. 最长重复子数组

半亩房顶

Go 面试 算法 LeetCode 动态规划

驱动AI PC应用向大众普及,英特尔人工智能创新应用大赛为开发者与大众用户搭建桥梁

E科讯

2023年度AI技术盘点:突飞猛进的技术进展与未来挑战

EquatorCoco

人工智能 AI技术

喜讯 | 华为云多个开源项目通过信通院可信认证

华为云开源

云原生 开源项目 可信开源 华为云开源

数智金融技术峰会|数新网络受邀分享《金融信创湖仓一体数据平台架构实践》,敬请期待

数新网络官方账号

大数据 金融

运维架构是全站技术架构中不可分割的一部分_软件工程_成哥的世界_InfoQ精选文章