【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

问题定义概念 - 别被 BuzzWord 给带偏了

  • 2020-03-16
  • 本文字数:1639 字

    阅读完需:约 5 分钟

问题定义概念-别被BuzzWord给带偏了

先说最近遇到的两个事情:


第一个,最近几个群里都在讨论一个问题,中台是什么?DevOps 是什么?


看到大家很多交流和探讨,整体感觉就是对于这些概念和 BuzzWord,每个人,每个行业,每家公司都会有不同的理解,甚至在不同的阶段,大家也会有自己的理解。


而且这些理解谁是对的,谁是错的呢?其实大家理解的都没有问题,在自己所处的行业、背景和场景下,都是对的。


第二个,前面参加行业会议的时候,跟一家大型企业的 IT 管理团队做交流,他们非常想希望了解 SRE 到底是什么,怎么借鉴。


其实,我当时被问到这个问题时,我真的想说,SRE 其实没有什么神秘和高大上的,SRE 里面要做的事情,其实我们平时都在做,比如自动化、发布、监控、oncall、应急响应、故障复盘等等等。只不过 Google 的 SRE 把这些事情更加体系化系统化了,形成了一套方法论,更加便于我们去学习和理解。


如果仔细去想想,中台里面干的事情,DevOps 里面干的事情,有什么新鲜的东西吗?其实这没有,都是我们平时在干的事情。


但是为了解答大家的疑问,我又深入了解了一下,大家更想了解的是在业界更加强调 DevOps 的情况下,开发可以越来越多的承担起运维的工作,这个时候 Ops 应该如何转型?怎么具备更强的竞争力?


了解到 SRE 是运维行业里的最佳实践,所以就想知道是不是掌握了 SRE 就能够具备竞争力了?


再后来,我继续细问,针对一些具体的场景和问题,给出了一些具体解决方法,算是有针对性的答疑。


不过,我更想表达的内容是,我们不能总想着靠 DevOps、SRE、云计算、AIOps 这样的概念和 BuzzWord 就解决根本问题,我说的是根本,还不是全部,比如提升竞争力,解决转型问题等等。


因为我们一讲上面这些概念,就很容易去搞持续交付的流程体系去了,然后再去搞工具平台框架,对于 SRE 又要开始建稳定性架构体系等等。


我不是说这些东西不好,也不是说不要建,但是建设之前先看看我们当前自己的 IT 基础是什么状态。


比如标准化搞好了吗?别一堆线上应用连部署目录、启停命令、配置命名都不统一。我们说做持续交付,结果这些东西不统一,怎么做自动化发布和部署?


基础服务选型统一了吗?一个消息组件,不同的团队不同选择,我见过有的公司线上就运行着个 3、4 个不同的消息或缓存产品。


还有,搞 AIOps,我就见到过,日志格式不统一,有用没用的信息乱打,AIOps 再牛逼,也没法处理这种太多的垃圾信息,Garbage in,Garbage out,这个是一定的。


再就是,有很多元数据信息,压根都没落到 CMDB 这样的管理系统中管理起来,一个服务器信息,开发有一套、测试有一套、自动化有一套、监控还有一套,信息之间根本做不到流转和同步。


如果是这样的一个基础,不管是自动化,还是持续交付,就是算是 DevOps、SRE 和 AIOps,不管啥先进理念,到最后都落不了地。


为什么?因为基础没做好,再先进的东西嫁接上去也长不出来。就跟种庄稼一样,土壤不行,怎么实现大丰收,盐碱地上施再好再多的肥料,也收获不了粮食。


这个问题,别还不在意,不只是中小公司,很多大型企业都会存在这个问题,搞一堆的培训和咨询顾问服务,采购一堆的工具平台,建了一堆的流程体系,起了一堆高大上的名字,最后就是不见效果,啥原因,就是因为都把最基础的东西给摆到了最后面。


这个问题谁来解决呢?说到底只能靠自己,该统一的统一,该标准的标砖,该强制执行的强制执行,只有自己能干,靠第三方是不行的。其实怎么干,又是个很复杂的话题,这里先不细说了。


我不反对引入任何一个先进的理念,但是,万丈高楼平地起,一定要结合着自己的基础来,结合着自己的现状来,一步步稳扎稳打才会有效果。


当我们讨论这些 BuzzWord 是什么的时候,我觉得多深入研究下我们自己遇到的问题到底是什么,或许更有意义。


Why 比 What 和 How 更重要,千万别被这些 BuzzWord 给带偏了。


问题定义概念,如果,硬要给 SRE、DevOps 或中台一个概念,我觉得最好的解释就是“我们遇到的技术问题是什么,SRE(DevOps、中台)就是什么。”


本文转载自成哥的世界公众号。


原文链接:https://mp.weixin.qq.com/s/VBwwEjX93hDUP0J71sEedw


2020-03-16 20:34555

评论

发布
暂无评论
发现更多内容

Apache Paimon 在同程旅行的实践进展

Apache Flink

大数据 flink 实时计算

技术分享 | 接口测试之HTTP、HTTPS 抓包分析

霍格沃兹测试开发学社

为什么要urlencode?

霍格沃兹测试开发学社

干货 | 初窥 Pytest 测试框架,基础薄弱也能轻松 hold 住

霍格沃兹测试开发学社

学会这些 Docker 命令,面试再也不怕啦~

霍格沃兹测试开发学社

Spring 中 @Qualifier 注解还能这么用?

江南一点雨

Java spring

实力!云起无垠获ISC 2023创新独角兽沙盒大赛“创新能力奖”

云起无垠

技术分享 | app自动化测试(Android)--显式等待机制

霍格沃兹测试开发学社

LangChain系列-02. LLM基础

无人之路

openai ChatGPT langchain

秒杀库存解决方案

Java研究者

架构 高性能 秒杀 电商系统 库存系统

干货 | 在Docker 上搭建持续集成平台 Jenkins

霍格沃兹测试开发学社

接口协议之抓包分析 TCP 协议

霍格沃兹测试开发学社

持续交付-Pipeline入门

霍格沃兹测试开发学社

Kafka入门

霍格沃兹测试开发学社

Log4j疯狂写日志问题排查 | 京东云技术团队

京东科技开发者

Java log4j Log4j 2 企业号 8 月 PK 榜

接口测试框架实战(一) | Requests 与接口请求构造

霍格沃兹测试开发学社

你们的优雅停机真的优雅吗? | 京东云技术团队

京东科技开发者

Java Spring Boot JVM 优雅停机 企业号 8 月 PK 榜

Docker搭建测试用例平台 TestLink

霍格沃兹测试开发学社

JDK 17 营销初体验 —— 亚毫秒停顿 ZGC 落地实践 | 京东云技术团队

京东科技开发者

ZGC jvm调优 jdk17 企业号 8 月 PK 榜

技术分享 | app自动化测试(Android)-- 参数化用例

霍格沃兹测试开发学社

用了Go匿名结构体,搬砖效率更高,产量更足了

高端章鱼哥

Go 接口 map 结构体

浅谈测试需求分析

霍格沃兹测试开发学社

技术分享 | 抓包分析 TCP 协议

霍格沃兹测试开发学社

技术分享 | 使用 cURL 发送请求

霍格沃兹测试开发学社

JaCoCo助您毁灭线上僵尸代码 | 京东物流技术团队

京东科技开发者

Java JACOCO 企业号 8 月 PK 榜 僵尸代码

开放原子开源基金会开源安全委员会七月新增成员单位

开放原子开源基金会

开放原子开源基金会

接口管理工具YApi怎么用?颜值高、易管理、超好用

霍格沃兹测试开发学社

技术分享 | 如何模拟真实使用场景?mock 技术来帮你

霍格沃兹测试开发学社

技术分享 | 测试平台开发-前端开发之Vue.js 框架的使用

霍格沃兹测试开发学社

干货 | 利用 pytest 玩转数据驱动测试框架

霍格沃兹测试开发学社

使用Fastmonkey进行iosMonkey测试初探

霍格沃兹测试开发学社

问题定义概念-别被BuzzWord给带偏了_语言 & 开发_成哥的世界_InfoQ精选文章