写点什么

解读 2015 之运维篇:变化、发展、涨姿势

  • 2016-01-22
  • 本文字数:2370 字

    阅读完需:约 8 分钟

编者按

2015 年,整个 IT 技术领域发生了许多深刻而又复杂的变化,InfoQ 策划了“解读 2015”年终技术盘点系列文章,希望能够给读者清晰地梳理出技术领域在这一年的发展变化,回顾过去,继续前行。

本文为“解读 2015 之运维篇”。2015 年虽不是运维发展最快的一年,却是运维变化最大的一年。前一年大家普遍认为云计算是运维的救命稻草,而 2015 年的多次“灾难”让人警醒。越来越多的企业开始对运维更加重视了,大力提倡自动化运维,围绕 “自动化运维”相关的探讨也越来越频繁,在一次又一次的思想碰撞中擦出火花,并实施落地。与此同时,无论是使用开源软件的数量还是采用开源软件的企业都在持续增长。许多公司对自己的一些软件进行了开源,其中包括 Google、Facebook、微软和 IBM 等。企业用户以前所未有的速度拥抱开源,很多优秀人才也投身其中,开源不再可有可无。除此之外,运维基础系统的更新迭代也不容小觑。还有哪些涨姿势?我们一起来盘点。

运维的多事之秋

[2015.5.27] 支付宝因杭州机房网络光纤被挖,导致数小时部分用户业务不可用
[2015.5.28] 携程网瘫痪事件,全网业务中断 12 小时
[2015.6.1]UPYUN 连续遭遇两次大规模流量攻击,影响业务 6 小时
[2015.6.6]QingCloud 因雷暴引起的广东 1 区 IDC 电力故障,业务中断 2 小时
[2015.6.6]LeanCloud 多项服务发生中断,持续 4 小时
[2015.6.15] 知乎机房故障,影响系统使用近 2 小时
[2015.6.21] 阿里云香港节点宕机,业务中断 13 小时
[2015.6.19] 开源中国 Git@OSC 连续遭受 DDoS 攻击
[2015.09.01] 阿里云升级云盾引入 BUG,导致误删用户文件
[2015.09.22] 七牛云存储服务故障,业务中断 83 分钟
……

通过这些不完全统计,可以看出云故障是比较多的,在出现故障后,虽然公司会有财务及形象上的损失,但是心态一定要好,不能手忙脚乱。沉着应对,高效处理,快速恢复才是运维人员的“正确姿势”。2015 年,我们从这些故障中不断地总结,在技术提升的同时,更应该转变的是观念,正视容灾备份的重要性,将风险降到最低。伴随着基础设施的逐步完善,未来这些层面都不再是问题,再者也可以利用工具的优势来解决高用性架构。

运维工具组合的进化

随着云计算和开源的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务,IT 系统架构越来越复杂。快速迭代的产品需求和良好的用户体验,需要运维管理者时刻保障核心业务稳定可用,企业运维中的痛点和难点也急需解决。以下运维工具在这一年更加火爆,为企业业务提供强有力支撑:

  • 命令执行与配置管理

    • Ansible
    • SaltStack
    • Puppet
  • 持续交付与代码

    • Jenkins
    • 国内 Coding.net, GitCafe,Git@OSC 的兴起
    • GitLab 的进步与稳定
  • ELK 生态的成熟

    • 提供日志收集,分析,和实时搜索,与可视化监控
    • 最近发布 2.0 大版本
  • 应用监控

    • APM
  • 国内开源

    • open-falcon

一套好的运维工具,能够将应用、网络、计算、存储、虚拟化等资源的性能及告警信息综合分析(可视化),通过简洁易懂的界面,直观呈现业务健康水平。当出现故障时,能够先从全部业务的宏观视角,确定关联和影响,再通过智能钻取和故障定位技术,缩小故障定位范围是在计算、应用还是网络,从而明确问题职责,帮助运维和研发准人员确定位业务故障位置。国内的运维人员所需要做的就是利用 Django 结合开源工具,开发出适合自己业务系统的平台,通过一定的流程控制,将业务紧密贴合,从而逐步达到自动化运维的目的。

运维基础系统的进化

企业最重要的是业务系统,所有的工作都是围绕正常开展业务而展开的。而 Linux 系统更是技术人员最基本的基石。今年 4 月份 Linux4.0 发布,这是一个新的里程碑,更新“live patching”(实时补丁) 机制,意味着以后为内核打补丁不用重启系统了,增强了系统的高可用性。

随着容器技术的兴起,许多新的专门运行容器的 Linux 发行版本也出现了。光版本就迭代了 9 个,火得不要不要的。这应该是其它开源软件所无法超越的,同时也整合了工具集合:Toolbox,为部署提供便利。不过这也使得原本为 Docker 做出巨大贡献的 CoreOS 与 Docker 分道扬镳,并独立发布了 Rocket(rkt),认为 Docker 已经忘记初心,从而独立出来做一个更纯净的容器。Rocket 没有像 Docker 那些为企业用户提供的“友好功能”,比如云服务加速工具、集群系统等。反过来说,Rocket 想做的,是一个更纯粹的业界标准。

运维脚本语言的进化

提到脚本语言,今年最火的非 Python 莫属,同时也是 Python 社区稳定改善的一年。这一年 Python2 由 2.7.9 进化到 2.7.11,然而 2.7 版本可以说是非常稳定成熟,用 Python 之父 Guido 的话说:“是想不到任何可以加入的新特性,因此不会发布 2.8 版本”。同时大量重要开源库通过 six 兼容包来同时支持 Python2 和 3,这让开发者转型 Python3 变得不再那么遥不可及。Python3 在 9 月份横空出世了 3.5 版本,正式宣告 Python 成为一个从语法上原生支持协程的语言,这一特性也吸引着越来越多的开发者迁移到 3.5,越来越多的开源库迁移到 Python,这个方向的改变是非常明显的。

除了 Python 外,Django 无疑也是一匹黑马,运维本来跟 Web 开发没有太多关联,但 Django 的长足进展,却帮了国内运维一个大忙。在大力提倡运维开发的时代,Django 的出现让运维非常快速方便地开发部署自动化工具,极大地释放了运维的生产力。2015 年,Django 从 1.7 升级到 1.9,支持大量新特性,开发部署越来越简便,而且生态越来越成熟, 2016 年即将朝着 Django2.0 的方向迈进。

总结

这一年,在大规模、复杂架构的催生下,运维技术不断变化、发展、涨姿势。自动化运维被推到一个新的高度,给传统企业带来了福音;给基础运维带来了巨大的挑战与机遇;同时也给越来越多的企业带来了新的抉择;开源技术的飞跃、脚本语言的进化等也给运维行业带来了革命性的影响。展望 2016 年,相信容器技术将持续爆炸式增长,云运维更加简单高效,让我们拭目以待,尽情拥抱他们吧。


感谢黄丹对本文的审校。

2016-01-22 01:295003

评论

发布
暂无评论
发现更多内容

5分钟搞懂Jenkins分布式架构

俞凡

架构 DevOps cicd 最佳实践

2022年中国第三方输入法发展分析

易观分析

报告 输入法 语音输入

数字先锋| 药品信息何处有?尽在标识编码处

天翼云开发者社区

重磅 | 九科信息成功入选中国交通建设集团财务云(RPA)项目

九科Ninetech

小数据治理靠“人工”,大数据治理靠“智能”

用友BIP

PM&PMO汇报工作的5大技巧,学会了让老板眼前一亮!

PMO实践

PMO 年终报告 年终总结 项目经理

Syscoin宣布与Web3孵化器WEconomy建立长期合作伙伴关系

100DAO 加速计划

DAO #Syscoin #区块链 #Web3

移动办公时代,就看华为云桌面

秃头也爱科技

MySQL分库分表,可能真的要退出历史舞台了!

Java永远的神

MySQL 程序员 后端 架构师 分布分表

天翼云斩获2022全球分布式云大会两项大奖

天翼云开发者社区

阿里云对话 Tapdata:以秒级响应速度,为企业提供实时数据服务

tapdata

ETL 实时数据 DaaS 现代数据栈

功能上新|使用 Excel 低门槛进行指标分析!

Kyligence

数据分析 指标管理

软件测试面试真题 | web自动化关闭浏览器,quit()和close()的区别

测试人

软件测试 面试题 自动化测试 测试开发 web测试

直播倒计时1天!“基于AIOps的全面可观测性网络研讨会”与你不见不散

博睿数据

根因分析 直播 智能运维 博睿数据

一图了解人造石墨负极材料上中下游全产业链

PreMaint

新能源 锂电池

架构实战营第 10 期 - 模块三作业:外包学生管理系统详细架构设计文档

kaizen

「架构实战营」

案例 | 九科信息久其报表RPA项目助力某大型央企财务部门提质增效

九科Ninetech

案例 | 九科信息为某大型科研单位设计财务系统科目预警RPA

九科Ninetech

软件测试面试真题 | 需求评审中从几个方面发现问题

测试人

软件测试 面试题 自动化测试 测试开发 需求评审

数字先锋| 活起来、动起来、用起来!“海南模式”让数据要素发挥更大价值

天翼云开发者社区

TSDB在油气田勘探开发领域的应用

CnosDB

IoT 时序数据库 开源社区 CnosDB infra

华为云发布CodeArts Req需求管理工具,让需求管理化繁为简

IT科技苏辞

云渲染时可以关机吗_云渲染电脑可以关闭吗?

Renderbus瑞云渲染农场

云渲染

【从零开始学爬虫】采集全国高校导师数据

前嗅大数据

数据采集 爬虫教程 爬虫入门

华为时习知,让企业培训更简单!

IT科技苏辞

站在2023起跑线,政企数字化如何深入“核心地带”?

脑极体

HTTP其他首部字段

穿过生命散发芬芳

HTTP 12月月更

外包学生管理系统架构文档

白杨

新茶饮 200+ 门店优化库存成本,需要几个数据分析师?

Kyligence

数据分析 指标中台

安全可信| 安全与高效兼得?天翼云EasyCoding敏捷开发平台来了!

天翼云开发者社区

作为一个研发凭什么花大量时间修安全漏洞?

墨菲安全

安全 开发

解读2015之运维篇:变化、发展、涨姿势_DevOps & 平台工程_刘宇_InfoQ精选文章