10 月 23 - 25 日,QCon 上海站即将召开,现在大会已开始正式报名,可以享受 8 折优惠 了解详情
写点什么

传统运维团队转型应该注意哪些问题?

  • 2018-11-12
  • 本文字数:2161 字

    阅读完需:约 7 分钟

传统运维团队转型应该注意哪些问题?

2018 年已经接近尾声,回顾这一年,国内企业都在进行数字化转型,大家越来越关注如何提升效率。在这一过程中,颠覆性的 IT 技术正在加速落地:容器技术、Kubernetes 的使用已经越来越普及,云计算和大数据结合更紧密,AIOps 的实践也在不断成熟改善,云原生和 DevOps 的理念文化也在慢慢渗透到大小规模的技术团队,对运维人员带来很大的冲击,传统运维团队纷纷在转型,自动化甚至智能化运维已经成为了趋势。


在这样的背景下,企业运维团队如何向 DevOps 转型,如何使用更好的文化和方法来提升效率?我们采访了腾讯 IEG 蓝鲸团队的党受辉,谈一谈像腾讯这样的大厂的运维如何转型。

嘉宾介绍

党受辉 腾讯互动娱乐技术运营部 蓝鲸产品中心总监


腾讯 T4 工程师,曾就职于东软集团,为能源行业定制企业信息化体系,加入腾讯后负责运维团队管理。2012 年负责互动娱乐事业群基础 PaaS(蓝鲸)的设计、建设和运营。结合微服务、云、大数据等理念及前沿技术,构建独立部署的 PaaS 体系,并通过 SaaS 化产品,助力行业内应用运维团队的转型升级,推动 devops 生态及智能化运营。

腾讯这样的大公司,在运维体系的构建过程中如何避免“重复造轮子”?在升级演进的过程中如何避免浪费?

:在腾讯的互动娱乐事业群(IEG),我们采用 PaaS 技术来架构运维体系,其中的 iPaaS 层可以兼容已有的重复性功能模块,并且在升级过程中可以采用长期双轨运行的方式平滑替换升级,相比于传统的“烟囱群”式系统的“推倒升级”,避免大量的风险及浪费。

在 DevOps 等理念和技术的冲击下,传统运维团队如何转型应对?

:从技术角度看,一个业务的全生命周期可以分为 CI-CD-CO 三段,CI 指的是持续集成,从研发团队提交代码作为起点,经过便以构建扫描测试等环节,以版本仓库为终点;CD 指的是持续部署,以版本仓库为起点,经过各模块自动化部署,到业务上线提供服务为终点;CO 指的是持续运营,从业务上线服务为起点,到业务下线终止服务为终点,期间包含各种运营事件。


传统运维的定位主要在 CD 段,但由于微服务、虚拟化、容器化等技术的冲击之下,运维对 CD 段的把控在减弱,甚至有些公司直接按照 SRE 等理念从开发侧覆盖了运维团队的部分职能,从而使运维团队萎缩到了管理资产和成本的角色,丧失了精细化运营能力。


腾讯 IEG 的运维团队借助 PaaS 技术,将运维团队转型为“运维开发”团队,首先完成了自身 CD 段的自动化工具构建,而后通过 iPaaS 集成大数据能力,服务于 CO 段的业务及非技术人员,最后仿照运营 aPaaS 的持续集成流水线,为业务开发团队打造了 CI 段的全套工具产品,完成了对业务及业务团队全生命周期的运营支持。

关于 CI-CD-CO 具体指的是什么意思?

:CI 指的是持续集成,从研发团队提交代码作为起点,经过便以构建扫描测试等环节,以版本仓库为终点;CD 指的是持续部署,以版本仓库为起点,经过各模块自动化部署,到业务上线提供服务为终点;CO 指的是持续运营,从业务上线服务为起点,到业务下线终止服务为终点,期间包含各种运营事件。

腾讯是如何看待“运维开发”这一全新岗位的?与 AIOps 有什么关系?

:我们将运维开发视为与测试开发、营销开发等并列的一种岗位,主要职能是做工具类的运营系统,例如持续集成、日志分析、资源管理、版本发布、环境变更、监控处理、灾备切换、日常巡检、电子工单、运营分析、运营管控、经营管理等。互联网公司面临着很大的竞争压力,需要从各个层面提升经营效率,降低成本。而落地工具文化,是途径之一。我们依托 PaaS 技术,将传统应用运维团队转型为运维开发团队,来承担这一重要职能。


运维开发团队以 Python 为主语言构建 PaaS 之上的 SaaS 应用,而在从运维开发向 AIOps 的体系化过渡过程中,也可以以较低的成本完成转型。

如何体系化的落地智能运维(AIOps)?

:如果要“体系化”的落地智能运维,需要首先构建完善的机械自动化体系以及完整的数据分析体系,最后辅以符合运维技术栈的分析挖掘平台来实现。否则只能是作为案例或试点存在,无法“体系化”推进。

腾讯如何使用 Kubernetes 构建容器管理体系,在“特殊化定制”与“保持与社区版本同步升级”之间如何平衡?

:社区版本升级和个性化功能定制的确是很多企业的矛盾,我们在容器管理平台中采用 k8s 与 mesos 双引擎并行的方式来解决这个问题。

腾讯这样体量的公司,其海量运维体系的逻辑、方法和经验,是否适用于中小企业或初创公司?

:腾讯 IEG 虽然有一万多名员工,五百多款业务,但由于不同业务间的体量差异很大,有几万节点的大型游戏,也有数百节点的中小型游戏,因此其理论方法和实践经验适合于不同规模和类型的企业。

本次 CNUTCon 全球运维技术大会—深度培训专场,腾讯 IEG 蓝鲸团队带来的 5 大主题分享,适合什么样的群体,可以为我们带来什么收获?

答:适合于


  • 希望在企业中落地自动化、数据化、智能化的运维团队;

  • 希望从传统运维转型为运维开发的团队;

  • 希望从资源资产管理转向业务管理的运维团队;

  • 希望从传统 SLA 保障转型为对业务提供“技术运营”支持的运维团队。


你能想象“英雄联盟”只有 5 个人的运维团队吗?因此腾讯运维的理论方法和实践经验适合于不同规模和类型的企业。


想了解更多信息,关注CNUTCon 深度培训,党受辉老师将分享传统运维团队向自动化、运维开发、智能运维及 IT 运营领域转型所必经的管理架构及技术平台架构变革之路。


2018-11-12 16:382006

评论

发布
暂无评论
发现更多内容

使用AI优化慢SQL,开发秒变DBA

NineData

sql AI 开发者 dba NineData

openGauss:共建数据库根社区,打造开源数据库核心竞争力

Gradio入门到进阶全网最详细教程[一]:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)

汀丶人工智能

人工智能 机器学习 深度学习 Gradio streamlit

分布式多级缓存系统设计与实战

分布式 系统设计 多级缓存

连接OpenAI两大智能产品Whisper & DALL·E,实现智能语音转文本/文本转图像

集简云开放平台

AI 智能 openai 数据集成平台 AI绘画

JUnit 5 参数化测试

码语者

Java JUnit

沉默的618下,美妆品牌如何踏上破局之路?

游读分享

软件测试/测试开发丨Pytest 自动化测试框架(四)

测试人

软件测试 自动化测试 测试开发 pytest

语雀-使用指南

六月的雨在InfoQ

在线文档 在线协同文档 三周年连更 语雀

Nginx常用配置及和基本功能讲解

京东科技开发者

nginx 负载均衡 正向代理与反向代理 企业号 4 月 PK 榜 Nginx入门

Qz学算法-数据结构篇(查找算法--线性、二分)

浅辄

数据结构 三周年连更

Josh × 微帧科技,为印度TOP短视频平台提供视频编码服务

微帧Visionular

音视频 视频编码 音视频技术

李士福:openGauss 自驾驶数据库内核在AI领域的探索和创新

Java 应用程序在 Kubernetes 上棘手的内存管理

Java你猿哥

Kubernetes JVM ssm requests limits

路由器、网桥和交换机

测吧(北京)科技有限公司

测试

算法题每日一练:最长递增子序列

知心宝贝

数据结构 算法 前端 后端 三周年连更

再次!openGauss荣获中国软协产业协会多个奖项

今天一定要搞清楚Spring事务

Java spring Spring事务

流量即生意!红海中的茶饮品牌如何做增量?

游读分享

宠物行业如何做留存?答案都在这里了!

游读分享

openGauss数据库源码解析系列文章——执行器解析(三)

深扒Sentinel背后的实现原理之后,我终于明白它为什么这么强了

Java你猿哥

Java spring ssm Sentine

精彩回顾 | DTC模式构建全域消费者增长指南

游读分享

区块链数字代币燃烧模式开发技术方案丨(成熟技术)

I8O28578624

孔再华:openGauss在民生银行的应用实践

用户订阅付费如何拆解分析?看这篇就够了

HarmonyOS SDK

HMS Core

C4D渲染器到底该怎么选?

Finovy Cloud

C4D

用友联合7家信创生态伙伴成立“信创领先实践联盟”,助力企业数智化国产替代

用友BIP

黄凯耀:深度解读openGauss架构创新与新特性

阿里“宝妈级”之作,这份Spring Security应用到源码手册,全是精华

Java spring spring security

阿里逆天级调优方案,内部这套Java性能调优实战宝典,堪称教科书

Java 性能优化 性能调优

传统运维团队转型应该注意哪些问题?_软件工程_党受辉_InfoQ精选文章