收录了 系统运维 频道下的 50 篇内容
随着企业数字化转型步入深水区,设备数量增加,业务系统更加复杂,除了要保证物理硬件的稳定性和可靠性,运维目的和手段也发生了深刻变革。
SysOM 是由龙蜥社区系统运维 SIG 打造的一站式操作系统运维平台,能够帮助用户在统一平台上实现主机管理、系统监控、异常诊断、日志审计、安全管控等复杂操作系统管理。
丁登,2006年毕业于浙江大学,同年加入网易杭州研究院,从事一线运维工作至今。强迫症患者。习惯强烈地表达自己的观点。本次QCon大会Lulu会做分享网易研究院对于自动化运维的经验。在大会举办之前,InfoQ对丁登做了一次采访。
12月15日中行IBM大型机宕机,系统没有第一时间切换到热备或者异地容灾上,直接影响中行的信用卡支付相关业务,直到4小时之后才恢复服务。由于银行业务的特殊性,对于系统的可用性要求极高,就此事件,我们采访了兴业银行系统分析师周伟然、支付宝应用运维架构师陆惟凯(花名:近南),请他们谈一下对于银行系统运维的一些看法。
coolbpf 项目,以 CO-RE(Compile Once-Run Everywhere)为基础实现,保留了资源占用低、可移植性强等优点,还融合了 BCC 动态编译的特性,适合在生产环境批量部署所开发的应用。
本次分享围绕存储系统运维常见的四个痛点,常见的解决方式及优缺点。
龙蜥社区正式推出围绕操作系统迁移和运维的自动化运维平台 SysOM 2.0 版本,此次升级从架构到核心功能都做了优化升级,包含三个核心能力:操作系统迁移、全面升级的诊断中心和整体架构的升级。
本文我们分享一种十分隐秘且难排查的内存泄漏案例。
本文介绍智能运维在金融核心领域的实践经验。
Surftrace 是由系统运维 SIG 推出的一个 ftrace 封装器和开发编译平台,让用户既能基于 libbpf 快速构建工程进行开发,也能作为 ftrace 的封装器进行 trace 命令编写。
本文介绍《SRE Google运维解密》与《SRE生存指南》两本书。
最近几年随着云计算的兴起和DevOps理念的流行,软件工程师领域有关“运维也要会开发”、“运维要自动化”、甚至“运维工程师要失业”这样的话题开始被越来越多的提起并讨论。 今天InfoQ中文站邀请到的嘉宾是一位资深的运维工程师,他是从开发工程师转岗成运维的。运维工作的界限将产生怎样的变化?运维工程师未来的职业发展应该如何规划?运维工程师为了适应时代和技术的变化需要去学习什么?让我们听听他的观点。
本文来自RancherLabs微信公众号
内容涵盖了Exchange运维框架的各个环节,由运维模板的详细解析到运维目标的全面保障,均进行了系统且深入的阐述。旨在为企业在邮件系统运维方面提供一套具有指导意义的思路和模版。
本文将结合具体实践,介绍微众银行面向智能化运维的CMDB系统构建历程以及实施效果。
很多企业都认识到自动化运维的重要性,这是走向规模扩大化的必经之路,同时可以减轻运维工程师的负担。一个完善的运维系统应该是怎么样的?运维系统实现全面自动化应该怎么做,从哪里开始? 带着上述问题,InfoQ对蘑菇街运维经理赵成进行了专访。赵成有着八年的运维经验,积累了非常丰富的电信级和互联网业务研发和运维经验。
在IT企业里产品从创意到交付给用户,从整体上看是由技术部门负责,但如果深入到技术部门,会发现由不同的技术团队负责不同的部分或者阶段。本文讲述了不同技术团队的配合问题及DevOps。
以京东为例,它的物流系统有很多分支机构, 比如仓库、分拨中心、转运中心等, 业务复杂的分支机构可能会有自己的信息系统, 这些信息系统往往分布式地部署到全国各地,那如何基于自动化运维平台管理好这些分支机构的服务器、 信息系统, 降低因为地域分布造成的运维维护成本呢?京东资深架构师赵玉开向InfoQ记者深入介绍了他们在自动化运维平台方面的一些探索和实践。
为了让广大社区用户和开发者近距离感受 Linux 和 eBPF 技术的魅力,龙蜥社区系统运维于 08 月 12 日在杭州举行 MeetUp 。点击文章参与报名!
第二十届 GOPS 全球运维大会将于 2023 年 4 月 7-8 日在南山区深圳湾万丽酒店召开。龙蜥社区核心开发者冯富秋受邀参会,将在“可观测专场”分享技术演讲。欢迎收看!