龙蜥社区正式开源 SysOM,打造一站式系统运维

  • 2022-05-09
  • 本文字数:1897 字

    阅读完需:约 6 分钟

SysOM 是由龙蜥社区系统运维 SIG 打造的一站式操作系统运维平台,能够帮助用户在统一平台上实现主机管理、系统监控、异常诊断、日志审计、安全管控等复杂操作系统管理。

一站式系统运维平台 SysOM 正式发布并开源

 

InfoQ 获悉,近日,龙蜥社区一站式系统运维平台 System Operation & Maintenance(以下简称“SysOM”)正式发布,并已开源。

 

据介绍,SysOM 由龙蜥社区系统运维 SIG 组打造,融入了 SIG 组成员多年运维实践经验,通过统一的前端 Web 将所有运维服务的分析数据展示给用户,用户可以在同一个平台上进行主机管理、系统监控、异常诊断、日志审计、安全管控等复杂操作系统管理。值得一提的是,前端采用了开源的深度诊断解决方案 SysAK,该解决方案沉淀了百万级服务器的运维经验。

SysOM 可以解决哪些问题?

 

当前,Linux 社区存在大量的运维管理、系统监控、诊断工具,碎片化严重。单个工具解决单个场景问题,需要用户花费大量时间研究该工具才能使用,没有统一的平台为用户提供好的操作系统运维体验。

 

与此同时,操作系统作为非常底层的基础设施,运维难度大,系统宕机、内存及网络等问题专业性强,需要专业的操作系统知识,对于一般运维人员入门门槛过高。

 

此外,一般的开源操作系统都有提供软件安全更新,但是却没有运维平台来统一管理安全漏洞的影响范围,漏洞的发现及修复。

 

在此背景下,SysOM 平台应运而生,它集运维、监控、诊断为一体,能让系统的健康状况一目了然。据介绍,SysOM 当前提供以下 4 方面能力:

 

  • 统一平台:一个平台解决操作系统运维过程中所需要的多种关键能力。SysOM 将主机管理、监控、诊断、审计、修复、安全能力集于一体,通过 Web 化的界面管理方式,用户可以轻松运维所有机器;

  • 简单易用:提供统一监控系统,用户无需配置即可多维度的观测到所管理主机的状态;提供统一的诊断系统,用户用过 Web 化的界面即可完整各类深入的操作系统问题诊断;

  • 深度分析:集成 SysAK 工具集深度诊断解决方案,沉淀百万级的运维经验,进行内核源码级别的问题剖析;

  • 安全可靠:提供统一的安全中心,为用户所管理主机提供全方位的漏洞监控、管理、修复,保障系统的安全性;同时提供各类安全加固能力,满足不同应用不同程度的安全要求。

 

目前,SysOM 的后续功能还在开发中(项目地址:https://openanolis.cn/sig/sysom)。

SysOM 架构介绍

 

SysOM 整体架构分为前端展示、服务端分析、客户数据收集。

通过统一的前端 Web 将所有运维服务的分析数据展示给用户:

 

SysOM 使用实践

 1、环境准备

操作系统:Anolis OS 8.4 ANCK 64 位

系统规格:2 核 8 g

数量:3 台

网络:公网 IP

2、SysOM 部署

2.1 监控组件部署

#选择 Server 节点,执行下述命令部署监控组件

#部署目录

mkdir -p /usr/local/sysom/server/monitor/

#下载 grafana + prometheus + node-exporter

#下载 grafana 到 /usr/local/sysom/server/monitor/

wget https://dl.grafana.com/oss/release/grafana-8.2.5-1.x86_64.rpm -P /usr/local/sysom/server/monitor/

#下载 prometheus 到 /usr/local/sysom/server/monitor/

wget https://github.com/prometheus/prometheus/releases/download/v2.29.1/prometheus-2.29.1.linux-amd64.tar.gz -P /usr/local/sysom/server/monitor/

#下载 node-exporter 到 /usr/local/sysom/server/monitor/

wget https://github.com/prometheus/node_exporter/releases/download/v1.2.2/node_exporter-1.2.2.linux-amd64.tar.gz -P /usr/local/sysom/server/monitor/

 

2.2 诊断组件部署

 

#在 Client 节点,执行下述命令部署监控组件

#如未安装诊断组件,SysOM 的诊断中心将无法运行

#部署目录

mkdir -p /usr/local/sysom/server/diagnose

#下载诊断组件 sysAK

wget https://gitee.com/anolis/sysak/attach_files/1011048/download/sysak-4.19.91-24.8-1.2.1-1.an8.x86_64.rpm -P /usr/local/sysom/server/diagnose/

#安装 sysAK

rpm -idv /usr/local/sysom/server/diagnose/sysak-4.19.91-24.8-1.2.1-1.an8.x86_64.rpm --nodeps

 

2.3 SysOM 部署

 

#下载 SysOM

wget https://gitee.com/anolis/sysom/attach_files/1010533/download/sysomRelease-20220329115704.tar.gz -P /usr/local/sysom/

cd /usr/local/sysom/

tar -zxvf sysomRelease-20220329115704.tar.gz

cd sysomRelease-20220329115704

#安装 Sysom。选择前面准备好的机器中的一台作为 SysOM 服务器,如果只有公网 IP,只需要填一样即可(暂不支持离线安装)。

./deploy.sh /usr/local/sysom 内网 IP 公网 IP

3、使用 SysOM

 

部署成功后,用户就可以通过浏览器访问已部署的 SysOM 平台了。直接在浏览器中输入公网 IP(如果只有内网 IP 也可以用内网 IP)。