【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

使用 GlobalSSH 加速 Ansible 海外部署效率

  • 2019-04-30
  • 本文字数:2430 字

    阅读完需:约 8 分钟

使用GlobalSSH加速Ansible海外部署效率

什么是 Ansible

Ansible 是一个简单高效、无 Agent 架构的自动化编排、部署及配置管理工具,通过 SSH 协议实现远程节点和管理节点之间的通信。


Ansible 的目的是简化大量复杂重复的运维工作, 以精简的技术思路建立公司内统一的自动化文化。无 Agent 的架构使其比其他工具更显简单,基于 SSH 可以做到的事 Ansible 都可以做的更好,超高的易用度使其可以简单集成到现有体系之中,因而被广泛使用。


UCloud Ansible 使用场景

UCloud 内部也大量使用到了 Ansible。比如,机房产品部署系统,通过 Ansible 实现了部署效率的极大提升,目前已经成为 UCloud 机房部署的重要工具。又如,现网大规模灰度发布系统,通过集成 Ansible 的基础 API 和 Callback 功能,很好的解决了灰度发布、回滚、控制等难题,该系统已经在线上稳定运行 3 年以上,完成相关灰度发布任务上万个。


下面将详细介绍 Ansible 在机房产品部署系统中的使用,相信对有多机房部署需求的读者会有帮助。

海外多机房部署

我们基于 Ansible 集中式地批量部署和管理服务,集中式管理中心位于北京/上海机房。当海外节点(如拉各斯、胡志明等)需要建设时,通过 Ansible 来远程部署云产品及内部服务。部分云产品是基于 UCloud 云主机作为 IaaS 层搭建的,所以也是通过 SSH 连到对应的海外云主机进行操作。



这和一般用户的使用场景有很多相似之处,无论其是自建 IDC 或用了公有云,甚至多云部署来同时管理不同云上的服务器,都有类似批量部署的需要。



海外部署有个额外的痛点,就是部署效率的问题。Ansible 使用 SSH 协议进行通信,SSH 通道的创建和通信速度都较慢。当需要通过外网管理,而网络环境较差或带宽不足的情况下,执行时间基本上无法忍耐,体现在用 Ansible 部署时,经常会出现卡顿、连接失败、传输速度较慢等现象,使用 Copy 模块传输稍大的代码包/镜像文件时基本上要等到花儿都谢了。


我们的解决方法,是把 UCloud 的 PaaS 产品 GlobalSSH,集成进 Ansible,用于提高跨国远程管理服务器效率。

GlobalSSH

GlobalSSH 为了保障海外数据中心的运维而推出,采用了 UCloud 众多 IaaS 产品如 ULB4(四层负载均衡)、UDPN(洲际内网互联、0 丢包)及高包量云主机,引入智能 DNS 服务以提供就近接入的能力。网络转发基于成熟稳定的 GRE、NAT 技术,支持 TCP 端口(除 80、443)四层转发。


Ansible Playbook 方式部署

我们将 GlobalSSH 集成到 Ansible,做一个简单的软件包拷贝及安装,步骤如下所示。


1)首先,我们通过 UCloud API 或控制台在北京二和拉各斯(尼日利亚)各创建一台云主机,带宽为 1Mb,其中拉各斯机房会自动开启 GlobalSSH 功能(所有 UCloud 海外机房均会自动开启),如下图所示:



2)准备一个简单的 Ansible Playbook,分别完成 3 个步骤:gather facts、copy 代码包以及 yum 安装代码。相关的 playbook 如下所示:


---
- hosts: all
tasks:
- name: copy test
copy: src=/data/MySQL-devel-5.6.41-1.el6.x86_64.rpm dest=/data/test
- name: install mysql-devel
yum: name=/data/MySQL-devel-5.6.41-1.el6.x86_64.rpm state=present
复制代码


3)准备一个 hosts 文件,用于配置 GlobalSSH 所生成的域名。Ansible 在对 GlobalSSH 的支持上非常简单,只要在主机变量里面添加 ansible_ssh_host=xxx.xxx.xxx.xxx.ipssh.net 即可。我们的机房部署系统会结合 Ansible 的 Dynamic Inventory 功能,直接在生成的 inventory 中将 GlobalSSH 的加速域名加到 ansible_ssh_host 变量中了,使用起来也是非常容易的,如下所示。


[root@10-10-83-122 ~]# cat hosts_nrly[all]152.32.140.39 ansible_ssh_pass=example[root@10-10-83-122 ~]# cat hosts_nrly_1[all]152.32.140.39 ansible_ssh_pass=example ansible_ssh_host=152.32.140.39.ipssh.net
复制代码


4)使用 ansible-playbook 命令执行该 playbook,任务完成。

测试对比

前面提到,GlobalSSH 大幅提高了我们海外部署的效率。可以通过另写一个无 GlobalSSH 加速的 Playbook,来测试一下具体的加速效果。


无 GlobalSSH 的 Playbook 写起来比较简单,和上文基本类似,区别在第三步的 hosts 文件里不使用加速域名,而是直接填写原有的外网 IP 地址。


为防止单次测试结果的不准确,这里测试了 10 次,取平均值进行比较。


测试命令:


time for i in `seq 1 10`; do ansible-playbook -i hosts_nrly test_playbook.yml; done
time for i in `seq 1 10`; do ansible-playbook -i hosts_nrly_1 test_playbook.yml; done
复制代码


最终的结果如下所示,可以看到在简单的 Ansible Playbook 部署中, 经过 GlobalSSH 加速后的效果提升了 32.23%.


使用方式运行10次总时间平均时间提升效率
使用外网IP10m52.197s65.20s
使用GlobalSSH域名加速7m21.898s44.19s32.23%

Ansible Ad-hoc 方式

GlobalSSH 在低速的带宽下可以提升整个网络传输的稳定性和速度,尤其是对 RTT (Round-Trip Time)往返延迟的提升,更是有着外网弹性 IP 所不具备的速度优势。 因此我们认为它对 Ansible Ad-hoc 方式也有很大帮助。


运维人员经常会用 Ad-hoc 方式,它类似 pssh,却支持 Ansible 所有的 module 语法,通常的使用场景是批量执行命令并查看回显结果。为了验证假设,我们对 Ad-hoc 方式也做了类似测试,发现 GlobalSSH 后的优化效果更明显,优化速度超过 50%,详细结果如下所示。


测试命令:


time for i in `seq 1 10`; do ansible -i hosts_nrly all -m shell -a "cat /var/log/messages"; done
time for i in `seq 1 10`; do ansible -i hosts_nrly_1 all -m shell -a "cat /var/log/messages"; done
复制代码


测试结果:


使用方式运行10次总时间平均时间提升效率
使用外网IP3m17.427s19.74s
使用GlobalSSH域名加速1m23.983s8.40s57.45%

总结

Ansible 是被大量使用的 DevOps 工具,我们在使用中根据需要,将 GlobalSSH 很容易地集成其中,避免了服务器部署中 SSH 卡顿造成的不良影响。


本文来源:UCloud 技术(微信公众号:ucloud_tech)


原文链接:https://mp.weixin.qq.com/s/1NqBRSAC6-EM0K079t28Ag


2019-04-30 08:005757

评论

发布
暂无评论
发现更多内容

CloudQuery v1.3.6发布,更加完善的数据操作支持

BinTools图尔兹

数据库 sql 数据安全 数据管理工具

「 留言参与 」—— InfoQ 写作平台【 1 周年盛典 】

InfoQ写作社区官方

1 周年盛典 热门活动

第一篇测试

童童

架构训练营

7年Java经验|面20+家公司|已拿16个offer|面经总结|

Java架构追梦

Java 架构 面试 20+大厂面经

阿里巴巴云原生 etcd 服务集群管控优化实践

阿里巴巴云原生

容器 运维 云原生 k8s 存储

入门物联网嵌入式才是关键!

cdhqyj

技术 编程语言 物联网 嵌入式 系统

JVM-技术专题-方法区中常量池分析

洛神灬殇

JVM 常量池

云原生势不可挡,华为云GaussDB加速企业数字化转型

华为云开发者联盟

华为云 GaussDB

PHP自动加载原理

Sakura

4月日更

Modus串行链路系统电气特性:2线-Modus、4线-Modus、RS232-Modus和RS485-Modus的特性

不脱发的程序猿

通信协议 4月日更 Modus 串行链路 RS232、RS485

Modbus协议在串行链路上的实现

不脱发的程序猿

通信协议 物联网常用协议 4月日更 Modbus 串行通信

最全 MongoDB 基础教程

若尘

数据库 mongodb mongo

android热修复基本原理,15分钟的字节跳动视频面试,满满干货指导

欢喜学安卓

android 程序员 面试 移动开发

想来百万流量技术公众号发布文章吗? InfoQ 开放内容平台了!

xiaotan

InfoQ 的朋友们 热门活动

避免人工智能存在“歧视”,要从这8大方法入手

澳鹏Appen

人工智能 机器学习 大数据 人脸识别

基于深度神经网络的噪声标签学习

华为云开发者联盟

神经网络 损失函数 深度神经网络 噪声 噪音数据

LeetCode题解:剑指 Offer 49. 丑数,三指针,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

BOE(京东方)2020年报发布: 营收1355.53亿元 净利润大幅增长162.46%

1小时破千万点击量!阿里巴巴首发:Java核心框架指导手册

Java架构追梦

Java 阿里巴巴 架构 面试 核心框架

小厂逆袭美团|5年经验|一二三面经,已拿offer|

Java架构追梦

Java 架构 面试 美团Offer

全球案例 | NTT:Atlassian 帮助我们重塑危机中的可能性

Atlassian

敏捷 团队协作 数字化转型 Atlassian Jira

重读《重构2》- 提炼变量

顿晓

重构 4月日更

KubeVela 1.0 :开启可编程式应用平台的未来

阿里巴巴云原生

容器 云原生 k8s 消息中间件 Go 语言

应对海量时序数据,华为云GaussDB(for Influx)有妙招

华为云开发者联盟

云原生 数字化转型 时序数据 华为云GaussDB

智慧城市:大数据运营中心 IOC —— Web GIS 地图应用

一只数据鲸鱼

WebGIS ioc 数据可视化 智慧城市 数据运营

HDFS的垃圾桶机制

五分钟学大数据

hadoop 4月日更

非科班毕业生,五面阿里:四轮技术面+HR一面已拿offer

码农之家

Java 编程 程序员 互联网 面试

Android面试送分题:大厂经典高频面试题体系化集合,实战篇

欢喜学安卓

android 程序员 面试 移动开发

《采访彩食鲜 CTO 乔新亮:如何从一名程序员晋阶为CTO》(采访提纲)

石云升

28天写作 4月日更 调查采访能力考核

Flume高阶自定义组件

大数据技术指南

大数据 flume 4月日更

博云入选2021爱分析·产业数字化厂商全景报告

BoCloud博云

云计算 云原生 PaaS 博云

使用GlobalSSH加速Ansible海外部署效率_软件工程_赵新宇_InfoQ精选文章