写点什么

LB 服务:软 LB 的服务能力(下)

  • 2020-03-30
  • 本文字数:2465 字

    阅读完需:约 8 分钟

LB服务:软LB的服务能力(下)

LVS 的工作模式,主要包含三种:DR、Fullnat、Tunnel。

DR

在 DR 模式下,LVS 上会配置服务虚 IP,同时要求后端的 real server 上也会配置该 IP 地址,即 LVS 与后端服务器处于同一个网段。当 client 有报文发送到 LVS 的时候,LVS 不会修改报文的 IP 地址,而是修改了报文的目的 mac 地址为 real server 的地址,后往后端 server 上送。real server 回包直接回给网关,后发给 client,不再经过 LVS。



可以认为,DR 是一种基于后端 mac 地址的负载分发方式,LVS 会将报文按照负载均衡算法,轮询给后端的不同 mac 地址。


DR 模式的好处就是,回包不经过 LVS,回城可以达到比较高的性能。缺点是,LVS 与后端要求在一个二层网络中,部署不太灵活。

Fullnat

Fullnat 模式下,服务虚 IP 配在 LVS 上,报文路由到 LVS 以后,LVS 先根据负载均衡算法确定分给哪一个后端 real server,然后对报文的源地址和目的地址都做了转换。目的地址改成 real server 的地址,源地址改成 LVS 自身地址。


报文路由到 real server 以后,real server 回包报文目的地址为 LVS 的地址,报文会回到 LVS 上。LVS 把报文源地址和目的地址还原成 VIP 和 client 地址,回给 client。



由于报文在 LVS 出做了 fullnat 后,按照 IP 地址寻址转发,所以后端 real server 不再需要与 LVS 在同一个二层网络里面,支持更灵活的组网方案。


而 fullnat 模式的缺点,LVS 做了源地址转换以后,服务端无法看到访问者的源 IP,将无法针对访问者进行分析。而当今大多数的游戏等应用,都需要知道是谁访问的自己,做客户来源分析等。而源地址可见,却正是 DR 模式的优点。

Tunnel

前面说了,DR 模式的优点是源地址可见,fullnat 模式的优点是可以拉远部署,那是否存在一种方式,既能拉远部署又能保持源地址可见?当然有,那就是 tunnel 模式。


Tunnel 模式的原理是,LVS 自己和后端所有的 real server(或 VM 的 host)之间建立了隧道,报文到了 LVS 以后,LVS 根据负载均衡算法,确定分给哪一个 real server,同时确定应该走到哪一个隧道上去。LVS 对于报文是否做了转换?其实标准的 LVS 是没有对报文做转换的,但是部分友商为了能对报文进行分析,做了一些修改。


传统的 LVS,报文目的 IP 依然保持 vip,直接走到 real server,real server 上需要配置 vip,请求受理完成以后,直接可回给 client,不需要经过 LVS;企业改造以后,LVS 会把报文的目的 IP 改成 real server 的 IP 地址,然后再进隧道。real server 不需要再配置 vip,但回包要先送回到 LVS,方便 LVS 对报文进行分析统计。



在公有云上,一般 LVS 是跟 host 主机的 VTEP IP 建立隧道。


而隧道的选择,一般选择 GRE 隧道或者是 VXLAN 隧道。不同的友商根据自己的技术能力和场景不同,可以选择不同的协议。华为云选择什么?自然是 VXLAN。


网上介绍 LVS 的文档基本上将到这里就完了,但作为一个物理网络虚拟网络都有一丁点认识的小兵,笔者在此再给各位读者吐槽一下 LVS 的一个坑人的地方。

ECMP 引流

传统的四层交换,基本上都是主备部署。主备之间跑 VRRP,对于上层路由设备来说,发送 ARP 请求,是可以很明确的学习到四层交换的实 IP 或者是虚 IP 的 mac 地址,进而指导传统的路由交换,将报文引给四层交换。


主备部署,平时工作的就只有主一台设备,这也是我们吐槽硬件设备的一个地方——无法平滑拓展。但是,LVS 如何解决这个问题呢?LVS 如果再主备部署,性能只会比硬件更加差。Linux 程序员设计出来的负载均衡,那当然是集群部署了。


可是,在 LVS 集群部署的时候,多台 LVS 的配置完全一致,虚 IP 地址都是一样的,如何规避如下两个问题:


1、 IP 地址/mac 地址在一个二层网络内部冲突如何解决?


2、 上层设备,怎么知道应该路由给谁?


二层网络内,服务虚 IP 对于 LVS 来说,并不是接口 IP,本身是不会发送 ARP 也不会响应 ARP。避免 IP 地址冲突的问题,当然,也意味着二层内部是无法访问到虚 IP 的。


所有访问 LVS 虚 IP 的流量,都需要三层转发,而上层路由设备,需要通过等价路由 ECMP 给多台 LVS 分流。



如图,各个 LVS 服务器除了本身有相同的虚 IP 以外,还需要每台设备有唯一的接口 IP 地址,上层的网关设备上,根据路由将报文发送给接口 IP。路由形成的方式有两种:静态配置等价路由、LVS 与网关建立动态路由形成等价路由。

静态配置等价路由

如上图,可以手工在网关设备上配置静态路由,以指导流量转发。


Ip route-static 10.10.10.10 255.255.255.255 192.168.1.10Ip route-static 10.10.10.10 255.255.255.255 192.168.1.11Ip route-static 10.10.10.10 255.255.255.255 192.168.1.12
复制代码


当然,静态路由上需要增加 NQA 探测,以使得某台 LVS 故障以后,可以快速撤销对应的路由。

动态形成等价路由

LVS 和网关设备之间建立动态路由协议邻居,LVS 将本地虚 IP 地址通告给网关,网关上行成多条等价路由指导转发。



如图,LVS 与网关之间跑 OSPF 或者 BGP,将 10.10.10.10 的 IP 地址同时通告给网关,网关会形成 3 条等价路径。当某台设备故障时,协议之间心跳探测失败,路由自动撤销。


只有实现了 ECMP 引流以后,LVS 才能横向拓展,通过 N 台设备的组合,实现亿级并发能力。

ELB 服务

要使用华为云的 ELB 服务,有几个概念需要先理解一下。


华为云的 ELB 和 EIP 是分开的,EIP 申请了以后,可以挂到 ECS 上,也可以挂到 ELB 上,还可以挂到 NAT 网关上。


申请 ELB 实例,需要创建监听器,监听器为 ELB 实例所对外提供服务的特性特点,如分发协议,保持方式等。


对于后端服务器的检查,需要配置检查类型、协议、周期等。后端检查的方式。


下面一张图简单描述:



更多的 ELB 实例的材料可以在链接获取。


对应于传统的四层交换来说,LB 有 GSLB、LSLB、LLB。这里讲的 LVS,替代的就是传统的 LSLB。


那 GSLB 和 LLB 呢?


GSLB 通过智能 DNS 来取代,华为的智能 DNS 还在开发中,敬请期待。


LLB,通过 BGP IP 就已经可以实现了,不需要额外的负载均衡,下一期我们重点讲解一下公有云的动态 BGP 和静态 BGP 的概念。


本文转载自 华为云产品与解决方案 公众号。


原文链接:https://mp.weixin.qq.com/s/wIMoqfTSjjHCpKXAepXbRg


2020-03-30 10:47919

评论

发布
暂无评论
发现更多内容

15 个优秀开源的 Spring Boot 学习项目,一网打尽!

爱好编程进阶

Java 程序员 后端开发

《数字经济全景白皮书》Z世代用户洞察篇 完整版 发布

易观分析

Z世代

架构师成长路线

架构师汤师爷

软件架构 架构师 成长路线

Stack 顿悟三部曲(1):从CPU的视角说起

蓬蒿

cpu 堆栈 计算机原理 stack

2021-11-9【数据结构平时实验】

爱好编程进阶

Java 程序员 后端开发

快来跟20年京东T9架构师学习进阶微服务+Docker+Dubbo+SpringBoot

Java架构追梦

spring java面试 后端开发

[Day36]-[二叉树]-在每个树行中找最大值

方勇(gopher)

LeetCode 二叉树 数据结构算法

(JavaSE)数据类型变量与运算符

爱好编程进阶

Java 程序员 后端开发

13-注解增删改查

爱好编程进阶

Java 程序员 后端开发

2年工作经验的Java程序员面试经历

爱好编程进阶

程序员 后端开发

BATJ关于Redis的高频面试真题

爱好编程进阶

Java 程序员 后端开发

不愧是字节跳动技术官,算法精髓全写这本666页笔记里了

Java架构追梦

Java 程序员 数据结构与算法、

维权思考

成周

Apache ShardingSphere 企业行|走进汽车之家

SphereEx

数据库 企业 ShardingSphere SphereEx apache 社区

元宇宙核心技术--脑机接口

CECBC

2021全网最全Activiti7教程02(Activiti7入门使用-欢迎收藏)

爱好编程进阶

Java 程序员 后端开发

云图说 | 华为云医疗智能体EIHealth,AI赋能基因组研究

华为云开发者联盟

华为云 云图说 EIHealth 医疗智能体 基因组

微服务实战文档分享,阿里内部的Spring cloud微服务精髓都在里面

Java架构追梦

Java 微服务 阿里

让 Rust 的 CI 加速 2~3倍速度

非凸科技

rust 构建 cl cithub 缓存空间

区块链 重塑不良资产互信机制

CECBC

终于有人把tomcat讲清楚了!阿里大牛推荐的tomcat架构解析文档

Java架构追梦

Java 后端开发 JVM’

2021年4月23号,成功斩获阿里(Java岗

爱好编程进阶

Java 程序员 后端开发

4年JAVA外包终上岸,我只能说避雷这些公司

爱好编程进阶

Java 程序员 后端开发

OpenHarmony 3.1 Beta版本关键特性解析——分布式DeviceProfile

OpenHarmony开发者

OpenHarmony OpenHarmony 3.1 Release DeviceProfile

耗时三年终于整理出了SSM+微服务+Nginx+Redis+MySQL的PDF了!

Java架构追梦

Java 后端开发

7Z命令行

爱好编程进阶

Java 程序员 后端开发

BAT华为等一线大厂Java工程师必读书单

爱好编程进阶

Java 程序员 后端开发

内存不超过5M,datop 在识别冷热内存及跨 numa 访存有多硬核?| 龙蜥技术

OpenAnolis小助手

cpu 内存 datop 轻量级 muma

动手实操丨RC522射频卡模块与IC卡完成充值消费查询的技术实现思路

华为云开发者联盟

stm32 RC522射频卡模块 IC卡 RC522

显卡只是为游戏而生吗?GPU服务器了解一下

Finovy Cloud

GPU服务器 GPU算力

What?构造的查询语句会导致堆栈溢出

华为云开发者联盟

neo4j 图数据库 堆栈溢出 查询语句 查询语言

LB服务:软LB的服务能力(下)_语言 & 开发_华为云产品与解决方案_InfoQ精选文章