LVS那些事
1998年,章文嵩博士成立了Linux Virtual Server的自由软件项目,进行Linux服务器集群的开发工作。
他的目标是:使用集群技术和Linux操作系统实现一个高性能、高可用的服务器,它具有很好的可伸缩性(Scalability)、可靠性(Reliability)和可管理性(Manageability)。
LVS到现在已经使用的非常广泛了,绝大部分国内的互联网企业用它来做四层的负载均衡组件。
我们分2-3篇博客来介绍LVS,包括从原理到实际的部署等方面。

LVS 做了什么工作?
当客户端向服务端发送请求,请求首先到LVS的服务器上。
- LVS选择一个服务器作为响应本次请求的真实服务器(Real Server)
- 将请求转发到 Real Server
- 将 Real Server 的回应转回客户端(某些模式下没有这一步)
归结起来,LVS做了两件很重要的事情:
- 挑选服务器
- 转发请求
下面就对这两个过程进行描述。在那之前,为了能更清楚的叙述,需要先认识一些名词:
Director运行LVS的服务器,也叫 Virtual Server
LVS并不能直接提供服务,需要后端服务器提供真正的服务
RIP实际提供服务的IPRS实际提供服务的服务器(Real Server)
一台Director至少提供两个IP,一个用来对外提供服务(一般为公网),一个用来向后端服务器转发请求:
VIPVirtual Server 对外提供服务的虚拟IP(Virtual IP)DIPVirtual Server 用于转发的IP(Director IP)
向服务器发出请求的称为Client
CIP客户端IP(Client IP)
转发请求
LVS在转发请求的方式一共有三种,各有优劣
1 Network Address Translation(VS/NAT)
全称 Virtual Network via Network Address Translation。
这种方法是通过NAT的方式来实现负载均衡。

如上图
- 当一个请求到达Director,其
源IP|目的IP为CIP|VIP; - Director将包的目的IP改为RIP,包地址为:
CIP|RIP; - RS处理请求后,将结果返回,包地址为:
RIP|CIP; - 返回的包经过Director时,将其包地址改为:
VIP|CIP
当包从RS返回时,其地址为RIP|CIP。如何保证包一定会经过Director呢?需要将所有的RS的Gateway设置为DIP。这需要DIP和RIP在同一个网段或Vlan中。
Full-NAT
这是VS/NAT方式的一个变种。原理是在转发到RS上时,将目标地址和原地址全部改写,回给客户端时再改回去。这样的话DIP和RIP可以不在一个网段上,可以实现跨机房,或者异地容灾。
缺点
这种方式的缺点是:request和response全部要经过Director,当RS的数量很多,或者请求量很大时,Director会变成性能瓶颈。
2 Direct Routing(VS/DR)
全称:Virtual Server via Direct Routing。
这是目前较为常用的一种模式,可以避免VS/NAT出现的Director性能问题。

- 请求到达Director,将目标MAC改为RS的MAC;
- RS处理请求后,将包直接会给Client;
过程很简单,但中间的问题很多:
更改MAC地址来达到转发的时候,Director 和 RS们必须在同一物理交换机下啊?
是的,这也是这个模式的缺点,Director必须和RS在同一交换机下。
RS在收到包之后,发现目的IP不是自己的IP,不会去处理,怎么办?
为了解决这个问题,需要给RS上绑定VIP。
Linux主机的IP和MAC映射关系会通告给整个交换机网络下,这样的话就会出现混乱了,RS和Director都有同样的IP,该发给谁?
可以通过设置内核参数来决定将哪些网卡通报,哪些不通报。一般来说绑定在lo上是最省事的。
Linux包从某个网卡出去,此网卡必须有某个IP才能以此IP为源地址出去,VIP现在绑定到lo上,如何能回包?
为了解决这个问题,需要加主机路由,所有source为VIP的包全部从连通公网的网卡走。
3 IP Tunneling(VS/TUN)

Director收到Client的请求包后,在外层再加上一个IP头为DIP|RIP后封装成IP隧道协议报文,然后发送给real server.
RS一定要可以识别IP隧道协议才可以,拆包后看到还有一个头是CIP|VIP,所以RS就打上VIP|CIP的IP头直接回给Client.
选择服务器
选择服务器本质上就是如何调度请求。LVS提供了下面的几个算法:
1 轮询(Round Robin)
算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。
2 加权轮询(Weighted Round Robin)
根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
3 最少链接(Least Connections)
算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用"最小连接"调度算法可以较好地均衡负载。
4 加权最少链接(Weighted Least Connections)
在集群系统中的服务器性能差异较大的情况下,调度器采用加权最少链接调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
5 基于局部性的最少链接(Locality-Based Least Connections)
针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器 是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用"最少链接"的原则选出一个可用的服务 器,将请求发送到该服务器。
6 带复制的基于局部性最少链接(Locality-Based Least Connections with Replication)
针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个 目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务 器组,按"最小连接"原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载;则按"最小连接"原则从这个集群中选出一 台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的 程度。
7 目标地址散列(Destination Hashing)
根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
8 源地址散列(Source Hashing)
根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
关于为什么要分篇来写
为什么要分开几篇写不是一篇写完呢?是因为我觉得,博客不是论文,不需要长篇大论一次把事情讲完。利用碎片时间就能读完才是好的。
不占用读者太长时间又能有收获才是我的追求。哈哈哈
作者和出处(reposkeeper) 授权分享 By CC BY-SA 4.0
关注微信公众号,获取新文章的推送!

LVS那些事的更多相关文章
- lvs的dr模式分析(二)
#vim /etc/init.d/lvsdrrip #!/bin/bash #DR server VIP=192.168.46.200 case "$1" in start) ...
- Linux LVS Nginx HAProxy 优缺点
说明:以下内容参考了抚琴煮酒的<构建高可用Linux服务器>第六章内容. 搭建负载均衡高可用环境相对简单,主要是要理解其中原理.此文描述了三种负载均衡器的优缺点,以便在实际的生产应用中,按 ...
- ysql+heartbeat+DRBD+LVS实现mysql高可用
在企业应用中,mysql+heartbeat+DRBD+LVS是一套成熟的集群解决方案,通过heart+DRBD实现mysql的主 节点写操作的高可用性,而通过mysql+LVS实现数据库的主从复制和 ...
- LVS Nginx HAProxy 优缺点
搭建负载均衡高可用环境相对简单,主要是要理解其中原理.此文描述了三种负载均衡器的优缺点,以便在实际的生产应用中,按需求取舍. 目前,在线上环境中应用较多的负载均衡器硬件有F5 BIG-IP,软件有LV ...
- 使用LVS+keepalived实现mysql负载均衡的实践和总结
前言 经过一段时间的积累,数据库的架构就需要根据项目不断的进行变化. 从单台数据库,到了两台数据库的主从,再到读写分离,再到双主,现在进一步需要更多的数据库服务器去支撑更加可怕的访问量. 那么经过那么 ...
- lvs与nginx区别
lvs和nginx都可以用作多机负载方案,他们各有优缺点,在生产环境中需要好好分析实际情况并加以利用. 一.lvs的优势: 1.抗负载能力强,因为lvs工作方式的逻辑是非常简单的,而且工作再网络层第4 ...
- LVS(五)LVS的持久连接
什么是持久链接 把某个客户端的请求始终定向到同一应用服务器上.对于LVS来说持久连接和算法没有关系.也就是使用任何算法LVS都可以实现同一客户端的请求转发到之前选定的应用服务器,以保持会话.而且还能实 ...
- keepalived + lvs
Keepalived原理 Keepalived原理 keepalived也是模块化设计,不同模块复杂不同的功能,下面是keepalived的组件 core check vrrp libipfwc li ...
- LVS专题-(3) 虚拟ip理解
1.虚拟IP是什么? 要是单讲解虚拟 IP,理解起来很困难,所以干脆把 动态 IP .固定 IP .实体 IP 与虚拟 IP都讲解一下,加深理解和知识扩展 实体 IP:在网络的世界里,为了要辨识每一部 ...
随机推荐
- February 10 2017 Week 6 Friday
Example is always more efficacious than precept. 身教胜于言教. Always match your words with your actions. ...
- 跳舞玩偶Doll正式上线
有问题或者建议大家可以联系我的QQ 914287516 或者qq邮箱 官方qq群 325631077:
- java学习第一步,使用IntelliJ IDEA编写自己的第一个java程序
首先下载java的jdk,然后说一下IDEA的配置 IntelliJ IDEA目前公认的最好的java开发工具,不过一般的学校的教学还是使用eclipse来进行java的开发.所以老师一般只会教你如何 ...
- 使用combineReducers注意事项
一.从‘redux’包中引入combineReducers方法: import { combineReducers } from 'redux'; 二.针对state的不同属性写不同的reducer, ...
- MQ--API总结
研究MQ很长时间了, 每个类,方法,都查了很长时间,在此总结一下! Java编写访问MQ的程序 1.MQQueueManager―――队列管理器访问类 常用方法: public MQQueueMan ...
- UVa 1331 - Minimax Triangulation(区间DP + 计算几何)
链接: https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem& ...
- Kali Linux重设root密码
许久不用的Kali,某天打开竟忘了密码! 网上的方法颇为简单,遂准备亲自试一下. #光标移动到第二行的“恢复模式”,按E进入[编辑模式] ...
- C/C++心得-从内存开始
因工作与自身各方面需要,开始重新学C,其实说重新也不太准,原来只是大学里面接触过,且还未得多少精髓就转其他开发,不过也正是因此才有了重新学习的必要,基础部分的心得将通过博文记录下来,对于初学者应该有些 ...
- mongodb、parse-server、parse-dashboard 的启动命令
1.mongodb启动: 1$ C:\MongoDB\Server\bin>mongod --logpath d:\mongodb\logs\log.log $ C:\MongoDB\Serve ...
- 浅谈DB2的四个隔离级别
隔离级别定义用于控制并发事务的行为,它决定在访问数据时数据是如何锁定的.如何与其他进程隔离的. 包括四个级别,级别从高到低: RR(可重复读取) RS(读取稳定性) CS(游标稳定性) UR(未提交的 ...
