负载均衡原理内容是什么？_服务器知识

负载均衡建立在现有网络结构之上，它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。

负载均衡（Load Balance）其意思就是分摊到多个操作单元上进行执行，例如Web服务器、FTP服务器、企业关键应用服务器和其它关键任务服务器等，从而共同完成工作任务。

负载均衡构建在原有网络结构之上，它提供了一种透明且廉价有效的方法扩展服务器和网络设备的带宽、加强网络数据处理能力、增加吞吐量、提高网络的可用性和灵活性。

主要应用

1、DNS负载均衡最早的负载均衡技术是通过DNS来实现的，在DNS中为多个地址配置同一个名字，因而查询这个名字的客户机将得到其中一个地址，从而使得不同的客户访问不同的服务器，达到负载均衡的目的。

2、代理服务器负载均衡使用代理服务器，可以将请求转发给内部的服务器，使用这种加速模式显然可以提升静态网页的访问速度。然而，也可以考虑这样一种技术，使用代理服务器将请求均匀转发给多台服务器，从而达到负载均衡的目的。

3、地址转换网关负载均衡支持负载均衡的地址转换网关，可以将一个外部IP地址映射为多个内部IP地址，对每次TCP连接请求动态使用其中一个内部地址，达到负载均衡的目的。

一、前言

在互联网雄起的时代，随着各个网络请求量的不断增大，利用负载分化请求量，从而达到优化硬件负荷量的目的，一般负载分为软件负载和硬件负载，比如软件中使用nginx等工具实现负载均衡，而F5负载均衡器就是硬件网络性能优化设备。

二、何为负载均衡器

那么什么是F5负载均衡器呢，通俗的讲就是将客户端请求量通过F5负载到各个服务器，增加吞吐量，从而降低服务器的压力，他不同于交换机、路由器这些网络基础设备，而是建立在现有网络结构上用来增加网络带宽和吞吐量的的硬件设备

三、工作原理

1、客户发出服务请求到VIP

2、BIGIP接收到请求，将数据包中目的IP地址改为选中的后台服务器IP地址，然后将数据包发出到后台选定的服务器

3、后台服务器收到后，将应答包按照其路由发回到BIGIP

4、BIGIP收到应答包后将其中的源地址改回成VIP的地址，发回客户端，由此就完成了一个标准的服务器负载平衡的流程。

四、负载均衡涉及到算法

轮询算法：按照顺序将每个请求分发到每个服务器，相当于ngixn负载的轮训算法一个道理，当其中某个服务器发生第二到第7层的故障，BIGIP就把其从顺序循环队列中拿出，不参与下一次的轮训。

比率：指的是给每个服务器分配一个加权值，类似于权重，轮训会根据和这个权重去访问具体要到哪台服务器。

优先权：给所有服务器分组，BIGIP用户的请求，分配给优先级最高的服务器组（在同一组内，采用轮询或比率算法，分配用户的请求）；当最高优先级中所有服务器出现故障，BIGIP才将请求送给次优先级的服务器组。

最快模式：传递连接给那些响应最快的服务器。当发生异常故障时，BIGIP就会将其拿出来作为当前相应服务器，此时就不参与其他用户的请求轮训分配。

观察模式：以连接数和相应时间为准，当放生故障时BIGIP会将其拿出来作为请求的相应服务器，并且也不参与其他用户请求，直至恢复正常为止。

预测模式：BIGIP利用收集到的服务器当前的性能指标，进行预测分析，选择一台服务器在下一个时间片内，其性能将达到最佳的服务器相应用户的请求。

动态性能分配:BIGIP收集到的应用程序和应用服务器的各项性能参数，动态调整流量分配。

动态服务器补充:当主服务器群中因故障导致数量减少时，动态地将备份服务器补充至主服务器群。

服务质量：按不同的优先级对数据流进行分配。

服务类型：按不同的服务类型（在Type of Field中标识）对数据流进行分配。

规则模式：针对不同的数据流设置导向规则，用户可自行编辑流量分配规则，BIGIP利用这些规则对通过的数据流实施导向控制。

五。结尾

总之F5负载均衡器涉及到的原理内容多而杂，重点用户硬件负载方面，目前理解到此，还有很多不足之处希望一起发文讨论。

负载均衡（Load Balance），它在网络现有结构之上可以提供一种廉价、有效、透明的方法来扩展网络设备和服务器的带宽，并可以在一定程度上增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性等。用官网的话说，它充当着网络流中“交通指挥官”的角色，“站在”服务器前处理所有服务器端和客户端之间的请求，从而最大程度地提高响应速率和容量利用率，同时确保任何服务器都没有超负荷工作。如果单个服务器出现故障，负载均衡的方法会将流量重定向到其余的集群服务器，以保证服务的稳定性。当新的服务器添加到服务器组后，也可通过负载均衡的方法使其开始自动处理客户端发来的请求。

负载均衡涉及到以下的基础知识。

a. Round Robin: 对所有的backend轮训发送请求，算是最简单的方式了，也是默认的分配方式；

b. Least Connections(least_conn): 跟踪和backend当前的活跃连接数目，最少的连接数目说明这个backend负载最轻，将请求分配给他，这种方式会考虑到配置中给每个upstream分配的weight权重信息；

c. Least Time(least_time): 请求会分配给响应最快和活跃连接数最少的backend；

d. IP Hash(ip_hash): 对请求来源IP地址计算hash值，IPv4会考虑前3个octet，IPv6会考虑所有的地址位，然后根据得到的hash值通过某种映射分配到backend；

e. Generic Hash(hash): 以用户自定义资源(比如URL)的方式计算hash值完成分配，其可选consistent关键字支持一致性hash特性；

用户(浏览器)在和服务端交互的时候，通常会在本地保存一些信息，而整个过程叫做一个会话(Session)并用唯一的Session ID进行标识。会话的概念不仅用于购物车这种常见情况，因为HTTP协议是无状态的，所以任何需要逻辑上下文的情形都必须使用会话机制，此外HTTP客户端也会额外缓存一些数据在本地，这样就可以减少请求提高性能了。如果负载均衡可能将这个会话的请求分配到不同的后台服务端上，这肯定是不合适的，必须通过多个backend共享这些数据，效率肯定会很低下，最简单的情况是保证会话一致性——相同的会话每次请求都会被分配到同一个backend上去。

出问题的backend要能被及时探测并剔除出分配群，而当业务增长的时候可以灵活的添加backend数目。此外当前风靡的Elastic Compute云计算服务，服务商也应当根据当前负载自动添加和减少backend主机。

通常现代的网络服务者一个域名会关连到多个主机，在进行DNS查询的时候，默认情况下DNS服务器会以round-robin形式以不同的顺序返回IP地址列表，因此天然将客户请求分配到不同的主机上去。不过这种方式含有固有的缺陷：DNS不会检查主机和IP地址的可访问性，所以分配给客户端的IP不确保是可用的(Google 404)；DNS的解析结果会在客户端、多个中间DNS服务器不断的缓存，所以backend的分配不会那么的理想。

转自 https://blog.csdn.net/weixin_43694144/java/article/details/84098906

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/45879.html

负载均衡原理内容是什么？

发表评论

评论列表（0条）