-
BFE可以配置一个集群中的子集群的流量分配比例。
-
该配置中可以包含一个虚拟的子集群,BLACKHOLE(黑洞)。分向黑洞的流量会被丢弃。它可以用来防止子集群过载。
-
假设基本场景如下图所示:
-
共两个IDC:IDC1和IDC2
-
两个BFE集群:BFE1和BFE2
-
后端产品线的集群有两个子集群:子集群1和子集群2
-
-
BFE集群(BFE1和BFE2)可以根据子集群(外加Blackhole)分流比例的配置,分发流量。如:
-
BFE1集群的分流配置为:{子集群1:w11,子集群2:w12, Blackhole:w1B}
-
BFE2集群的分流配置为:{子集群1:w21,子集群2:w22, Blackhole:w2B}
-
-
BFE实例根据上述配置做WRR调度(加权轮询),向子集群转发请求。
- 例如,当BFE1的分流配置{w11,w12, w1B}为{45,45,10}时,该集群在BFE1转发给子集群1、子集群2、Blackhole的流量比例依次为:45%、45%、10%。
-
通过修改上述配置,可以将流量在不同的子集群之间切换,实现负载均衡、快速止损、过载保护等目的。
- 在同一子集群内的多个实例间,BFE支持使用多种负载均衡算法:
- WRR: 加权轮询算法
- WLC: 加权最小连接数
- 如实例的处理能力不同,可以分配不同的权重。
对于BFE下游的每一个实例,BFE会维护一个状态机,包含2个状态:
- 正常状态:这个实例可以正常处理BFE转发的请求
- 健康检查状态:实例暂时不可用,BFE对这个实例启动健康检查,直到这个实例恢复正常为止
从正常状态切换到健康检查状态的条件:
-
建立连接或转发请求的连续失败次数超过一定的阈值
-
在健康检查状态:
- BFE会定期向实例发送健康检查请求
从健康检查状态切换到正常状态的条件:
- BFE从该实例收到健康检查请求的正确响应
BFE在转发时,支持以下两种失败重试机制:
-
同子集群重试
- 在原目标子集群内进行重试
-
跨子集群重试
- 在原目标子集群之外、使用另外一个子集群进行重试
BFE和下游实例的连接支持两种方式:
-
短连接方式:每次BFE向下游实例转发请求,均需要建立新的TCP连接
-
连接池方式:
-
BFE为每个下游实例维护一个连接池
-
当BFE需要向某个下游实例转发请求时:
- 如果连接池中有idle连接,则复用这个连接
- 如果连接池中没有idle连接,则会建立一个新的TCP连接
-
当BFE处理完一个请求时
- 如果连接池中的idle连接数量小于连接池的大小,则将当前使用的连接放入连接池
- 如果连接池中的idle连接数量大于等于连接池的大小,则关闭当前使用的连接
-
BFE向下游转发请求时,支持将相同来源请求,转发至固定的业务后端(某个子集群或某个实例)
-
请求来源标识:
- 基于请求来源IP
- 基于请求特定头部,例如请求Cookie等
-
会话保持级别:
- 子集群级别:相同来源请求,被转发至固定的业务子集群(注:子集群中的任意实例)
- 实例级别:相同来源请求,被转发至固定的业务实例