几种简单的负载均衡算法及其Java代码实现

作者：网络转载发布时间：[ 2017/1/5 10:30:30 ] 推荐标签：测试开发技术 Java

　　什么是负载均衡
　　负载均衡，英文名称为Load Balance，指由多台服务器以对称的方式组成一个服务器集合，每台服务器都具有等价的地位，都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载分担技术，将外部发送来的请求均匀分配到对称结构中的某一台服务器上，而接收到请求的服务器独立地回应客户的请求。负载均衡能够平均分配客户请求到服务器阵列，借此提供快速获取重要数据，解决大量并发访问服务问题，这种集群技术可以用少的投资获得接近于大型主机的性能。
　　负载均衡分为软件负载均衡和硬件负载均衡，前者的代表是阿里章文嵩博士研发的LVS，后者则是均衡服务器比如F5，当然这只是提一下，不是重点。
　　本文讲述的是”将外部发送来的请求均匀分配到对称结构中的某一台服务器上“的各种算法，并以Java代码演示每种算法的具体实现，OK，下面进入正题，在进入正题前，先写一个类来模拟Ip列表：
　　public class IpMap
　　{
　　// 待路由的Ip列表，Key代表Ip，Value代表该Ip的权重
　　public static HashMap<String， Integer> serverWeightMap =
　　new HashMap<String， Integer>();
　　static
　　{
　　serverWeightMap.put("192.168.1.100"， 1);
　　serverWeightMap.put("192.168.1.101"， 1);
　　// 权重为4
　　serverWeightMap.put("192.168.1.102"， 4);
　　serverWeightMap.put("192.168.1.103"， 1);
　　serverWeightMap.put("192.168.1.104"， 1);
　　// 权重为3
　　serverWeightMap.put("192.168.1.105"， 3);
　　serverWeightMap.put("192.168.1.106"， 1);
　　// 权重为2
　　serverWeightMap.put("192.168.1.107"， 2);
　　serverWeightMap.put("192.168.1.108"， 1);
　　serverWeightMap.put("192.168.1.109"， 1);
　　serverWeightMap.put("192.168.1.110"， 1);
　　}
　　}
　　轮询（Round Robin）法
　　轮询法即Round Robin法，其代码实现大致如下：
　　public class RoundRobin
　　{
　　private static Integer pos = 0;
　　public static String getServer()
　　{
　　// 重建一个Map，避免服务器的上下线导致的并发问题
　　Map<String， Integer> serverMap =
　　new HashMap<String， Integer>();
　　serverMap.putAll(IpMap.serverWeightMap);
　　// 取得Ip地址List
　　Set<String> keySet = serverMap.keySet();
　　ArrayList<String> keyList = new ArrayList<String>();
　　keyList.addAll(keySet);
　　String server = null;
　　synchronized (pos)
　　{
　　if (pos > keySet.size())
　　pos = 0;
　　server = keyList.get(pos);
　　pos ++;
　　}
　　return server;
　　}
　　}
　　由于serverWeightMap中的地址列表是动态的，随时可能有机器上线、下线或者宕机，因此为了避免可能出现的并发问题，方法内部要新建局部变量serverMap，现将serverMap中的内容复制到线程本地，以避免被多个线程修改。这样可能会引入新的问题，复制以后serverWeightMap的修改无法反映给serverMap，也是说这一轮选择服务器的过程中，新增服务器或者下线服务器，负载均衡算法将无法获知。新增无所谓，如果有服务器下线或者宕机，那么可能会访问到不存在的地址。因此，服务调用端需要有相应的容错处理，比如重新发起一次server选择并调用。
　　对于当前轮询的位置变量pos，为了保证服务器选择的顺序性，需要在操作时对其加锁，使得同一时刻只能有一个线程可以修改pos的值，否则当pos变量被并发修改，则无法保证服务器选择的顺序性，甚至有可能导致keyList数组越界。
　　轮询法的优点在于：试图做到请求转移的均衡。
　　轮询法的缺点在于：为了做到请求转移的均衡，必须付出相当大的代价，因为为了保证pos变量修改的互斥性，需要引入重量级的悲观锁synchronized，这将会导致该段轮询代码的并发吞吐量发生明显的下降。
　　随机（Random）法
　　通过系统随机函数，根据后端服务器列表的大小值来随机选择其中一台进行访问。由概率统计理论可以得知，随着调用量的增大，其实际效果越来越接近于平均分配流量到每一台后端服务器，也是轮询的效果。
　　随机法的代码实现大致如下：
　　public class Random
　　{
　　public static String getServer()
　　{
　　// 重建一个Map，避免服务器的上下线导致的并发问题
　　Map<String， Integer> serverMap =
　　new HashMap<String， Integer>();
　　serverMap.putAll(IpMap.serverWeightMap);
　　// 取得Ip地址List
　　Set<String> keySet = serverMap.keySet();
　　ArrayList<String> keyList = new ArrayList<String>();
　　keyList.addAll(keySet);
　　java.util.Random random = new java.util.Random();
　　int randomPos = random.nextInt(keyList.size());
　　return keyList.get(randomPos);
　　}
　　}
　　整体代码思路和轮询法一致，先重建serverMap，再获取到server列表。在选取server的时候，通过Random的nextInt方法取0~keyList.size()区间的一个随机值，从而从服务器列表中随机获取到一台服务器地址进行返回。基于概率统计的理论，吞吐量越大，随机算法的效果越接近于轮询算法的效果。
　　源地址哈希（Hash）法
　　源地址哈希的思想是获取客户端访问的IP地址值，通过哈希函数计算得到一个数值，用该数值对服务器列表的大小进行取模运算，得到的结果便是要访问的服务器的序号。源地址哈希算法的代码实现大致如下：
　　public class Hash
　　{
　　public static String getServer()
　　{
　　// 重建一个Map，避免服务器的上下线导致的并发问题
　　Map<String， Integer> serverMap =
　　new HashMap<String， Integer>();
　　serverMap.putAll(IpMap.serverWeightMap);
　　// 取得Ip地址List
　　Set<String> keySet = serverMap.keySet();
　　ArrayList<String> keyList = new ArrayList<String>();
　　keyList.addAll(keySet);
　　// 在Web应用中可通过HttpServlet的getRemoteIp方法获取
　　String remoteIp = "127.0.0.1";
　　int hashCode = remoteIp.hashCode();
　　int serverListSize = keyList.size();
　　int serverPos = hashCode % serverListSize;
　　return keyList.get(serverPos);
　　}
　　}
　　前两部分和轮询法、随机法一样不说了，差别在于路由选择部分。通过客户端的ip也是remoteIp，取得它的Hash值，对服务器列表的大小取模，结果便是选用的服务器在服务器列表中的索引值。