Spring Cloud Eureka

2019-12-27

Eureka

Spring Cloud Eureka 是 Spring Cloud Netflix 微服务套件中的一部分，它基于 Netflix Eureka 做了二次封装,主要负责完成微服务架构中的服务治理功能

服务治理

服务治理可以说是微服务架构中最为核心和基础的模块，它主要用来实现各个微服务实例的自动化注册与发现。

需要的原因：静态配置难以维护

服务注册:

在服务治理框架中，通常都会构建一个注册中心， 每个服务单元向注册中心登记自己提供的服务，将主机与端口号、版本号、通信协议等一些附加信息告知注册中心，注册中心按服务名分类组织服务清单。

比如，我们有两个提供服务A的进程分别运行于 192.168.0.100:8000和192.168.0.101:8000位置上，
另外还有三个提供服务B的进程分别运行千192.168.0.100:9000 、192.168.0.101:9000、 192.168.0.102:9000位置上。当这些进程均启动，并向注册中心注册自己的服务之后，注册中心就会维护类一个如下类似的服务清单。

另外， 服务注册中心还需要以心跳的方式去监测清单中的服务是否可用，若不可用需要从服务清单中剔除，达到排除故障服务的效果

服务发现:

服务间的调用不再通过指定具体的实例地址来实现，而是通过向服务名发起请求调用实现。因此，调用方需要向服务注册中心咨询服务，并获取所有服务的实例清单，以实现对具体服务实例的访问。比如，现有服务C希望调用服务A, 服务C就需要向注册中心发起咨询服务请求，服务注册中心就会将服务A的位置清单返回给服务C, 如按上例服务A的情况，C便获得了服务A的两个可用位置 192.168.0.100:8000和192.168.0.101:8000。当服务C要发起调用的时候，便从该清单中以某种轮询策略取出一个位置来进行服务调用，这就是后续我们将会介绍的客户端负载均衡。

实际的框架为了性能等因素， 不会采用每次都向服务注册中心获取服务的方式，并且不同的应用场景在缓存和服务剔除等机制上也会有一些不同的实现策略。

Netflix Eureka:
SpringCloud Eureka, 使用Netflix Eureka来实现服务注册与发现，它既包含了服务端组件，也包含了客户端组件，并且服务端与客户端均采用Java编写。

Eureka服务端：我们也称为服务注册中心。它同其他服务注册中心一样，支持高可用配置。它依托于强一致性提供良好的服务实例可用性，可以应对多种不同的故障场景。当集群分片出现故障时，Eureka就转入自我保护模式，允许故障期间继续提供服务，当恢复运行时，集群中的其他分片会把他们的状态状态再次同步过来
Eureka客户端：主要处理服务的注册与发现。客户端服务通过注解和参数配置的方式，嵌入在客户端应用程序的代码中，在应用程序运行时，Eureka客户端向注册中心注册自身提供的服务并周期性地发送心跳来更新它的服务租约。同时，它也能从服务端查询当前注册的服务信息并把它们缓存到本地并周期性地刷新服务状态

搭建注册中心

也就是服务端，添加依赖

<dependency>
	<groupId>org.springframework.cloud</groupId>
	<artifactId>spring-cloud-starter-eureka-server</artifactId>
</dependency>
<dependencyManagement>
	<dependencies>
		<dependency>
			<groupId>org.springframework.cloud</groupId>
			<artifactId>spring-cloud-dependencies</artifactId>
			<version>Brixton.SR5</version>
			<type>pom</type>
			<scope>import</scope>
		</dependency>
	</dependencies>
</dependencyManagement>

代码：

通过注解@EnableEurekaServer开启注册中心的能力

@EnableEurekaServer
@SpringBootApplication
public class Application {

	public static void main(String[] args) {
		new SpringApplicationBuilder(Application.class).web(true).run(args);
	}

}

EnableEurekaServer：通过 @EnableEurekaServer 注解启动一个服务注册中心提供给其他应用进行注册。
在默认设置下，该服务注册中心也会将自己作为客户端来尝试注册它自己，所以我们需要禁用它的客户端注册行为，配置：

server.port=l111
eureka.instance.hostname=localhost
# 由于该应用为注册中心，所以设置为 false, 代表不向注册中心注册自己
eureka.client.register-with-eureka=false
# 由于注册中心的职责就是维护服务实例，它并不需要去检索服务， 所以也设置为 false
eureka.client.fetch-registry=false
eureka.client.serviceUrl.defaultZone=http://${eureka.instance.hostname}:${server.port}/eureka/

通过http://localhost:1111/就能访问注册中心查询注册信息

@EnableEurekaServer 的实现

可以看到EnableEurekaServer本身也有EnableDiscoveryClient注解，自注册的能力就是来自于这里

@EnableDiscoveryClient
@Target(ElementType.TYPE)
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Import(EurekaServerMarkerConfiguration.class)
public @interface EnableEurekaServer {

}

@EnableDiscoveryClient的注解如下：

@Target(ElementType.TYPE)
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
// 通过该Selector加载了两个类
@Import(EnableDiscoveryClientImportSelector.class)
public @interface EnableDiscoveryClient {

	/**
	 * If true, the ServiceRegistry will automatically register the local server.
	 */
	boolean autoRegister() default true;
}
public class EnableDiscoveryClientImportSelector
		extends SpringFactoryImportSelector<EnableDiscoveryClient> {

	@Override
	public String[] selectImports(AnnotationMetadata metadata) {
    // 父类会返回org.springframework.cloud.netflix.eureka.EurekaDiscoveryClientConfiguration
		String[] imports = super.selectImports(metadata);
    // getAnnotationClass 返回的是EnableDiscoveryClient，也就是添加Selector注解的类
		AnnotationAttributes attributes = AnnotationAttributes.fromMap(
				metadata.getAnnotationAttributes(getAnnotationClass().getName(), true));
    // EnableDiscoveryClient的autoRegister属性默认是true的
		boolean autoRegister = attributes.getBoolean("autoRegister");

		if (autoRegister) {
			List<String> importsList = new ArrayList<>(Arrays.asList(imports));
			importsList.add("org.springframework.cloud.client.serviceregistry.AutoServiceRegistrationConfiguration");
			imports = importsList.toArray(new String[0]);
		}
    // 返回两个类并注册到Spring，分别是EurekaDiscoveryClientConfiguration和AutoServiceRegistrationConfiguration
		return imports;
	}

注册服务提供者

模块名：hello-service

引入pom:

<dependencies>
	<dependency>
		<groupId>org.springframework.boot</groupId>
		<artifactId>spring-boot-starter-web</artifactId>
	</dependency>

	<dependency>
		<groupId>org.springframework.boot</groupId>
		<artifactId>spring-boot-starter-test</artifactId>
		<scope>test</scope>
	</dependency>

	<dependency>
		<groupId>org.springframework.cloud</groupId>
		<artifactId>spring-cloud-starter-eureka</artifactId>
	</dependency>

	<dependency>
		<groupId>org.springframework.cloud</groupId>
		<artifactId>spring-cloud-starter-hystrix</artifactId>
	</dependency>

	<dependency>
		<groupId>org.springframework.boot</groupId>
		<artifactId>spring-boot-starter-actuator</artifactId>
	</dependency>

	<dependency>
		<groupId>com.didispace</groupId>
		<artifactId>hello-service-api</artifactId>
		<version>0.0.1-SNAPSHOT</version>
	</dependency>
</dependencies>

<dependencyManagement>
	<dependencies>
		<dependency>
			<groupId>org.springframework.cloud</groupId>
			<artifactId>spring-cloud-dependencies</artifactId>
			<version>Brixton.SR5</version>
			<type>pom</type>
			<scope>import</scope>
		</dependency>
	</dependencies>
</dependencyManagement>

Controller:

DiscoveryClient注入，能够获取到服务端的相关信息

@RestController
public class HelloController {

	private final Logger logger = Logger.getLogger(getClass());

  // 引入DiscoveryClient
	@Autowired
	private DiscoveryClient client;

	@RequestMapping(value = "/hello", method = RequestMethod.GET)
	public String hello() throws Exception {
    // 获取服务实例
		ServiceInstance instance = client.getLocalServiceInstance();

		// 测试超时触发断路器
//		int sleepTime = new Random().nextInt(3000);
//		logger.info("sleepTime:" + sleepTime);
//		Thread.sleep(sleepTime);

		logger.info("/hello, host:" + instance.getHost() + ", service_id:" + instance.getServiceId());
		return "Hello World";
	}

	@RequestMapping(value = "/hello1", method = RequestMethod.GET)
	public String hello(@RequestParam String name) {
		ServiceInstance instance = client.getLocalServiceInstance();
		logger.info("/hello1, host:" + instance.getHost() + ", service_id:" + instance.getServiceId());
		return "Hello " + name;
	}

	@RequestMapping(value = "/hello2", method = RequestMethod.GET)
	public User hello(@RequestHeader String name, @RequestHeader Integer age) {
		ServiceInstance instance = client.getLocalServiceInstance();
		logger.info("/hello2, host:" + instance.getHost() + ", service_id:" + instance.getServiceId());
		return new User(name, age);
	}

	@RequestMapping(value = "/hello3", method = RequestMethod.POST)
	public String hello(@RequestBody User user) {
		ServiceInstance instance = client.getLocalServiceInstance();
		logger.info("/hello3, host:" + instance.getHost() + ", service_id:" + instance.getServiceId());
		return "Hello "+ user.getName() + ", " + user.getAge();
	}

}

主类：

@EnableHystrix
@EnableDiscoveryClient
@SpringBootApplication
public class HelloApplication {

	public static void main(String[] args) {
		SpringApplication.run(HelloApplication.class, args);
	}

}

EnableDiscoveryClient:激活 Eureka 中的DiscoveryClient 实现（自动化配置，创建 DiscoveryClient 接口针对 Eureka 客户端的 EurekaDiscoveryClient 实例
配置：

1
2
3

# 服务的名称
spring.application.name=hello-service
eureka.client.serviceUrl.defaultZone=http://localhost:1111/eureka/

启动后就能在server端看到注册信息，以及请求信息

高可用注册中心

Eureka Server的设计一开始就考虑了高可用问题，在Eureka的服务治理设计中，所有节点即是服务提供方，也是服务消费方，服务注册中心也不例外。
Eureka高可用实际上就是将自己作为服务向其他服务注册中心注册自己，这样就可以形成一组互相注册的服务注册中心，以实现服务清单的互相同步，达到高可用的效果。因此需要开启上面register-with-eureka置为false的配置
下面是一个双节点注册中心集群的案例：
创建两个配置文件，一个application-peer1.properties：

spring.application.name=eureka-server
server.port=1111
eureka.instance.hostname=peer1
# 执行了peer2 
2eureka.client.serviceUrl.defaultZone=http://peer2:1112/eureka/

另一个application-peer2.properties：

spring.application.name=eureka-server2
server.port=1112
eureka.instance.hostname=peer2
# 指向了1
eureka.client.serviceUrl.defaultZone=http://peer1:1111/eureka/

本地测试，需要配置peer1和peer2的host，也就是修改hosts文件:

1 2	127.0.0.1 peerl 127.0.0.1 peer2

然后通过spring.profiles.active属性来分别启动peerl和peer2(也可以新建两个模块来执行)

1 2	java -jar eureka-server-1.0.0.jar --spring.profiles.active=peerl java -jar eureka-server-1.0.0.jar --spring.profiles.active=peer2

启动后访问他们的注册中心，会发现registered-replicas有另个一注册中心。

服务提供方修改

在Controller服务中需要修改配置才能将服务注册到集群中：

1	eureka.client.serviceUrl.defaultZone=http://peerl:llll/eureka/,http://peer2:lll2/eureka/

如我们不想使用主机名来定义注册中心的地址，也可以使用IP地址的形式，但是需要在配置文件中增加配置参数eureka.instance.prefer-iip-address= true, 该值默认为false。

启动服务端后，注册中心的会新增服务

在启动一个hello-service

服务发现和消费

我们已经有了服务注册中心和服务提供者，下面就来尝试构建一个服务消费者，它主要完成两个目标：

发现服务以及消费服务

其中，服务发现的任务由eEureka的客户端完成，而服务消费的任务由Ribbonb完成 。

Ribbon是一个基于HTTP和TCP的客户端负载均衡器。它可以在通过客户端中配置的ribbonServerList服务端列表去轮询访问以达到均衡负载的作用。

当Ribbon与Eureka联合使用时，Ribbon的服务实例清单RibbonServerList会被DiscoveryEnabledNIWSServerList重写，扩展成从Eureka注册中心中获取服务端列表(不是手动指定一个list)。

同时它也会用 NIWSDiscoveryPing来取代IPing, 它将职责委托给Eureka 来确定服务端是否已经启动

下面是一个简单的示例：
通过 java -jar命令行的方式来启动两个不同端口的hello-service, 具体如下(同样也可以新建两个不同的模块运行):

1 2	java -jar hello-service-0.0.1-SNAPSHOT.jar --server.port=8081 java -jar hello-service-0.0.1-SNAPSHOT.jar --server.port=8082

新建一个consumer服务,加入ribbon服务

<dependencies>
	<dependency>
		<groupId>org.springframework.boot</groupId>
		<artifactId>spring-boot-starter-web</artifactId>
	</dependency>

	<dependency>
		<groupId>org.springframework.boot</groupId>
		<artifactId>spring-boot-starter-test</artifactId>
		<scope>test</scope>
	</dependency>

	<dependency>
		<groupId>org.springframework.cloud</groupId>
		<artifactId>spring-cloud-starter-eureka</artifactId>
	</dependency>

	<dependency>
		<groupId>org.springframework.cloud</groupId>
		<artifactId>spring-cloud-starter-ribbon</artifactId>
	</dependency>

	<dependency>
		<groupId>org.springframework.boot</groupId>
		<artifactId>spring-boot-starter-actuator</artifactId>
	</dependency>

	<dependency>
		<groupId>org.springframework.cloud</groupId>
		<artifactId>spring-cloud-starter-hystrix</artifactId>
	</dependency>

	<dependency>
		<groupId>org.springframework.cloud</groupId>
		<artifactId>spring-cloud-netflix-hystrix-amqp</artifactId>
	</dependency>
</dependencies>

主类配置：

配置负载均衡的RestTemplate

@EnableCircuitBreaker
@EnableDiscoveryClient
@SpringBootApplication
public class ConsumerApplication {

	@Bean
	@LoadBalanced
	RestTemplate restTemplate() {
		return new RestTemplate();
	}
	public static void main(String[] args) {
		SpringApplication.run(ConsumerApplication.class, args);
	}

}

可以添加@LoadBalanced：开启客户端负载均衡

消费类ConsumerController：

@RestController
public class ConsumerController {

    @Autowired
    HelloService helloService;

    @RequestMapping(value = "/ribbon-consumer", method = RequestMethod.GET)
    public String helloConsumer() {
        return helloService.hello();
    }

}
@Service
public class HelloService {

    private final Logger logger = Logger.getLogger(getClass());

    @Autowired
    RestTemplate restTemplate;

    public String hello() {
        long start = System.currentTimeMillis();

        StringBuilder result = new StringBuilder();

        // 显式的通过服务名访问
        result.append(restTemplate.getForEntity("http://HELLO-SERVICE/hello", String.class).getBody()).append("<br>");
        result.append(restTemplate.getForEntity("http://HELLO-SERVICE/hello1?name={1}", String.class, "didi").getBody()).append("<br>");
      	//...
    }
}

启动消费类，这时候注册中心打印：

2020-03-12 22:33:57.522  INFO 28328 --- [nio-1112-exec-1] c.n.e.registry.AbstractInstanceRegistry  : Registered instance RIBBON-CONSUMER/guanhangdembp:ribbon-consumer:9000 with status UP (replication=true)

访问：http://localhost:9000/ribbon-consumer

服务1打印：

1	2020-03-12 22:35:19.098 INFO 28462 --- [nio-8082-exec-1] com.didispace.web.HelloController : /hello, host:guanhangdembp, service_id:hello-service

再次访问，服务2出现打印，说明是通过ribbon进行了负载均衡。注册中心情况：

Eureka详解

Eureka服务治理体系的三个核心角色：

服务注册中心：Eureka 提供的服务端，提供服务注册与发现的功能，也就是在上一节中我们实现的eureka-server

服务提供者：提供服务的应用，可以是 Spring Boot 应用，也可以是其他技术平台且遵循 Eureka 通信机制的应用

服务消费者：消费者应用从服务注册中心获取服务列表，从而使消费者可以知道去何处调用其所需要的服务。可以使用Ribbon和Feign来实现服务消费

服务治理机制

服务治理体系的几个重要的元素：

服务注册中心构成了高可用集群

两个服务提供者分别注册到连个不同的服务中心上

下面是从服务注册到服务调用，各个元素所涉及的一些重要通信行为

服务提供者:

服务注册：“服务提供者 ” 在启动的时候会通过发送REST请求的方式将自己注册到EurekaServer上。同时带上了自身服务的一些元数据信息。Eureka Server接收到这个REST请求之后，将元数据信息存储在一个双层结构Map中，其中第一层的key是服务名，第二层的key是具体服务的实例名

服务同步：

两个服务提供者分别注册到了两个不同的服务注册中心上。由于服务注册中心之间因互相注册为服务，当服务提供者发送注册请求到一个服务注册中心时，它会将该请求转发。给集群中相连的其他注册中心，从而实现注册中心之间的服务同步。两个服务提供者的服务信息就可以通过这两台服务注册中心中的任意一台获取到

服务续约：

在注册完服务之后，服务提供者会维护一个心跳用来持续告诉EurekaSe1-ver: “我还活着 ”，以防止Eureka Server 的 “ 剔除任务 ” 将该服务实例从服务列表中排除出去，我们称该操作为服务续约(Renew)。

服务续约有两个重要的属性：

1
2

eureka.instance.lease-renewal-interval-in-seconds=30 # 用于定义服务续约任务的调用间隔时间，默认为30秒
eureka.instance.lease-expiration-duration-in-seconds=90 # 参数用于定义服务失效的时间，默认为90秒

服务消费者

获取服务：

当我们启动服务消费者的时候，它会发送一个REST请求给服务注册中心，来获取上面注册的服务清单。为了性能考虑， Eureka Server会维护一份只读的服务清单来返回给客户端，同时该缓存清单会每隔30秒更新一次。获取服务是服务消费者的基础，所以必须确保eureka.client.fetch-registry=true参数没有被修改成false, 该值默认为true。若希望修改缓存清单的更新时间，可以通过 eureka.client.registry-fetch-interval-seconds =30参数进行修改，该参数默认值为30, 单位为秒

服务调用：

服务消费者在获取服务清单后，通过服务名可以获得具体提供服务的实例名和该实例的元数据信息。因为有这些服务实例的详细信息，所以客户端可以根据自己的需要决定具体调用哪个实例，在ribbon中会默认采用轮询的方式进行调用，从而实现客户端的负载均衡。

Eureka中有Region和Zone的概念，一个Region中可以包含多个Zone, 每个服务客户端需要被注册到一个Zone中，所以每个客户端对应一个Region和一个Zone。在进行服务调用的时候，优先访问同处一个 Zone 中的服务提供方，若访问不到，就访问其他的Zone

服务下线：

当服务实例进行正常的关闭操作时，它会触发一个服务下线的REST请求给Eureka Server, 告诉服务注册中心：“我要下线了 ”。服务端在接收到请求之后，将该服务状态置为下线(DOWN), 并把该下线事件传播出去

服务注册中心：

失效剔除：
有时候由于服务出现故障，并未受到服务下线的请求。Eureka Server在启动的时候会创建一个定时任务，
默认每隔一段时间（默认为60秒）将当前清单中超时（默认为90秒）没有续约的服务剔除出去

自我保护：

我们经常在服务中心看到红色警告信息，如下图所示。

实际上是触发了Eureka Server的自我保护机制。EurekaServer在运行期间，会统计心跳失败的比例在15分钟之内是否低于85%，如果出现，Eureka Server会将当前的实例注册信息保护起来，让这些实例不会过期，尽可能保护这些注册信息。但是，在这段保护期间内实例若出现问题，那么客户端很容易拿到实际已经不存在的服务实例，会出现调用失败的清况，所以客户端必须要有容错机制，比如可以使用请求重试、断路器等机制。可以通过eureka.server.enable-self-preservation=false来关闭自我保护

源码分析

我们将服务注册到Eureka服务器，主要做了两件事情：

添加@EnableDiscoveryClient注解

配置eureka.client.serviceUrl.defaultZone指定服务注册中心的位置

EnableDiscoveryClient的源码如下：

@Target({ElementType.TYPE})
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
@Import({EnableDiscoveryClientImportSelector.class})
public @interface EnableDiscoveryClient {
}

从该注解的注释中我们可以知道，它主要用来开启DiscoveryClient 的实例。通过搜索DiscoveryClient , 我们可以发现有一个类和一个接口。通过梳理可以得到如下图所示的关系

左边的DiscoveryClient是Spring Cloud接口，它定义了用来发现服务的常用抽象方法，通过该接口可以有效地屏蔽服务治理的实现细节。所以使用Spring Cloud构建的微服务应用可以方便地切换不同服务治理框架。

这里用的版本是1.3 和书中不一致

public interface DiscoveryClient {

	/**
	 * A human readable description of the implementation, used in HealthIndicator
	 * @return the description
	 */
	String description();

	/**
	 * @deprecated use the {@link org.springframework.cloud.client.serviceregistry.Registration} bean instead
	 *
	 * @return ServiceInstance with information used to register the local service
	 */
	@Deprecated
	ServiceInstance getLocalServiceInstance();

	/**
	 * Get all ServiceInstances associated with a particular serviceId
	 * @param serviceId the serviceId to query
	 * @return a List of ServiceInstance
	 */
	List<ServiceInstance> getInstances(String serviceId);

	/**
	 * @return all known service ids
	 */
	List<String> getServices();

}

EurekaDiscoveryClient是对该接口的实现。该实现又依赖com.netflix.discovery.EurekaClient

主要看到上面有两个DiscoveryClient，一个是接口，一个类，分别来自于spring cloud和netflix

Spring cloud主要提供接口，服务注册和查询的实现来自于netflix包

com.netflix.discovery.EurekaClient实现类是com.netflix.discovery.DiscoveryClient，服务发现主要靠这个类，它提供的能力：

－向Eureka Server注册服务实例

－向Eureka Server服务租约

－当服务关闭期间，向Eureka Server取消租约

－查询Eureka Server中的服务实例列表

@RequiredArgsConstructor
public class EurekaDiscoveryClient implements DiscoveryClient {

	public static final String DESCRIPTION = "Spring Cloud Eureka Discovery Client";
  // 来源于netflix
	private final EurekaInstanceConfig config;
  // 来源于netflix，
	private final EurekaClient eurekaClient;

	@Override
	public String description() {
		return DESCRIPTION;
	}

	@Override
	public ServiceInstance getLocalServiceInstance() {
		return new ServiceInstance() {
			@Override
			public String getServiceId() {
				return EurekaDiscoveryClient.this.config.getAppname();
			}

			@Override
			public String getHost() {
				return EurekaDiscoveryClient.this.config.getHostName(false);
			}

			@Override
			public int getPort() {
				return EurekaDiscoveryClient.this.config.getNonSecurePort();
			}

			@Override
			public boolean isSecure() {
				return EurekaDiscoveryClient.this.config.getSecurePortEnabled();
			}

			@Override
			public URI getUri() {
				return DefaultServiceInstance.getUri(this);
			}

			@Override
			public Map<String, String> getMetadata() {
				return EurekaDiscoveryClient.this.config.getMetadataMap();
			}
		};
	}

	@Override
	public List<ServiceInstance> getInstances(String serviceId) {
		List<InstanceInfo> infos = this.eurekaClient.getInstancesByVipAddress(serviceId,
				false);
		List<ServiceInstance> instances = new ArrayList<>();
		for (InstanceInfo info : infos) {
			instances.add(new EurekaServiceInstance(info));
		}
		return instances;
	}

	public static class EurekaServiceInstance implements ServiceInstance {
		private InstanceInfo instance;
    // 。。。
	}

	@Override
	public List<String> getServices() {
		Applications applications = this.eurekaClient.getApplications();
		if (applications == null) {
			return Collections.emptyList();
		}
		List<Application> registered = applications.getRegisteredApplications();
		List<String> names = new ArrayList<>();
		for (Application app : registered) {
			if (app.getInstances().isEmpty()) {
				continue;
			}
			names.add(app.getName().toLowerCase());

		}
		return names;
	}

}

defaultZone属性的获取

通过追踪defaultZone配置，发现该配置项在com.netflix.discovery.endpoint.EndpointUtils中使用

eureka:
  client: #客户端注册进eureka服务列表内
    service-url：
    	defaultZone:

EndpointUtils代码：

Zone名称的配置：可以通过 eureka.client.availability-zones

public static List<String> getServiceUrlsFromConfig(EurekaClientConfig clientConfig, String instanceZone, boolean preferSameZone) {
  List<String> orderedUrls = new ArrayList<String>();
  // 获取Region，一个微服务只有一个Region
  String region = getRegion(clientConfig);
  // 获取AZ，默认的zone是defaultZone，这个在代码里写死的，这也是我们defaultZone的配置由来
  String[] availZones = clientConfig.getAvailabilityZones(clientConfig.getRegion());
  if (availZones == null || availZones.length == 0) {
    availZones = new String[1];
    availZones[0] = DEFAULT_ZONE;
  }
  logger.debug("The availability zone for the given region {} are {}", region, Arrays.toString(availZones));
  // 获取该服务所在的zone在数组中的偏移，instanceZone是本服务的zone
  int myZoneOffset = getZoneOffset(instanceZone, preferSameZone, availZones);
  // 获取本服务所在zone上的eureka server地址
  // 这里不是调用的netflix的DefaultEurekaClientConfig#getEurekaServerServiceUrls，而是Spring自己的
  //EurekaClientConfigBean#getEurekaServerServiceUrls
  List<String> serviceUrls = clientConfig.getEurekaServerServiceUrls(availZones[myZoneOffset]);
  if (serviceUrls != null) {
    orderedUrls.addAll(serviceUrls);
  }
  int currentOffset = myZoneOffset == (availZones.length - 1) ? 0 : (myZoneOffset + 1);
  while (currentOffset != myZoneOffset) {
    serviceUrls = clientConfig.getEurekaServerServiceUrls(availZones[currentOffset]);
    if (serviceUrls != null) {
      orderedUrls.addAll(serviceUrls);
    }
    if (currentOffset == (availZones.length - 1)) {
      currentOffset = 0;
    } else {
      currentOffset++;
    }
  }

  if (orderedUrls.size() < 1) {
    throw new IllegalArgumentException("DiscoveryClient: invalid serviceUrl specified!");
  }
  return orderedUrls;
}

Region,Zone

可以看到，上面的代码依次加载了两个内容，第一个是Region，第二个是Zone

我们可以看到它从配置中读取了一个Region返回，所以一个微服务应用只可以属于一个Region, 如果不特别配置，默认为default。若我们要自己设置,可以通过eureka.client.region属性来定义。

Region的默认Zone是defaultZone，也是参数eureka.client.serviceUrl.defaultZone的由来。Region和Zone是一对多的关系

要为应用指定Zone, 可以通过eureka.client.availability-zones属性来进行设置

获取Region和Zone后，接下来是获取具体地址：

1 2	int myZoneOffset = getZoneOffset(instanceZone, preferSameZone, availZones); List<String> serviceUrls = clientConfig.getEurekaServerServiceUrls(availZones[myZoneOffset]);

getEurekaServerServiceUrls的具体实现org.springframework.cloud.netflix.eureka.EurekaClientConfigBean：

EurekaClientConfigBean是配置文件对应的配置类，它实现了EurekaClientConfig接口，关联前缀是eureka.client的配置

public List<String> getEurekaServerServiceUrls(String myZone) {
  // 有限获取自己Zone的服务器
  String serviceUrls = this.serviceUrl.get(myZone);
  if (serviceUrls == null || serviceUrls.isEmpty()) {
    serviceUrls = this.serviceUrl.get(DEFAULT_ZONE);
  }
  if (!StringUtils.isEmpty(serviceUrls)) {
    final String[] serviceUrlsSplit = 
        //这个方法是用逗号才分，因此defaultZone可以配置多个
        StringUtils.commaDelimitedListToStringArray(serviceUrls);
    List<String> eurekaServiceUrls = new ArrayList<>(serviceUrlsSplit.length);
    for (String eurekaServiceUrl : serviceUrlsSplit) {
      if (!endsWithSlash(eurekaServiceUrl)) {
        eurekaServiceUrl += "/";
      }
      eurekaServiceUrls.add(eurekaServiceUrl);
    }
    return eurekaServiceUrls;
 }

当我们在微服务应用中使用Ribbon来实现服务调用时，对于 Zone 的设置可以在负载均衡时实现区域亲和特性： Ribbon 的默认策略会优先访问同客户端处于一个Zone中的服务端实例，只有当同一个Zone中没有可用服务端实例的时候才会访问其他 Zone 中的实例。所以通过 Zone 属性的定义，配合实际部署的物理结构，我们就可以有效地设计出对区域性故障的容错集群。

服务注册、续约、心跳的实现

前面提到过EurekaDiscoveryClient集成了EurekaClient，我们看下其实现类com.netflix.discovery.DiscoveryClient的实现，在构造函数中有一个initScheduledTasks方法：

主要关注几个if，分别创建几个定时任务

private void initScheduledTasks() {
  if (clientConfig.shouldFetchRegistry()) {
    // registryFetchIntervalSeconds 标识多久从注册中心拉取信息
    // 来源于eureka.client.registry-fetch-interval-seconds默认为30s，表示30S更新一次注册信息
    int registryFetchIntervalSeconds = clientConfig.getRegistryFetchIntervalSeconds();
    // 指数衰减
    int expBackOffBound = clientConfig.getCacheRefreshExecutorExponentialBackOffBound();
    // 启动定时任务刷新本地缓存
    scheduler.schedule(
      new TimedSupervisorTask(
        "cacheRefresh",
        scheduler,
        cacheRefreshExecutor,
        registryFetchIntervalSeconds,
        TimeUnit.SECONDS,
        expBackOffBound,
        new CacheRefreshThread()
      ),
      registryFetchIntervalSeconds, TimeUnit.SECONDS);
  }
  // 判读是否注册到Eureka，如果注册，定时发送心跳
  if (clientConfig.shouldRegisterWithEureka()) {
    // 实际上是获取参数eureka.instance.lease-renewal-interval-in-seconds=30，标识心跳的间隔
    // LeaseInfo还有一个属性eureka.instance.lease-expiration-duration-in-seconds=90，表示心跳的超时时间，超过时间，移出实例，肯定要大于30S的
    int renewalIntervalInSecs = instanceInfo.getLeaseInfo().getRenewalIntervalInSecs();
    // 获取指数回退算法的参数
    int expBackOffBound = clientConfig.getHeartbeatExecutorExponentialBackOffBound();
    logger.info("Starting heartbeat executor: " + "renew interval is: " + renewalIntervalInSecs);

    // 心跳定时任务调度
    scheduler.schedule(
      new TimedSupervisorTask(
        "heartbeat",
        scheduler,
        heartbeatExecutor,
        renewalIntervalInSecs,
        TimeUnit.SECONDS,
        expBackOffBound,
        new HeartbeatThread()
      ),
      renewalIntervalInSecs, TimeUnit.SECONDS);

    // 将本地应用信息注册到到远程服务
    instanceInfoReplicator = new InstanceInfoReplicator(
      this,
      instanceInfo,
      clientConfig.getInstanceInfoReplicationIntervalSeconds(),
      2); // burstSize
    // 创建本地信息状态变化监听器
    statusChangeListener = new ApplicationInfoManager.StatusChangeListener() {
      @Override
      public String getId() {
        return "statusChangeListener";
      }

      @Override
      public void notify(StatusChangeEvent statusChangeEvent) {
        if (InstanceStatus.DOWN == statusChangeEvent.getStatus() ||
            InstanceStatus.DOWN == statusChangeEvent.getPreviousStatus()) {
          // log at warn level if DOWN was involved
          logger.warn("Saw local status change event {}", statusChangeEvent);
        } else {
          logger.info("Saw local status change event {}", statusChangeEvent);
        }
        // 如果本地信息发生变化，
        instanceInfoReplicator.onDemandUpdate();
      }
    };

    if (clientConfig.shouldOnDemandUpdateStatusChange()) {
      applicationInfoManager.registerStatusChangeListener(statusChangeListener);
    }
    //启动更新器
    instanceInfoReplicator.tart(clientConfig.getInitialInstanceInfoReplicationIntervalSeconds());
  } else {
    logger.info("Not registering with Eureka server per configuration");
  }
}

TimedSupervisorTask是服务获取定时任务，可以传Runnalble来实现具体的操作，并统计相关的信息

public void run() {
  Future future = null;

  try {
    // 通过内部的一个线程池执行任务，该任务实现在DiscoveryClient.CacheRefreshThread
    future = this.executor.submit(this.task);
    this.threadPoolLevelGauge.set((long)this.executor.getActiveCount());
    future.get(this.timeoutMillis, TimeUnit.MILLISECONDS);
    this.delay.set(this.timeoutMillis);
    this.threadPoolLevelGauge.set((long)this.executor.getActiveCount());
  } catch (TimeoutException var12) {
    logger.error("task supervisor timed out", var12);
    this.timeoutCounter.increment();
    long currentDelay = this.delay.get();
    long newDelay = Math.min(this.maxDelay, currentDelay * 2L);
    this.delay.compareAndSet(currentDelay, newDelay);
  } catch (RejectedExecutionException var13) {
    logger.error("task supervisor rejected the task", var13);
    this.rejectedCounter.increment();
  } catch (Throwable var14) {
    logger.error("task supervisor threw an exception", var14);
    this.throwableCounter.increment();
  } finally {
    if (future != null) {
      future.cancel(true);
    }
    //继续执行定时任务
    this.scheduler.schedule(this, this.delay.get(), TimeUnit.MILLISECONDS);
  }

}

心跳的定时任务是通过HeartbeatThread来实现的：

下面代码可以看到这就是服务端和注册中心进行心跳通信维持租约，维持心跳的方法是renew

private class HeartbeatThread implements Runnable {
    private HeartbeatThread() {
    }

    public void run() {
        if (DiscoveryClient.this.renew()) {
            //更新上次成功心跳的时间
            DiscoveryClient.this.lastSuccessfulHeartbeatTimestamp = System.currentTimeMillis();
        }

    }
}
boolean renew() {
    try {
        //通过http请求，并传递InstanceInfo，包含了服务的元信息
        EurekaHttpResponse<InstanceInfo> httpResponse = 
       this.eurekaTransport.registrationClient.sendHeartBeat(this.instanceInfo.getAppName(), this.instanceInfo.getId(), this.instanceInfo, (InstanceStatus)null);
        logger.debug("{} - Heartbeat status: {}", "DiscoveryClient_" + this.appPathIdentifier, httpResponse.getStatusCode());
        if (httpResponse.getStatusCode() == 404) {
            //注册次数累加
            this.REREGISTER_COUNTER.increment();
            logger.info("{} - Re-registering apps/{}", "DiscoveryClient_" + this.appPathIdentifier, this.instanceInfo.getAppName());
            return this.register();
        } else {
            return httpResponse.getStatusCode() == 200;
        }
    } catch (Throwable var3) {
        logger.error("{} - was unable to send heartbeat!", "DiscoveryClient_" + this.appPathIdentifier, var3);
        return false;
    }
}

我们再回头看下shouldRegisterWithEureka判断里面的内容，启动上面的心跳任务后，又创建了一个InstanceInfoReplicator，它也是个定时任务。其run方法的实现：

可以看到这里进行了服务注册，注册操作也是通过REST请求的方式进行的。同时，我们能看到发起注册请求的时候，传入了一个com.netflix.appinfo.Instanceinfo对象，该对象就是注册时客户端给服务端的服务的元数据

public void run() {
  try {
    // 刷新实例信息
    discoveryClient.refreshInstanceInfo();

    Long dirtyTimestamp = instanceInfo.isDirtyWithTime();
    if (dirtyTimestamp != null) {
      discoveryClient.register();
      instanceInfo.unsetIsDirty(dirtyTimestamp);
    }
  } catch (Throwable t) {
    logger.warn("There was a problem with the instance info replicator", t);
  } finally {
    Future next = scheduler.schedule(this, replicationIntervalSeconds, TimeUnit.SECONDS);
    scheduledPeriodicRef.set(next);
  }
}

服务获取和服务续约

服务获取的逻辑在shouldFetchRegistry判断内部，它也是一个定时任务，同样使用TimedSupervisorTask，用来定时刷新客户端的服务清单，具体的实现类是CacheRefreshThread。服务续约就是上面的HeartbeatThread，它和服务注册在一个逻辑里面。服务获取的逻辑shouldFetchRegistry的判断逻辑实际就是根据参数：

eureka.client.fetch-registry

来判断，默认为true

服务注册中心处理

上面我么可以看到不管是注册、续约都是通过REST请求来完成的

服务注册中心的请求接受端在com.netflix.eureka.resources.ApplicationResource实现：

最终的register是通过org.springframework.cloud.netflix.eureka.server.InstanceRegistry#register来实现的

该实现先发布注册时间，然后通过父类com.netflix.eureka.registry.AbstractInstanceRegistry#register的注册方法：

public void register(InstanceInfo registrant, int leaseDuration, boolean isReplication) {
    try {
        this.read.lock();
        Map<String, Lease<InstanceInfo>> gMap = (Map)this.registry.get(registrant.getAppName());
        EurekaMonitors.REGISTER.increment(isReplication);
        if (gMap == null) {
            ConcurrentHashMap<String, Lease<InstanceInfo>> gNewMap = new ConcurrentHashMap();
            gMap = (Map)this.registry.putIfAbsent(registrant.getAppName(), gNewMap);
            if (gMap == null) {
                gMap = gNewMap;
            }
        }
        Lease<InstanceInfo> existingLease = (Lease)((Map)gMap).get(registrant.getId());

该类有一个registry变量，其定义如下：

1	private final ConcurrentHashMap<String, Map<String, Lease<InstanceInfo>>> registry = new ConcurrentHashMap();

是一个双层的Map，第一层Map的key是应用名称，第二层Map的key是注册服务信息InstanceInfo的instanceId

配置详解

在Eureka的服务治理体系中，主要分为服务端与客户端两个不同的角色，服务端为服务注册中心，而客户端为各个提供接口的微服务应用。当我们构建了高可用的注册中心之后，该集群中所有的微服务应用和后续将要介绍的一些基础类应用（如配置中心、 API网关等）都可以视作该体系下的一个微服务(Eureka客户端）

服务注册中心也一样，只是高可用环境下的服务注册中心除了作为客户端之外，还为集群中的其他客户端提供了服务注册的特殊功能。所以，Eureka客户端的配置对象存在于所有Eureka服务治理体系下的应用实例中

Eureka客户端的配置主要分为以下两个方面：
• 服务注册相关的配置信息，包括服务注册中心的地址、服务获取的间隔时间、可用区域等。
• 服务实例相关的配置信息，包括服务实例的名称、IP地址、端口号、健康检查路径等

Eureka服务端是一个现成的产品，配置可以参考EurekaServerConfigBean类，这些参数均以eureka.server 作为前缀

注意的是这些配置Bean都是spring coud包中的，但是都实现了netflix中的配置接口

服务注册配置类

即EurekaClientConfigBean,我们看下相关的配置：
指定注册中心：

public static final String DEFAULT_ZONE = "defaultZone";
public static final String PREFIX = "eureka.client";
public static final String DEFAULT_URL = "http://localhost:8761" + DEFAULT_PREFIX

private Map<String, String> serviceUrl = new HashMap<>();

{
//存储了默认值
this.serviceUrl.put(DEFAULT_ZONE, DEFAULT_URL);
}

其他配置一览

服务实例配置

元数据配置：

来源于配置类EurekaInstanceConfigBean，其中大部分是元数据的配置。它是Eureka 客户端在向服务注册中心发送注册请求时，用来描述自身服务信息的对象，其中包含了一些标准化的元数据，比如服务名称、实例名称、实例IP、实例端口等用于服务治理的重要信息；以及一些用千负载均衡策略或是其他特殊用途的自定义元数据信息

EurekaInstanceConfigBean加载了所有配置信息，但是在注册的时候，会包装成InstanctInfo对象发送给Eureka服务端

实例名配置：

即instanceId参数，它是区分同一服务中不同实例的唯一标识，实例名的取名规则可以自定义，这样就能在本地启动多个服务(因为默认是主机名) ：

server.port为0也可以随机分配端口号启动

1	eureka.instance.instanceid={spring.application.name}:{random.int}}

端点配置：

在 InstanceInfo 中，我们可以看到一些 URL 的配置信息，比如 homePageUrl、satusPageUrl、healthCheckUrl 它们分别代表了应用的主页的URL、状态页的URL、健康检查的URL。其中状态页和健康检查的URL在Eureka中默认使用了spring boot actuator模块的/info和/health端点。

为了服务的正常运作，我们必须确保 Eureka 客户端的/health端点在发送元数据的时候，是一个能够被注册中心访问到的地址，否则服务注册中心不会根据应用的健康检查来更改状态（仅当开启了healthcheck 功能时，以该端点信息作为健康检查标准）

大多数情况下，我们并不需要修改这几个 URL 的配置，但是在一些特殊情况下，比如，为应用设置了 context-path, 这时，所有 spring-boot-actuator 模块的监控端点都会增加一个前缀:

1
2
3

management.context-path=/hello
eureka.instance.statusPageUrlPath=${management.context-path}/info
eureka.instance.healthCheckUrlPath=${management.context-path}/health

另外，有时候为了安全考虑， 也有可能会修改 /info 和/health 端点的原始路径。这个时候，我们也需要做一些特殊的配置:

endpoints.info.path=/appinfo
endpoints.health.path=/checkHealth
eureka.instance.statusPageUrlPath=/${endpoints.info.path}
eureka.instance.healthCheckUrlPath=/${endpoints.health.path}

需要注意的是当客户端应用以HTTPS的方式来暴露服务和监控端点时，相对路径的配置方式就无法满足需求了，需要修改成：

1
2
3

eureka.instance.statusPageUrl=https://${eureka.instance.hostname}/info
eureka.instance.healthCheckUrl=https://${eureka.instance.hostname}/health
eureka.instance.homePageUrl=https://${eureka.instance.hostname}/

默认情况下，Eureka依靠客户端心跳的方式来保持服务实例的存活,客户端的健康状态从注册到注册中心开始都会处于 UP状态，除非心跳终止一段时间之后，服务注册中心将其剔除。默认的心跳实现方式可以有效检查客户端进程是否正常运作，但却无法保证客户端应用能够正常提供服务(比如数据库连接失败)

我们可以通过简单的配置，把Eureka客户端的健康检测交给spring-boot-actuator模块的/health端点。实现步骤：

引入actuator模块

引入eureka.client.healthcheck.enabled=true配置

特殊配置参考上面的介绍

其他配置

Ribbon

Spring Cloud Ribbon 是一个基于HTTP和TCP的客户端负载均衡工具，它基于 Netflix Ribbon 实现。通过 Spring Cloud 的封装，可以让我们轻松地将面向服务的REST模板请求自动转换成客户端负载均衡的服务调用。它是一个工具类框架，不需要单独的部署，微服务间的调用，API网关的请求转发等内容，实际都是通过Ribbon来实现的。后面所讲的Feign，也是基于Ribbon实现的工具。

客户端负载均衡

我们通常所说的负载均衡都指的是服务端负载均衡，其中分为硬件负载均衡和软件负载均衡：

硬件：通过在服务器节点之间安装专门用于负载均衡的设备，比如 F5 等

软件：软件负载均衡则是通过在服务器上安装一些具有均衡负载功能或模块的软件来完成请求分发工作，比如Nginx 等

在客户端负载均衡中， 所有客户端节点都维护着自己要访问的服务端清单，而这些服务端的清单来自于服务注册中心，比如上一章我们介绍的Eureka服务端

同服务端负载均衡的架构类似，在客户端负载均衡中也需要心跳去维护服务端清单的健康性，只是这个步骤需要与服务注册中心配合完成

通过Spring CloudRibbon的封装，我们在微服务架构中使用客户端负载均衡调用非常简单，只需要如下两步：

服务提供者只需要启动多个服务实例并注册到一个注册中心或是多个相关联的服务注册中心

服务消费者直接通过调用被 @LoadBalanced 注解修饰过的 RestTemplate 来实现面向服务的接口调用

@EnableDiscoveryClient
@SpringBootApplication
public class ConsumerApplication {

	@Bean
	@LoadBalanced
	RestTemplate restTemplate() {
		return new RestTemplate();
	}
	public static void main(String[] args) {
		SpringApplication.run(ConsumerApplication.class, args);
	}

}

RestTemplate详解

GET请求

对 GET 请求可以通过如下两个方法进行调用实现:

第一种： getForEntity 函数

@Override
public <T> ResponseEntity<T> getForEntity(String url, Class<T> responseType, Object... urlVariables)
    throws RestClientException {

    RequestCallback requestCallback = acceptHeaderRequestCallback(responseType);
    ResponseExtractor<ResponseEntity<T>> responseExtractor = responseEntityExtractor(responseType);
    return execute(url, HttpMethod.GET, requestCallback, responseExtractor, urlVariables);
}

第二种： getForObject 函数

该方法可以理解为对 ge七ForEntity 的进一步封装，它通过 HttpMessageConverterExtractor 对 HTTP 的请求响应体 body内容进行对象转换，实现请求直接返回包装好的对象内容:

1 2	RestTemplate restTemplate = new RestTemplate(); String result = restTemplate.getForObject(uri, String.class);

POST请求

第一种： postForEntity 函数：

RestTemplate restTemplate = new RestTemplate();
User user = new User("didi", 30);
ResponseEntity<String> responseEntity =
restTemplate.postForEntity("http://USER-SERVICE/user", user, String.class);
String body = responseEntity.getBody();

第二种： postForObject函数。

RestTemplate restTemplate = new RestTempla七e();
User user = new User("didi", 20);
String postResult = restTemplate.postForObjec七("http: //USER-SERVICE/user", user,
String.class);

第三种： postForLocation函数。该方法实现了以POST请求提交资源，并返回新资源的URI, 比如下面的例子

1 2	User user = new User("didi", 40); URI responseURI = restTemplate.postForLocation("http://USER-SERVICE/user", user);

PUT请求

RestTempla七e restTemplate = new RestTemplate ();
Long id = 100011;
User user = new User("didi", 40);
restTemplate.put("http://USER-SERVICE/user/{l}", user, id);

DELETE请求

1
2
3

RestTemplate restTemplate = new RestTemplate();
Long id= 10001L;
restTemplate.delete("http://USER-SERVICE/user/{1)", id);

源码分析

从LoadBalancerClient说起

疑问：RestTemplate和Ribbon之间什么联系

前面我们看到RestTemplate通过@LoadBalanced来实现客户端负载均衡，该注解使用到了LoadBalancerClient,它是一个接口

public interface LoadBalancerClient extends ServiceInstanceChooser {

	/**
	 * execute request using a ServiceInstance from the LoadBalancer for the specified
	 * service
	 * 使用从负载均衡器中获取的服务实例执行请求
	 */
	<T> T execute(String serviceId, LoadBalancerRequest<T> request) throws IOException;

	/**
	 * 同上
	 */
	<T> T execute(String serviceId, ServiceInstance serviceInstance, LoadBalancerRequest<T> request) throws IOException;

	/**
	 * Create a proper URI with a real host and port for systems to utilize.
	 * Some systems use a URI with the logical serivce name as the host,
	 * such as http://myservice/path/to/service.  This will replace the
	 * service name with the host:port from the ServiceInstance.
	 * 创建一个带有真实host和port的URI，也就是替换服务名，改成ip:port形式
	 */
	URI reconstructURI(ServiceInstance instance, URI original);
}
// ServiceInstanceChooser 接口
public interface ServiceInstanceChooser {

    /**
     * 
     * 从LoadBalancer里选择一个服务实例
     */
    ServiceInstance choose(String serviceId);
}

方法解释

choose:根据传入的服务名serviceld,从负载均衡器中挑选一个对应服务的实例

execute:用从负载均衡器中挑选出的服务实例来执行请求内容

reconstructURI:为系统构建一个合适的host:po江形式的 URI.ServicInstance对象是带有host和port的具体服务实例，而后者URI对象则是使用逻辑服务名定义为host的URI , 而返回的URI内容则是通过ServiceInstance的服务实例详情拼接出的具体host:post形式的请求地址

该接口子类的继承关系

LoadBalancerAutoConfiguration增加拦截器

可以看到LoadBalancerAutoConfiguration是负载均衡器的配置类：

@Configuration
// 配置生效的前提
@ConditionalOnClass(RestTemplate.class)
@ConditionalOnBean(LoadBalancerClient.class)
public class LoadBalancerAutoConfiguration {

	@LoadBalanced
	@Autowired(required = false)
	private List<RestTemplate> restTemplates = Collections.emptyList();

  //维护了一个被@LoadBalanced注解修饰的RestTemplate对象列表， 并在这里进行初始化， 通过调用RestTemplateCustomizer的实例来给需要客户端负载RestTemplate增加LoadBalancerinterceptor拦截器均衡的RestTemplate增加LoadBalancerinterceptor拦截器
	@Bean
	public SmartInitializingSingleton loadBalancedRestTemplateInitializer(
			final List<RestTemplateCustomizer> customizers) {
    // bean初始化后执行相关操作
		return new SmartInitializingSingleton() {
      // Bean
			@Override
			public void afterSingletonsInstantiated() {
				for (RestTemplate restTemplate : LoadBalancerAutoConfiguration.this.restTemplates) {
          // 遍历每一个自定义器去自定义restTemplate
					for (RestTemplateCustomizer customizer : customizers) {
						customizer.customize(restTemplate);
					}
				}
			}
		};
	}

  // 用于给RestTemplate增加LoadBalancerInterceptor拦截器
	@Bean
	@ConditionalOnMissingBean
	public RestTemplateCustomizer restTemplateCustomizer(
			final LoadBalancerInterceptor loadBalancerInterceptor) {
		return new RestTemplateCustomizer() {
			@Override
			public void customize(RestTemplate restTemplate) {
				List<ClientHttpRequestInterceptor> list = new ArrayList<>(
						restTemplate.getInterceptors());
        // 增加拦截器
				list.add(loadBalancerInterceptor);
				restTemplate.setInterceptors(list);
			}
		};
	}

  //创建了LoadBalancerInterceptor，实现对客户端发起请求进行拦截，已实现客户端的负载均衡
	@Bean
	public LoadBalancerInterceptor ribbonInterceptor(
			LoadBalancerClient loadBalancerClient) {
		return new LoadBalancerInterceptor(loadBalancerClient);
	}

}

LoadBalancerInterceptor干了啥

从上面我们可以得出，restTemplate实现负载均衡是通过拦截器实现的，现在我们看看拦截器LoadBalancerInterceptor干了啥：

public class LoadBalancerInterceptor implements ClientHttpRequestInterceptor {

  //这里面委托了LoadBalancerClient进行相关的操作
	private LoadBalancerClient loadBalancer;

	public LoadBalancerInterceptor(LoadBalancerClient loadBalancer) {
		this.loadBalancer = loadBalancer;
	}

  //当一个被@LoadBalanced注解修饰的RestTemplate对象向外发起HTTP请求时，会被LoadBalancerinterceptor 类的intercept函数所拦截
	@Override
	public ClientHttpResponse intercept(final HttpRequest request, final byte[] body,
			final ClientHttpRequestExecution execution) throws IOException {
		final URI originalUri = request.getURI();
    //根据服务名来选择实例并发起实际的请求
		String serviceName = originalUri.getHost();
    // 通过负载均衡器获取相关请求，分析见下面
		return this.loadBalancer.execute(serviceName,
				new LoadBalancerRequest<ClientHttpResponse>() {

					@Override
					public ClientHttpResponse apply(final ServiceInstance instance)
							throws Exception {
						HttpRequest serviceRequest = new ServiceRequestWrapper(request,
								instance);
						return execution.execute(serviceRequest, body);
					}

				});
	}

	private class ServiceRequestWrapper extends HttpRequestWrapper {

		private final ServiceInstance instance;

		public ServiceRequestWrapper(HttpRequest request, ServiceInstance instance) {
			super(request);
			this.instance = instance;
		}

		@Override
		public URI getURI() {
			URI uri = LoadBalancerInterceptor.this.loadBalancer.reconstructURI(
					this.instance, getRequest().getURI());
			return uri;
		}

	}

}

又回到RibbonLoadBalancerClient

拦截器使用LoadBalancerClient.execute执行执行相关的请求，LoadBalancerClient只是个接口，它的实现类：RibbonLoadBalancerClient，该类的execute就是具体的拦截内容：

@Override
public <T> T execute(String serviceId, LoadBalancerRequest<T> request) throws IOException {
 	//获取管理类
  ILoadBalancer loadBalancer = getLoadBalancer(serviceId);
  //从负载均衡器中获取服务实例，调用ILoadBalancer的choose方法
  Server server = getServer(loadBalancer);
  if (server == null) {
    throw new IllegalStateException("No instances available for " + serviceId);
  }
  //封装成RibbonServer
  RibbonServer ribbonServer = new RibbonServer(serviceId, server, isSecure(server,
                                                                           serviceId), serverIntrospector(serviceId).getMetadata(server));

  RibbonLoadBalancerContext context = this.clientFactory
    .getLoadBalancerContext(serviceId);
  RibbonStatsRecorder statsRecorder = new RibbonStatsRecorder(context, server);

  try {
    //回到apply方法，执行具体的请求
    T returnVal = request.apply(ribbonServer);
    statsRecorder.recordStats(returnVal);
    return returnVal;
  }
  // catch IOException and rethrow so RestTemplate behaves correctly
  catch (IOException ex) {
    statsRecorder.recordStats(ex);
    throw ex;
  }
  catch (Exception ex) {
    statsRecorder.recordStats(ex);
    ReflectionUtils.rethrowRuntimeException(ex);
  }
  return null;
}
//使用chooseServer获取服务列表
protected Server getServer(ILoadBalancer loadBalancer) {
  if (loadBalancer == null) {
    return null;
  }
  return loadBalancer.chooseServer("default"); // TODO: better handling of key
}

ILoadBalancer真正干活的

通过getLoadBalancer获取到类似一个管理服务实例的类，接口是ILoadBalancer，getServer 使用了 ILoadBalancer 接口中定义的 chooseServer 函数。ILoadBalancer看来是一个管理服务器实例的接口，可以看到使用该接口可以添加和选择服务实例

public interface ILoadBalancer {
  	//Server 对象定义是一个传统的服务端节点， 在该类中存储了服务端节点的一些元数据信息， 包括 host、 port 以及一些部署信息等
    void addServers(List<Server> var1);

    Server chooseServer(Object var1);
		//用来通知和标识负载均衡器中某个具体实例已经停止服务， 不然负载均衡器在下一次获取服务实例清单前都会认为服务实例均是正常服务的
    void markServerDown(Server var1);
    /** @deprecated */
    @Deprecated
    List<Server> getServerList(boolean var1);
  	//获取当前正常服务的实例列表
    List<Server> getReachableServers();
  	//获取所有已知的服务实例列表， 包括正常服务和停止服务的实例
    List<Server> getAllServers();
}

ILoadBalancer的实现类：

Spring Cloud是用那个子类呢，在配置类：RibbonClientConfiguration中，通过源码可以看到使用的是ZoneAwareLoadBalancer

@Bean
@ConditionalOnMissingBean
public ILoadBalancer ribbonLoadBalancer(IClientConfig config,
                                        ServerList<Server> serverList, ServerListFilter<Server> serverListFilter,
                                        IRule rule, IPing ping) {
  ZoneAwareLoadBalancer<Server> balancer = LoadBalancerBuilder.newBuilder()
    .withClientConfig(config).withRule(rule).withPing(ping)
    .withServerListFilter(serverListFilter).withDynamicServerList(serverList)
    .buildDynamicServerListLoadBalancer();
  return balancer;
}
public ZoneAwareLoadBalancer<T> buildDynamicServerListLoadBalancer() {
  if (this.serverListImpl == null) {
    this.serverListImpl = createServerListFromConfig(this.config);
  }

  if (this.rule == null) {
    this.rule = createRuleFromConfig(this.config);
  }

  return new ZoneAwareLoadBalancer(this.config, this.rule, this.ping, this.serverListImpl, this.serverListFilter);
}

总结一下：

ZoneAwareLoadBalancer的在通过 chooseServer函数获取了负载均衡策略分配到的服务实例对象 Server 之后， 将其内容包装成RibbonServer 对象（该对象除了存储了服务实例的信息之外，还增加了服务名 serviceId、是否需要使用 HTTPS 等其他信息），然后使用该对象再回调 LoadBalancerinterceptor 请求拦截器中 apply(final ServiceInstance instance) 函数，向一个实际的具体服务实例发起请求，从而实现一开始以服务名为 host 的URI 请求到 host:post 形式的实际访问地址的转换。

回到RibbonLoadBalancerClient.execute的代码，其中RibbonServer是apply方法参数ServiceInstance子类，该接口中暴露了服务治理系统中每个服务实例需要提供的一些基本信息，比如 serviceld、 host、 port 等.

在获取到服务实例会回调apply方法：

new LoadBalancerRequest<ClientHttpResponse>() {
  @Override
  public ClientHttpResponse apply(final ServiceInstance instance)
    throws Exception {
    HttpRequest serviceRequest = new ServiceRequestWrapper(request,
                                                           instance);
    return execution.execute(serviceRequest, body);
  }

}

在apply方法中，请求包装成了ServiceRequestWrapper，ServiceRequestWrapper重写了getURI函数

@Override
public URI getURI() {
  URI uri = LoadBalancerInterceptor.this.loadBalancer.reconstructURI(
    this.instance, getRequest().getURI());
  return uri;
}

可以看到这里使用了loadBalancer.reconstructURI获取URI，这样又回到了上面所讲RibbonLoadBalancerClient类：

//拿到实例id
//通过SpringClientFactory获取RibbonLoadBalancerContext
//构建Server类
//如果是安全请求则构造HTTPS请求
//使用RibbonLoadBalancerContext构造URI
@Override
public URI reconstructURI(ServiceInstance instance, URI original) {
  Assert.notNull(instance, "instance can not be null");
  String serviceId = instance.getServiceId();
  RibbonLoadBalancerContext context = this.clientFactory
    .getLoadBalancerContext(serviceId);
  //Server类是netflix包下的，这里做了转换
  Server server = new Server(instance.getHost(), instance.getPort());
  boolean secure = isSecure(server, serviceId);
  URI uri = original;
  if (secure) {
    uri = UriComponentsBuilder.fromUri(uri).scheme("https").build().toUri();
  }
  return context.reconstructURIWithServer(server, uri);
}

这里简单介绍下springClientFactory和RibbonLoadBalancerContext:

springClientFactory类是一个用来创建客户端负载均衡器的工厂类，该工厂类会为每一个不同名的Ribbon 客户端生成不同的 Spring 上下文

RibbonLoadBalancerContext是该类用于存储一些负载均衡器使用的上下文内容和API操作

负载均衡器

虽然Spring Cloud 中定义了LoadBalancerClient作为负载均衡器的通用接口，并且针对Ribbon实现了RibbonLoadBalancerClient，但是它在具体实现客户端负载均衡时，是通过Ribbon的ILoadBalancer接口实现的。下面我们分析下该接口

需要注意的是RibbonLoadBalancerClient是spring cloud的类，ILoadBalancer是netflix的接口

AbstractLoadBalancer

代码如下：

public abstract class AbstractLoadBalancer implements ILoadBalancer {
    //定义了服务实例
    public enum ServerGroup{
        ALL,
        STATUS_UP,
        STATUS_NOT_UP        
    }
        
    /**
     * delegate to {@link #chooseServer(Object)} with parameter null.
     * 调用了子类的chooseServer，传参数为null
     */
    public Server chooseServer() {
    	return chooseServer(null);
    }

    
    /**
     * List of servers that this Loadbalancer knows about
     * 定义了根据分组类型来获取不同的服务实例的列表
     * @param serverGroup Servers grouped by status, e.g., {@link ServerGroup#STATUS_UP}
     */
    public abstract List<Server> getServerList(ServerGroup serverGroup);
    
    /**
     * LoadBalancerStats 对象被用来存储负载均衡器中各个 服务实例当前的属性和统计信息。 这些信息非常有用， 我们可以利用这些信息来观察负载均衡器的运行情况， 同时这些信息也是用来制定负载均衡策略的重要依据
     */
    public abstract LoadBalancerStats getLoadBalancerStats();    
}

BaseLoadBalancer

该类为负载均衡器的基础实现类，在该类中定义了很多关于负载均衡器相关的基础内容

定义并维护了两个存储服务实例 Server 对象的列表。一个用于存储所有服务实例的清单，一个用于存储正常服务的实例清单：

@Monitor(name = PREFIX + "AllServerList", type = DataSourceType.INFORMATIONAL)
protected volatile List<Server> allServerList = Collections
  .synchronizedList(new ArrayList<Server>());
@Monitor(name = PREFIX + "UpServerList", type = DataSourceType.INFORMATIONAL)
protected volatile List<Server> upServerList = Collections
  .synchronizedList(new ArrayList<Server>());

定义了之前我们提到的用来存储负载均衡器各服务实例属性和统计信息的LoadBalancerStats 对象
定义了检查服务实例是否正常服务的IPing 对象
定义了检查服务实例操作的执行策略对象IPingStrategy，默认是SerialPingStrategy。该策略采用线性遍历 ping 服务实例的方式实现检查，也可以实现IPingStrategy接口自定义策略

定义了负载均衡的处理规则IRule对象。理解这个对象我们先看下上面介绍过的chooseServer方法：

public Server chooseServer(Object key) {
  if (counter == null) {
    counter = createCounter();
  }
  counter.increment();
  if (rule == null) {
    return null;
  } else {
    try {
      //调用IRule对象
      return rule.choose(key);
    } catch (Throwable t) {
      return null;
    }
  }
}

可以看到这里实际就是调用IRule对象的choose方法，因此负责均衡选择服务实例，最终落到了IRule对象上，该对象在BaseLoadBalancer的默认值是RoundRobinRule，也就是默认轮训方式

在BaseLoadBalancer的构造函数中启动一个定时任务，检查Server是否健康，默认间隔是10s

void setupPingTask() {
  if (canSkipPing()) {
    return;
  }
  if (lbTimer != null) {
    lbTimer.cancel();
  }
  lbTimer = new ShutdownEnabledTimer("NFLoadBalancer-PingTimer-" + name,
                                     true);
  //使用了Timer类
  lbTimer.schedule(new PingTask(), 0, pingIntervalSeconds * 1000);
  forceQuickPing();
}

实现了接口中的相关操作，比如addServers、chooseServer,markServerDown等

//添加服务
public void addServer(Server newServer) {
  if (newServer != null) {
    try {
      ArrayList<Server> newList = new ArrayList<Server>();

      newList.addAll(allServerList);
      newList.add(newServer);
      setServersList(newList);
    } catch (Exception e) {
      logger.error("Exception while adding a newServer", e);
    }
  }
}
//标记某个服务实例暂停服务
public void markServerDown(Server server) {
  if (server == null) {
    return;
  }

  if (!server.isAlive()) {
    return;
  }

  logger.error("LoadBalancer:  markServerDown called on ["
               + server.getId() + "]");
  server.setAlive(false);
  // forceQuickPing();

  notifyServerStatusChangeListener(singleton(server));
}
//获取可用的服务实例列表
@Override
public List<Server> getReachableServers() {
  return Collections.unmodifiableList(upServerList);
}
//获取所有的服务
public List<Server> getAllServers() {
  return Collections.unmodifiableList(allServerList);
}

DynamicServerListLoadBalancer

该负载均衡器中，实现了服务实例清单在运行期的动态更新能力（需要和Eureka交互）；同时，它还具备了对服务实例清单的过滤功能，也就是说，我们可以通过过滤器来选择性地获取一批服务实例清单

添加一个实例serverListImpl：

//T是Sever类型
volatile ServerList<T> serverListImpl;
public interface ServerList<T extends Server> {
		//用于获取初始化的服务实例清单
    public List<T> getInitialListOfServers();
    /**
     * Return updated list of servers. This is called say every 30 secs
     * (configurable) by the Loadbalancer's Ping cycle
     * 用于获取更新的服务实例清单
     */
    public List<T> getUpdatedListOfServers();   
}

ServerList接口的实现类：

那么DynamicServerListLoadBalancer（该类是neitflix的，按理说应该调用netflix的类）使用的是哪个呢：

既然该负载均衡需要实现服务实例的动态更新，那么势必需要Ribbon具备访问Eureka来获取服务实例的能力，所以查看配置类EurekaRibbonClientConfiguration，找到了其实现类DomainExtractingServerList

@Bean
@ConditionalOnMissingBean
public ServerList<?> ribbonServerList(IClientConfig config) {
  DiscoveryEnabledNIWSServerList discoveryServerList = new DiscoveryEnabledNIWSServerList(
    config);
  DomainExtractingServerList serverList = new DomainExtractingServerList(
    discoveryServerList, config, this.approximateZoneFromHostname);
  return serverList;
}

DomainExtractingServerList又定义了一个ServerList对象，主要方法的实现委托了这个对象来完成，DomainExtractingServerList对它返回的对象进行了包装。该对象是通过构造参数传过去的，也就是上面代码中的discoveryServerList，其类型是DiscoveryEnabledNIWSServerList。

注意的是EurekaRibbonClientConfiguration是spring cloud的类，DiscoveryEnabledNIWSServerList是netflix包的类

说白了spring cloud还是使用的netflix的实现，只在其基础上封装了一些东西。

DiscoveryEnabledNIWSServerList的实现：

@Override
public List<DiscoveryEnabledServer> getInitialListOfServers(){
  return obtainServersViaDiscovery();
}

@Override
public List<DiscoveryEnabledServer> getUpdatedListOfServers(){
  return obtainServersViaDiscovery();
}

private List<DiscoveryEnabledServer> obtainServersViaDiscovery() {
  List<DiscoveryEnabledServer> serverList = new ArrayList<DiscoveryEnabledServer>();

  if (eurekaClientProvider == null || eurekaClientProvider.get() == null) {
    logger.warn("EurekaClient has not been initialized yet, returning an empty list");
    return new ArrayList<DiscoveryEnabledServer>();
  }

  EurekaClient eurekaClient = eurekaClientProvider.get();
  if (vipAddresses!=null){
    for (String vipAddress : vipAddresses.split(",")) {
      // if targetRegion is null, it will be interpreted as the same region of client
      List<InstanceInfo> listOfInstanceInfo = eurekaClient.getInstancesByVipAddress(vipAddress, isSecure, targetRegion);
      for (InstanceInfo ii : listOfInstanceInfo) {
        if (ii.getStatus().equals(InstanceStatus.UP)) {

          if(shouldUseOverridePort){
            if(logger.isDebugEnabled()){
              logger.debug("Overriding port on client name: " + clientName + " to " + overridePort);
            }

            // copy is necessary since the InstanceInfo builder just uses the original reference,
            // and we don't want to corrupt the global eureka copy of the object which may be
            // used by other clients in our system
            InstanceInfo copy = new InstanceInfo(ii);

            if(isSecure){
              ii = new InstanceInfo.Builder(copy).setSecurePort(overridePort).build();
            }else{
              ii = new InstanceInfo.Builder(copy).setPort(overridePort).build();
            }
          }

          DiscoveryEnabledServer des = new DiscoveryEnabledServer(ii, isSecure, shouldUseIpAddr);
          des.setZone(DiscoveryClient.getZone(ii));
          serverList.add(des);
        }
      }
      if (serverList.size()>0 && prioritizeVipAddressBasedServers){
        break; // if the current vipAddress has servers, we dont use subsequent vipAddress based servers
      }
    }
  }
  return serverList;
}

内部调用了obtainServersViaDiscovery方法，该方法主要通过EurekaClient获取服务实例的InstanceInfo信息。该方法中的vipAddress，可以理解为服务名，可以逗号隔开。

再委托DiscoveryEnabledNIWSServerList返回DiscoveryEnabledServer后，DomainExtractingServerList对其进行了封装，添加了其他配置信息：

@Override
public List<DiscoveryEnabledServer> getUpdatedListOfServers() {
  List<DiscoveryEnabledServer> servers = setZones(this.list
                                                  .getUpdatedListOfServers());
  return servers;
}

private List<DiscoveryEnabledServer> setZones(List<DiscoveryEnabledServer> servers) {
  List<DiscoveryEnabledServer> result = new ArrayList<>();
  boolean isSecure = this.clientConfig.getPropertyAsBoolean(
    CommonClientConfigKey.IsSecure, Boolean.TRUE);
  boolean shouldUseIpAddr = this.clientConfig.getPropertyAsBoolean(
    CommonClientConfigKey.UseIPAddrForServer, Boolean.FALSE);
  for (DiscoveryEnabledServer server : servers) {
    result.add(new DomainExtractingServer(server, isSecure, shouldUseIpAddr,
                                          this.approximateZoneFromHostname));
  }
  return result;
}

回过头来，通过上面的分析我们已经知道了和ribbon与Eureka 整合后，如何实现从 Eureka Server中获取服务实例清单。那么它又是如何触发向 Eureka Server 去获取服务实例清单以及如何在获取到服务实例清单后更新本地的服务实例清单的呢。

我们继续查看DynamicServerListLoadBalancer类，该类定义了一个对象ServerListUpdater,通过名称可以看到这里就是用来更新服务列表，也称为服务更新器：

//DynamicServerListLoadBalancer
protected volatile ServerListUpdater serverListUpdater;
protected final ServerListUpdater.UpdateAction updateAction = new ServerListUpdater.UpdateAction() {
  @Override
  public void doUpdate() {
    updateListOfServers();
  }
};
@VisibleForTesting
public void updateListOfServers() {
  List<T> servers = new ArrayList<T>();
  if (serverListImpl != null) {
    //调用上面提到的ServerList的接口
    servers = serverListImpl.getUpdatedListOfServers();
    LOGGER.debug("List of Servers for {} obtained from Discovery client: {}",
                 getIdentifier(), servers);

    if (filter != null) {
      servers = filter.getFilteredListOfServers(servers);
      LOGGER.debug("Filtered List of Servers for {} obtained from Discovery client: {}",
                   getIdentifier(), servers);
    }
  }
  //触发更新
  updateAllServerList(servers);
}

ServerListUpdater的其他接口：

public interface ServerListUpdater {
    public interface UpdateAction {
        void doUpdate();
    }
    void start(UpdateAction updateAction);
    void stop();
    String getLastUpdate();
    long getDurationSinceLastUpdateMs();
    int getNumberMissedCycles();
    int getCoreThreads();
}

在DynamicServerListLoadBalancer构造函数中，启动了更新机制：

public DynamicServerListLoadBalancer(IClientConfig clientConfig, IRule rule, IPing ping,
                                     ServerList<T> serverList, ServerListFilter<T> filter,
                                     ServerListUpdater serverListUpdater) {
  	...
    restOfInit(clientConfig);
}
void restOfInit(IClientConfig clientConfig) {
  boolean primeConnection = this.isEnablePrimingConnections();
  // turn this off to avoid duplicated asynchronous priming done in BaseLoadBalancer.setServerList()
  this.setEnablePrimingConnections(false);
  enableAndInitLearnNewServersFeature();

  updateListOfServers();
  if (primeConnection && this.getPrimeConnections() != null) {
    this.getPrimeConnections()
      .primeConnections(getReachableServers());
  }
  this.setEnablePrimingConnections(primeConnection);
  LOGGER.info("DynamicServerListLoadBalancer for client {} initialized: {}", clientConfig.getClientName(), this.toString());
}
public void enableAndInitLearnNewServersFeature() {
  LOGGER.info("Using serverListUpdater {}", serverListUpdater.getClass().getSimpleName());
  //注意：这里启动了更新
  serverListUpdater.start(updateAction);
}

ServerListUpdater的实现类：

PollingServerListUpdater:动态服务列表更新的默认策略,DynamicServerListLoadBalancer负载均衡器的默认实现就是它，通过定时任务的方式更新服务列表的更新

EurekaNotificationServerListUpdater：利用Eureka的事件监听器来驱动服务列表的更新操作

正如上面所看到，PollingServerListUpdater的start方法在构造DynamicServerListLoadBalancer时调用：

以定时任务的方式进行服务列表的更新，更新是通过updateAction完成的，根据前面可知，会调用updateListOfServers方法

//PollingServerListUpdater
@Override
public synchronized void start(final UpdateAction updateAction) {
  if (isActive.compareAndSet(false, true)) {
    //启动了一步线程
    final Runnable wrapperRunnable = new Runnable() {
      @Override
      public void run() {
        if (!isActive.get()) {
          if (scheduledFuture != null) {
            scheduledFuture.cancel(true);
          }
          return;
        }
        try {
          updateAction.doUpdate();
          lastUpdated = System.currentTimeMillis();
        } catch (Exception e) {
          logger.warn("Failed one update cycle", e);
        }
      }
    };
		//initialDelayMs是1000ms，refreshIntervalMs是30s，也就是30秒更新服务实例
    scheduledFuture = getRefreshExecutor().scheduleWithFixedDelay(
      wrapperRunnable,
      initialDelayMs,
      refreshIntervalMs,
      TimeUnit.MILLISECONDS
    );
  } else {
    logger.info("Already active, no-op");
  }
}

ServerListFilter

DynamicServerListLoadBalancer的updateAction调用的是updateListOfServers方法，其中引入了一个filter用来过滤服务器：

if (filter != null) {
  servers = filter.getFilteredListOfServers(servers);
  LOGGER.debug("Filtered List of Servers for {} obtained from Discovery client: {}",
               getIdentifier(), servers);
}

该filter对象是ServerListFilter类型，该接口的继承关系：

除了ZonePreferenceServerListFilter实现外，其他都是netflix包中的类，下面看下这些过滤器都干了什么

AbstractServerListFilter

这是一个抽象过滤器，在这里定义了过滤时需要的一个重要依据对象 LoadBalancerStats，我们在之前介绍过，该对象存储了关于负载均衡器的一些属性和统计信息等

public abstract class AbstractServerListFilter<T extends Server> implements ServerListFilter<T> {
    private volatile LoadBalancerStats stats;
    public void setLoadBalancerStats(LoadBalancerStats stats) {
        this.stats = stats;
    }
    public LoadBalancerStats getLoadBalancerStats() {
        return stats;
    }
}

ZoneAffinityServerListFilter：

该过滤器基于 “ 区域感知 (Zone Affinity)”的方式实现服务实例的过滤，也就是说，它会根据提供服务的实例所处的区域(Zone) 与消费者自身的所处区域 (Zone) 进行比较，过滤掉那些不是同处一个区域的实例：

代码里看到，通过传入一个Predicate来作为过滤判断器，其实现是ZoneAffinityPredicate，具体的判断逻辑如下apply方法：

@Override
public List<T> getFilteredListOfServers(List<T> servers) {
  if (zone != null && (zoneAffinity || zoneExclusive) && servers !=null && servers.size() > 0){
    List<T> filteredServers = Lists.newArrayList(Iterables.filter(
      servers, this.zoneAffinityPredicate.getServerOnlyPredicate()));
    if (shouldEnableZoneAffinity(filteredServers)) {
      return filteredServers;
    } else if (zoneAffinity) {
      overrideCounter.increment();
    }
  }
  return servers;
}
//ZoneAffinityPredicate的实现，用来作为上面filter的判断条件
@Override
public boolean apply(PredicateKey input) {
  Server s = input.getServer();
  String az = s.getZone();
  if (az != null && zone != null && az.toLowerCase().equals(zone.toLowerCase())) {
    return true;
  } else {
    return false;
  }
}

可以看到过滤服务实例后，并不是立即返回，又调用了shouldEnableZoneAffinity来判断是否满足条件：

getZoneSnapshot获取这些过滤后的同区域实例的基础指标（包含实例数量、断路器断开数、活动请求数、
实例平均负载等）

根据一系列的算法求出下面的几个评价值并与设置的阙值进行对比（下面的为默认值），若有一个条件符合，就不启用 “ 区域感知 ” 过滤的服务实例清单

这一算法实现为集群出现区域故障时，依然可以依靠其他区域的实例进行正常服务提供了完善的高可用保障

blackOutServerPercentageThreshold:故障实例百分比（断路器断开数／实例数量） >=0.8

activeReqeustsPerServerThreshold:实例平均负载 >=0.6

availableServersThreshold：可用实例数（实例数量－断路器断开数） <2。

private boolean shouldEnableZoneAffinity(List<T> filtered) {    
  if (!zoneAffinity && !zoneExclusive) {
    return false;
  }
  if (zoneExclusive) {
    return true;
  }
  LoadBalancerStats stats = getLoadBalancerStats();
  if (stats == null) {
    return zoneAffinity;
  } else {
    logger.debug("Determining if zone affinity should be enabled with given server list: {}", filtered);
    ZoneSnapshot snapshot = stats.getZoneSnapshot(filtered);
    double loadPerServer = snapshot.getLoadPerServer();
    int instanceCount = snapshot.getInstanceCount();            
    int circuitBreakerTrippedCount = snapshot.getCircuitTrippedCount();
    if (((double) circuitBreakerTrippedCount) / instanceCount >= blackOutServerPercentageThreshold.get() 
        || loadPerServer >= activeReqeustsPerServerThreshold.get()
        || (instanceCount - circuitBreakerTrippedCount) < availableServersThreshold.get()) {
      logger.debug("zoneAffinity is overriden. blackOutServerPercentage: {}, activeReqeustsPerServer: {}, availableServers: {}", 
                   new Object[] {(double) circuitBreakerTrippedCount / instanceCount,  loadPerServer, instanceCount - circuitBreakerTrippedCount});
      return false;
    } else {
      return true;
    }

  }
}

DefaultNIWSServerListFilter：

完全继承ZoneAffinityServerListFilter，没有自定义实现。是默认的NIWS (Netflix Internal Web Service)过滤器

ServerListSubsetFilter：

该过滤器也继承自ZoneAffinityServerListFilter。它非常适用于拥有大规模服务器集群（上百或更多）的系统。因为它可以产生一个 “ 区域感知 ” 结果的子集列表（从过滤的服务实例中维护一个子集，可想而知服务器很多），同时它还能够通过比较服务实例的通信失败数量和并发连接数来判定该服务是否健康来选择性地从服务实例列表中剔除那些相对不够健康的实例。该过滤器的实现主要分为以下三步：

获取 “ 区域感知 ” 的过滤结果，作为候选的服务实例清单

从当前消费者维护的服务实例子集中剔除那些相对不够健康的实例（同时也将这些实例从候选清单中剔除，防止第三步的时候又被选入），标准：1. 服务实例的并发连接数超过客户端配置的值，默认为0，参数可配置；2.服务实例的失败数超过客户端配置的值，默认为0，参数可配置 3. 如果按符合上面任一规则的服务实例剔除后，剔除比例小于客户端默认配置的百分比，默认为0.1(10%)，可配置，那么就先对剩下的实例列表进行健康排序，再从最不健康的实例进行剔除，直到达到配置的剔除百分比

完成剔除后，清单已经少了至少10% （默认值）的服务实例，最后通过随机的方式从候选清单中选出一批实例加入到清单中，以保持服务实例子集与原来的数量一致，而默认的实例子集数量为20

ZonePreferenceServerListFilter：

Spring Cloud 整合时新增的过滤器。若使用Spring Cloud整合Eureka和Ribbon时会默认使用该过滤器。它实现了通过配置或者 Eureka 实例元数据的所属区域 (Zone) 来过滤出同区域的服务实例。如下面的源码所示，它的实现非常简单，首先通过父类 ZoneAffinityServerListFilter的过滤器来获得 “ 区域感知 ” 的服务实例列表，然后遍历这个结果，取出根据消费者配置预设的区域 Zone 来进行过滤，如果过滤的结果是空就直接返回父类获取的结果，如果不为空就返回通过消费者配置的 Zone 过滤后的结果：

@Override
public List<Server> getFilteredListOfServers(List<Server> servers) {
  List<Server> output = super.getFilteredListOfServers(servers);
  if (this.zone != null && output.size() == servers.size()) {
    List<Server> local = new ArrayList<Server>();
    for (Server server : output) {
      //根据配置的zone来过滤
      if (this.zone.equalsIgnoreCase(server.getZone())) {
        local.add(server);
      }
    }
    if (!local.isEmpty()) {
      return local;
    }
  }
  return output;
}

ZoneAwareLoadBalancer

继承了DynamicServerListLoadBalancer,DynamicServerListLoadBalancer没有重写chooseServer方法，即它会使用BaseLoadBalancer的实现，使用RoundRobinRule以线性轮询的方式来选择调用的服务实例。该
算法实现简单并没有区域 (Zone) 的概念，所以它会把所有实例视为一个 Zone下的节点来看待，这样就会周期性地产生跨区域 (Zone) 访问的情况，由于跨区域会产生更高的延迟，这些实例主要以防止区域性故障实现高可用为目的而不能作为常规访问的实例，所以在多区域部署的清况下会有一定的性能问题，而该负载均衡器则可以避免这样的问题

ZoneAwareLoadBalancer没有重写setServersList,说明实现服务实例清单的更新主逻辑没有修改,但是重写了setServerListForZones，先看下DynamicServerListLoadBalancer的该方法实现：

作用：它在父类DynamicServerListLoadBalancer中的作用是根据按区域 Zone 分组的实例列表，为负载均衡器中的 LoadBalancerStats对象创建 Zonestats 并放入Map zonestatsMap集合中，每一个区域 Zone 对应一个ZoneStats, 它用于存储每个 Zone 的一些状态和统计信息

//该方法来自DynamicServerListLoadBalancer，在setServersList最后一步调用
//参数zoneServersMap，key是zone，value是server列表
protected void setServerListForZones(
  Map<String, List<Server>> zoneServersMap) {
  LOGGER.debug("Setting server list for zones: {}", zoneServersMap);
  getLoadBalancerStats().updateZoneServerMapping(zoneServersMap);
}
public void updateZoneServerMapping(Map<String, List<Server>> map) {
  upServerListZoneMap = new ConcurrentHashMap<String, List<? extends Server>>(map);
  // make sure ZoneStats object exist for available zones for monitoring purpose
  for (String zone: map.keySet()) {
    getZoneStats(zone);
  }
}
//zoneStatsMap是实例变量
private ZoneStats getZoneStats(String zone) {
  zone = zone.toLowerCase();
  ZoneStats zs = zoneStatsMap.get(zone);
  if (zs == null){
    //映射存放ZoneStats数据
    zoneStatsMap.put(zone, new ZoneStats(this.getName(), zone, this));
    zs = zoneStatsMap.get(zone);
  }
  return zs;
}

ZoneAwareLoadBalancer的setServerListForZones方法如下：

balancers用来存储每个 Zone 区域对应的负载均衡器，负载均衡器是通过getLoadBalancer获取的，创建的同时添加了IRule，如果IRule实例为空，则创建AvailabilityFilteringRule

第二个循环则是对Zone区域中实例清单的检查，看看是否有Zone区域下已经没有实例了，是的话就将balancers 中对应 Zone 区域的实例列表清空，该操作的作用是为了后续选择节点时，防止过时的 Zone 区域统计信息干扰具体实例的选择算法

//private ConcurrentHashMap<String, BaseLoadBalancer> balancers
@Override
protected void setServerListForZones(Map<String, List<Server>> zoneServersMap) {
  super.setServerListForZones(zoneServersMap);
  if (balancers == null) {
    balancers = new ConcurrentHashMap<String, BaseLoadBalancer>();
  }
  for (Map.Entry<String, List<Server>> entry: zoneServersMap.entrySet()) {
    String zone = entry.getKey().toLowerCase();
    //调用负载均衡器的setServersList方法为每个负载均衡器添加服务实例
    getLoadBalancer(zone).setServersList(entry.getValue());
  }
  // check if there is any zone that no longer has a server
  // and set the list to empty so that the zone related metrics does not
  // contain stale data
  for (Map.Entry<String, BaseLoadBalancer> existingLBEntry: balancers.entrySet()) {
    if (!zoneServersMap.keySet().contains(existingLBEntry.getKey())) {
      existingLBEntry.getValue().setServersList(Collections.emptyList());
    }
  }
}
@VisibleForTesting
BaseLoadBalancer getLoadBalancer(String zone) {
  zone = zone.toLowerCase();
  BaseLoadBalancer loadBalancer = balancers.get(zone);
  if (loadBalancer == null) {
    // We need to create rule object for load balancer for each zone
    //每个负载均衡器都创建一个IRule
    IRule rule = cloneRule(this.getRule());
    loadBalancer = new BaseLoadBalancer(this.getName() + "_" + zone, rule, this.getLoadBalancerStats());
    BaseLoadBalancer prev = balancers.putIfAbsent(zone, loadBalancer);
    if (prev != null) {
      loadBalancer = prev;
    }
  } 
  return loadBalancer;        
}

回过头来我们重点看下chooseServer方法的实现：

当负载均衡器中维护的实例所属的 Zone 区域的个数大于1 的时候才会执行这里的选择策略:

createSnapshot为当前负载均衡器中所有的Zone区域分别创建快照，保存在zoneSnapshot

调用getAvailableZones 来获取可用的Zone区域集合，在该函数中会通过Zone区域快照中的统计数据来实现
可用区的挑选

当获得的可用Zone区域集合不为空，并且个数小于Zone区域总数，就随机选择一个Zone区域

在确定了某个 Zone 区域后，则获取了对应Zone 区域的服务均衡器，并调用chooseServer来选择具体的服务实例，而在chooseServer中将使用IRule接口的 choose函数来选择具体的服务实例，这里的具体实现是ZoneAvoidanceRule

@Override
public Server chooseServer(Object key) {
  if (!ENABLED.get() || getLoadBalancerStats().getAvailableZones().size() <= 1) {
    logger.debug("Zone aware logic disabled or there is only one zone");
    return super.chooseServer(key);
  }
  Server server = null;
  try {
    LoadBalancerStats lbStats = getLoadBalancerStats();
    Map<String, ZoneSnapshot> zoneSnapshot = ZoneAvoidanceRule.createSnapshot(lbStats);
    logger.debug("Zone snapshots: {}", zoneSnapshot);
    if (triggeringLoad == null) {
      triggeringLoad = DynamicPropertyFactory.getInstance().getDoubleProperty(
        "ZoneAwareNIWSDiscoveryLoadBalancer." + this.getName() + ".triggeringLoadPerServerThreshold", 0.2d);
    }

    if (triggeringBlackoutPercentage == null) {
      triggeringBlackoutPercentage = DynamicPropertyFactory.getInstance().getDoubleProperty(
        "ZoneAwareNIWSDiscoveryLoadBalancer." + this.getName() + ".avoidZoneWithBlackoutPercetage", 0.99999d);
    }
    Set<String> availableZones = ZoneAvoidanceRule.getAvailableZones(zoneSnapshot, triggeringLoad.get(), triggeringBlackoutPercentage.get());
    logger.debug("Available zones: {}", availableZones);
    if (availableZones != null &&  availableZones.size() < zoneSnapshot.keySet().size()) {
      String zone = ZoneAvoidanceRule.randomChooseZone(zoneSnapshot, availableZones);
      logger.debug("Zone chosen: {}", zone);
      if (zone != null) {
        BaseLoadBalancer zoneLoadBalancer = getLoadBalancer(zone);
        server = zoneLoadBalancer.chooseServer(key);
      }
    }
  } catch (Throwable e) {
    logger.error("Unexpected exception when choosing server using zone aware logic", e);
  }
  if (server != null) {
    return server;
  } else {
    logger.debug("Zone avoidance logic is not invoked.");
    return super.chooseServer(key);
  }
}

负载均衡策略

下面我们看下几个IRule的实现

AbstractLoadBalancerRule

负载均衡策略的抽象类，在该抽象类中定义了负载均衡器ILoadBalancer对象，该对象能够在具体实现选择服务策略时，获取到一些负载均衡器中维护的信息来作为分配依据

public abstract class AbstractLoadBalancerRule implements IRule, IClientConfigAware {
    private ILoadBalancer lb;
    public void setLoadBalancer(ILoadBalancer lb){
        this.lb = lb;
    }
    public ILoadBalancer getLoadBalancer(){
        return lb;
    }      
}

RandomRule

采用随机的方式，从upList中筛选出实例：

public Server choose(ILoadBalancer lb, Object key) {
  if (lb == null) {
    return null;
  }
  Server server = null;

  while (server == null) {
    if (Thread.interrupted()) {
      return null;
    }
    List<Server> upList = lb.getReachableServers();
    List<Server> allList = lb.getAllServers();

    int serverCount = allList.size();
    if (serverCount == 0) {
      /*
                 * No servers. End regardless of pass, because subsequent passes
                 * only get more restrictive.
                 */
      return null;
    }

    int index = rand.nextInt(serverCount);
    server = upList.get(index);

    if (server == null) {
      /*
                 * The only time this should happen is if the server list were
                 * somehow trimmed. This is a transient condition. Retry after
                 * yielding.
                 */
      Thread.yield();
      continue;
    }

    if (server.isAlive()) {
      return (server);
    }

    // Shouldn't actually happen.. but must be transient or a bug.
    server = null;
    Thread.yield();
  }

  return server;

}

RoundRobinRule

内部增加了一个 coun七计数变量，该变量会在每次循环之后累加，也就是说，如果一直选择不到 server 超过 10 次，那么就会结束尝试，并打印一个警告信息。内部维护了一个计数变量，然后通过取模来获取下一个服务

RetryRule

默认使用了 RoundRobinRule 实例，若期间能够选择到具体的服务实例就返回，若选择不到就根据设置的尝试结束时间为阙值(maxRetryMillis参数定义的值+choose 方法开始执行的时间戳）, 当超过该阑值后就返回 null。

WeightedResponseTimeRule

启动一个定时任务，用来为每个服务实例计算权重，该任务默认30秒执行一次,权重的计算：

根据LoadBalancerStats中记录的每个实例的统计信息，累加所有实例的平均响应时间，得到总平均响应时间totalResponseTime

为负载均衡器中维护的实例清单逐个计算权重（从第一个开始）

权重区间边界的开闭原则根据算法，正常每个区间为(x, y)的形式，但是第一个实例和最后一个实例为什么不同呢？由于随机数的最小取值可以为O, 所以第一个实例的下限是闭区间，同时随机数的最大值取不到最大权重值，所以最后一个实例的上限是开区间

配置详解

自动化配置

下面这些自动化配置内容仅在没有引入Spring Cloud Eureka等服务治理框架时如此，在同时引入Eureka和沁bbon依赖时，自动化配置会有一些不同

Eureka

服务治理

搭建注册中心

@EnableEurekaServer 的实现

注册服务提供者

高可用注册中心

服务提供方修改

服务发现和消费

Eureka详解

服务治理机制

源码分析

defaultZone属性的获取

Region,Zone

服务注册、续约、心跳的实现

服务获取和服务续约

服务注册中心处理

配置详解

服务注册配置类

服务实例配置

其他配置

Ribbon

客户端负载均衡

RestTemplate详解

GET请求

POST请求

PUT请求

DELETE请求

源码分析

从LoadBalancerClient说起

LoadBalancerAutoConfiguration增加拦截器

LoadBalancerInterceptor干了啥

又回到RibbonLoadBalancerClient

ILoadBalancer真正干活的

负载均衡器

AbstractLoadBalancer

BaseLoadBalancer

DynamicServerListLoadBalancer

ServerListFilter

ZoneAwareLoadBalancer

负载均衡策略

AbstractLoadBalancerRule

RandomRule

RoundRobinRule

RetryRule

WeightedResponseTimeRule

配置详解

自动化配置

参数配置

与Eureka结合

重试机制