Spring Cloud 专题之Sleuth 服务跟踪实现方法

2025-06-20 07:25:17

在一个微服务架构中，系统的规模往往会比较大，各微服务之间的调用关系也错综复杂。通常一个有客户端发起的请求在后端系统中会经过多个不同的微服务调用阿里协同产生最后的请求结果。在复杂的微服务架构中，几乎每一个前端请求都会形成一条复杂的分布式的服务调用链路，在每条链路中任何一个依赖服务出现延迟过高或错误的时候都有可能引起请求最后的失败。

这个时候，对于每个请求，全链路调用的跟踪就边得越来越重要，通过实现对请求调用的跟踪可以帮助我们快速发现问题根源以及监控分析每条请求链路上的性能瓶颈等。而Spring Cloud Sleuth就是一个提供了一套完整的解决方案的组件。

在开始今天的这个例子之前，可以看一下我之前的几篇博客，特别是hystrix之前的博客。本篇博客就是在这基础上所增加的新功能。在之前的实践中，通过9004的customer-server项目调用9003的hello-server项目的接口。

准备工作

在之前的服务调用的方法上加上日志操作。

customer-server的CustomerController类：

@RequestMapping("/sayHello1")
@ResponseBody
public String invokeSayHello1(String name){
    logger.info("调用了customer-server的sayHello1方法，参数为：{}",name);
    return serivce.invokeSayHello1(name);
}

hello-server的Hello1Controller类：

@RequestMapping("/sayHello1")
public String sayHello1(@RequestParam("name") String name){
    logger.info("你好,服务名：{},端口为：{},接收到的参数为：{}",instanceName,host,name);
    try {
        int sleepTime = new Random().nextInt(3000);
        logger.error("让线程阻塞 {} 毫秒",sleepTime);
        Thread.sleep(sleepTime);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    return "你好,服务名："+instanceName+"，端口为："+host+",接收到的参数为："+name;
}

在页面上访问localhost:9004/sayHello1?name=charon

#  customer-server中的打印日志
2021-08-09 23:22:33.905 INFO 19776 --- [nio-9004-exec-8] c.c.e.controller.CustomerController      : 调用了customer-server的sayHello1方法，参数为：charon

# hello-server中的打印日志
2021-08-09 23:22:33.917  INFO 2884 --- [nio-9003-exec-9] c.c.e.controller.Hello1Controller        : 你好,服务名：hello-server,端口为：9003,接收到的参数为：charon

实现跟踪

在修改完上面的代码后，为customer-server项目和hello-server项目添加服务跟踪的功能，引入依赖

<!--引入sleuth链路追踪的jar包-->
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-sleuth</artifactId>
</dependency>

页面调用查看日志：

#  customer-server中的打印日志
2021-08-09 23:30:44.782 INFO [customer-server,0e307552774ef605,0e307552774ef605,true] 14616 --- [nio-9004-exec-2] c.c.e.controller.CustomerController      : 调用了customer-server的sayHello1方法，参数为：charon

# hello-server中的打印日志
2021-08-09 23:30:44.807  INFO [hello-server,0e307552774ef605,4cf4d9dd57ca7478,true] 6660 --- [nio-9003-exec-2] c.c.e.controller.Hello1Controller        : 你好,服务名：hello-server,端口为：9003,接收到的参数为：charon

从上面的控制台的输出内容可以看到形如[customer-server,0e307552774ef605,0e307552774ef605,true] 的日志信息，而浙西而元素正是实现分布式服务跟踪的重要组成部分，每个值的含义如下：

customer-server：应用的名称，也就是application.properties中的soring。application.name的值
0e307552774ef605：Spring Cloud Sleuth生成的一个ID，成微Trace ID,它用来标识一条请求链路，一条请求链路中包含一个Trace ID,多个Span ID。
0e307552774ef605：Spring Cloud Sleuth生成的另一个ID，成为Span ID,它表识一个基本的工作单元，比如发怂一个HTTP请求
true：表示是否要将改信息输出到Zipkin等服务中来收集和展示

在一个服务请求链路的调用过程中，会包吃并传递同一个Trace ID,从而将整个分布于不容微服务进程中的请求跟踪信息串联起来。以上面输出内容为例，customer-server和hello-server同属于一个前端服务请求来源，所以他们的Trace ID是相同的，处于同一个请求链路中。通过Trace ID，我们就能将所有请求过程的日志关联起来。

在Spring Boot应用中，通过引入spring-cloud-starter-sleuth依赖之后，他会自动为当前应用构建起通道跟踪机制，比如：

通过RabbitMQ，Kafka等中间件传递的请求
通过Zuul代理传递的请求
通过RestTemplate发起的请求。

抽样收集

通过TraceID和SpanID已经实现了对分布式系统中的请求跟踪，而记录的跟踪信息最终会被分析系统收集起来，并用来实现对分布式系统的监控和分析功能。

理论上讲，收集的跟踪信息越多就可以越好的反应系统的真实运行情况，并给出更精准的预警和分析，但是在高并发的分布式系统运行时，大两的请求调用会产生海量的跟踪日志信息，如果收集过多对整个系统的性能也会造成一定的影响，同时保存大两的日志信息也需要很大的存储开销。所以在Sleuth中菜用了抽样收集的方式来为跟踪信息打商收集标记。也就是我们之前在日志信息中看到的第4个布尔类型的值，它代表了改信息是否要改后续的跟踪信息收集器获取或存储。

默认情况下，Sleuth会使用 zipkin brave的ProbabilityBasedSampler的抽样策略（现在已经不推荐使用），即以请求百分比的方式配置和收集跟踪信息，我们可以在配置文件中配置参数对其百分比值进行设置（它的默认值为 0.1，代表收集 10% 的请求跟踪信息）。

spring.sleuth.sampler.probability=0.5

而如果在配置文件中配置了 spring.sleuth.sampler.rate 的属性值，那么便会使用zipkin Brave自带的RateLimitingSampler的抽样策略。不同于ProbabilityBasedSampler菜用概况收集的策略，RateLimitingSampler是菜用的限速收集，也就是说它可以用来限制每秒跟踪请求的最大数量。

如果同时设置了 spring.sleuth.sampler.rate 和 spring.sleuth.sampler.probability 属性值，也仍然使用 RateLimitingSampler 抽样策略（即 spring.sleuth.sampler.probability 属性值无效）
RateLimitingSampler 策略每秒间隔接受的 trace 量设置范围：最小数字为 0，最大值为 2,147,483,647（最大 int）

整合Zipkin

Zipkin是twitter的一个开源项目，它基于Google Dapper实现，我们可以用它来实现收集各个服务器上的请求链路的跟踪。并通过它提供的REST API接口来辅助查询跟踪数据以实现对分布式系统的监控程序，从而及时发现系统中出现的延迟升高问题并找出系统性能瓶颈的根源。同时，Zipkin还提供了方便的UI组件来帮助我们直观地所搜跟踪信息和分析请求地链路明细，比如可以查询某段时间内各用户请求地处理时间等。

Spring Boot 2.x 以后官网不推荐使用源码方式编译，推荐使用官网编译好的jar执行。所以我们不熟Zipkin也使用jar包的方式。

1.下载Zipkin

我这里是到maven仓库中下载的。

https://search.maven.org/remote_content?g=io.zipkin.java&a=zipkin-server&v=LATEST&c=exec

下载完成后，使用java -jar命令启动zipkin。

2.引入依赖配置

为customer-server和hello-server的项目引入zipkin的包:

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-sleuth-zipkin</artifactId>
</dependency>

配置文件添加zipkin的地址:

spring.zipkin.base-url=http://localhost:9411

3.测试与分析

完成所有接入Zipkin的工作后，依次讲服务起来，浏览器发送请求做测试。

点击查找按钮，下方出现服务调用的信息。注意，只有在sleuth的最后一个参数为true的时候，才会讲改跟踪信息输出给Zipkin Server。

单击其中的某一个，还可以得到Sleuth跟踪到的详细信息。其中就包括时间请求时间消耗等。

单击导航栏中的依赖按钮，还可以查看到Zipkin根据跟踪信息分析生成的系统关系请求链路依赖关系图。

持久化到mysql

在SpringBoot2.0之前的版本，Zipkin-Server端由我们自己创建项目来搭建。可以比较灵活的选择数据持久化的配置，SpringBoot2.0之后的版本，Zipkin-Server端由官方提供，无需我们自己搭建，那么如何选择去配置将数据持久化到MySQL呢？

1.创建zipkin数据库

在下载好的zipkin-serve的jar包中，找到zipkin-server-shared.yml的文件，

在里面可以找到关于mysql的持久化配置，可以看到数据库名称默认为zipkin，

初始化mysql的脚本：https://github.com/openzipkin/zipkin/blob/master/zipkin-storage/mysql-v1/src/main/resources/mysql.sql

创建的数据库如下：

2.启动zipkin

在启动zipkin的时候，以命令行的方式启动，输入mysql的参数

java -jar zipkin-server-2.12.9-exec.jar --STORAGE_TYPE=mysql --MYSQL_HOST=127.0.0.1 --MYSQL_TCP_PORT=3306 --MYSQL_DB=zipkin --MYSQL_USER=root --MYSQL_PASS=root

3.测试与分析

浏览器访问，因为我这次调用服务超时了，触发了hystrix的断路器功能，所以这次有8个span。

关闭zipkin-server，然后重启，发现依然能够查询到上一次请求的服务链路跟踪数据。查看数据库表，发现数据都存储到表里了。

参考文章:

翟永超老师的《Spring Cloud微服务实战》

https://www.hangge.com/blog/cache/detail_2803.html

https://blog.csdn.net/Thinkingcao/article/details/104957540

到此这篇关于Spring Cloud 专题之Sleuth 服务跟踪的文章就介绍到这了,更多相关Spring Cloud Sleuth 服务跟踪内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

SpringCloud链路追踪组件Sleuth配置方法解析

1.官方文档 https://spring.io/projects/spring-cloud-sleuth 什么是Sleuth? 一个组件,专门用于追踪每个请求的完整调用链路最主要功能? 做日志埋点 2.添加依赖 <dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-sleuth</artifactId> </d
spring-cloud Sleuth的使用方法

一直没弄明白sleuth的tracerContext是如何创建和传递的,闲来无事研究了一下.由于对sleuth的源码不熟悉,准备通过debug brave.Tracer的nextId()方法,查看方法调用栈来找来龙去脉. 首先创建两个service A和B,记作srvA.srvB,在srvA中添加testA controller,sevB中添加testB controller,testA中通过Feign调用testB. 先看当用户通过浏览器调用srvA的时候,srvA是作为server的. co
Spring Cloud Sleuth整合zipkin过程解析

这篇文章主要介绍了Spring Cloud Sleuth整合zipkin过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 SpringCloud Sleuth 简介 Spring Cloud Sleuth为Spring Cloud实现了分布式跟踪解决方案. Spring Cloud Sleuth借鉴了Dapper的术语. Span:基本的工作单元.Span包括一个64位的唯一ID,一个64位trace码,描述信息,时间戳事件,key-va
浅谈Spring-cloud 之 sleuth 服务链路跟踪

这篇文章主要讲述服务追踪组件zipkin,Spring Cloud Sleuth集成了zipkin组件. 一.简介 Add sleuth to the classpath of a Spring Boot application (see below for Maven and Gradle examples), and you will see the correlation data being collected in logs, as long as you are logging re
SpringCloud整合分布式服务跟踪zipkin的实现

1.zipkin zipkin是Twitter的一个开源项目,它基于Google Dapper实现.我们可以使用它来收集各个服务器上请求链路的跟踪数据,并通过它提供的REST API接口来辅助我们查询跟踪数据以实现对分布式系统的监控程序,从而及时地发现系统中出现的延迟升高问题并找出系统性能瓶颈的根源.除了面向开发的API接口之外,它也提供了方便的UI组件来帮助我们直观的搜索跟踪信息和分析请求链路明细,比如:可以查询某段时间内各用户请求的处理时间等. zipkin的架构图如下: 由上面的架构图可以
Spring Cloud 专题之Sleuth 服务跟踪实现方法

目录准备工作实现跟踪抽样收集整合Zipkin 1.下载Zipkin 2.引入依赖配置 3.测试与分析持久化到mysql 1.创建zipkin数据库 2.启动zipkin 3.测试与分析在一个微服务架构中,系统的规模往往会比较大,各微服务之间的调用关系也错综复杂.通常一个有客户端发起的请求在后端系统中会经过多个不同的微服务调用阿里协同产生最后的请求结果.在复杂的微服务架构中,几乎每一个前端请求都会形成一条复杂的分布式的服务调用链路,在每条链路中任何一个依赖服务出现延迟过高或错误的时候都
Spring Cloud 整合Apache-SkyWalking实现链路跟踪的方法

什么是SkyWalking 查看官网https://skywalking.apache.org/ 分布式系统的应用程序性能监视工具,专为微服务.云原生架构和基于容器(Docker.K8s.Mesos)架构而设计. 安装进入下载页面https://skywalking.apache.org/zh/downloads/ 这里用的是ElasticSearch 7版本,所以你需要安装完成ElasticSearch 7,不再赘述. 解压后,可以修改启动端口 apache-skywalking-apm-b
Spring Cloud 使用 Resilience4j 实现服务熔断的方法

目录 CircuitBreaker 断路器隔舱Bulkhead 限速器RateLimiter CircuitBreaker 断路器服务熔断是为了保护我们的服务,比如当某个服务出现问题的时候,控制打向它的流量,让它有时间去恢复,或者限制一段时间只能有固定数量的请求打向这个服务.这些都是保护措施.我在实际工作中也确实遇到过,数据库出现问题了,进而导致Web服务出现问题了,导致不依赖数据库的服务也出现问题了,出现一连串问题. 这次学习<玩转 Spring 全家桶>,丁雪丰老师给了使用resili
教你Spring Cloud保证各个微服务之间调用安全性

导读:在微服务的架构下,系统会根据业务拆分为多个服务,各自负责单一的职责,在这样的架构下,我们需要确保各api的安全性,也就是说服务不是开放的,而是需要授权才可访问的,避免接口被不合法的请求所访问. 但是在在微服务集群中服务之间暴力的接口,或者对于第三方开放的接口如果不做及安全和认证,后果可想而知. 阅读下文之前思考几个问题: 如何在restTemplate远程调用请求增加添加统一认证? 服务认证如何规范加密和解密? 远程调用统一什么协议比较合适? 如下图,三个服务注册到同一个注册中心集群,服务
spring cloud consul注册的服务报错critical的解决

测试spring cloud 使用consul注册服务的时候,出现critical,如下: 怎么解决这个问题,现在只能看到health check检查失败了. 受限调用这个请求Get http://consulIp:8500/v1/agent/checks,调完请求,就会拿到返回数据: { ...... "service:test-service-xx-xx-xx-xx": { "Node": "zookeeper-server1", "
Spring Cloud多个微服务之间调用代码实例

这篇文章主要介绍了Spring Cloud多个微服务之间调用代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下现在又一个学生微服务 user 和学校微服务 school,如果user需要访问school,我们应该怎么做? 1.使用RestTemplate方式添加config import org.springframework.cloud.client.loadbalancer.LoadBalanced; import org.spr
Spring Cloud Config配置文件使用对称加密的方法

补充使用Spring Cloud Config加密功能需要下载JCE扩展,用于生成无限长度的密文.链接:http://www.oracle.com/technetwork/java/javase/downloads/jce8-download-2133166.html 下载完成之后解压,把得到到两个Jar包复制到$JAVA_HOME\jre\lib\security目录下. 简介在真实项目环境下,我们不会在配置文件中明文存储密码等机密性文本,以防被窃.Spring Cloud Config提
Spring Cloud 配置中心内容加密的配置方法

从配置获取的配置默认是明文的,有些像数据源这样的配置需要加密的话,需要对配置中心进行加密处理. 下面使用对称性加密来加密配置,需要配置一个密钥,当然也可以使用RSA非对称性加密,但对称加密比较方便也够用了,这里就以对称加密来配置即可. 1.安装JCE JDK下的JCR默认是有长度限制的,需要替换没有长度限制的JCE版本. http://www.oracle.com/technet... 把下载包里面的两个jar文件复制替换到JAVA_HOME/jre/lib/security目录下. 2.添加加
详解Spring Cloud Zuul网关修改为短连接方法

目录一.问题分析二.解决方式一.问题分析之前在用zuul网关的时候,请求几次然后连接就断开了.原因是因为http1.1之后,默认走的都是connection=keep-alive 长连接.但没有心跳维持,顾1分钟断开一次.但RestFul一般都是走短连接就行了.因此想着只要修改头部connection属性就行了. 就是在过滤器中修改Zuul的RequestContext ctx对象 //设置请求为短连接 ctx.addZuulRequestHeader("connection"
Spring Cloud Stream如何实现服务之间的通讯

Spring Cloud Stream Srping cloud Bus的底层实现就是Spring Cloud Stream,Spring Cloud Stream的目的是用于构建基于消息驱动(或事件驱动)的微服务架构.Spring Cloud Stream本身对Spring Messaging.Spring Integration.Spring Boot Actuator.Spring Boot Externalized Configuration等模块进行封装(整合)和扩展,下面我们实现两个