对于后端开发来说,排查问题是常有的事情。而排查问题时最常用的就是看日志,看一次调用中经过了哪些系统,是那个系统出问题了。这就需要业务日志中关联调用链的TraceId信息,从而在应用出现问题时,能够通过调用链的TraceId快速关联到业务日志,及时定位分析、解决问题。
之前从事的公司都有这种链路中间件,现在阿里集团的eagleeye 鹰眼系统也是的,接入使用就行了,但是原理完全不清楚。不了解TraceId怎么生成的,怎么在系统之间传递。所以今天先来实现一个最简单的TraceId
解决方案
- 自己生成 traceId 并 put 到 MDC 里面
MDC
MDC(Mapped Diagnostic Context)是一个映射,用于存储运行上下文的特定线程的上下文数据。因此,如果使用log4j进行日志记录,则每个线程都可以拥有自己的MDC,该MDC对整个线程是全局的。属于该线程的任何代码都可以轻松访问线程的MDC中存在的值。请求时,将TraceId放在header里,服务方从header里读取出来,并在日志上打印即可
如何将TraceId放到MDC中
1.日志文件logback-spring.xml
配置
打印彩色日志,需要在日志格式中加上[%X{TRACE_ID}]
,变量名TRACE_ID是自己定义的
<?xml version="1.0" encoding="UTF-8"?>
<configuration scan="true" scanPeriod="60 seconds">
<contextName>logback</contextName>
<!-- name的值是变量的名称,value的值时变量定义的值。通过定义的值会被插入到logger上下文中。定义变量后,可以使“${}”来使用变量。 -->
<property name="log.path" value="log" />
<!-- 彩色日志 -->
<!-- 彩色日志依赖的渲染类 -->
<conversionRule conversionWord="clr" converterClass="org.springframework.boot.logging.logback.ColorConverter" />
<conversionRule conversionWord="wex" converterClass="org.springframework.boot.logging.logback.WhitespaceThrowableProxyConverter" />
<conversionRule conversionWord="wEx" converterClass="org.springframework.boot.logging.logback.ExtendedWhitespaceThrowableProxyConverter" />
<!-- 彩色日志格式,注意加上TRACE_ID -->
<property name="CONSOLE_LOG_PATTERN" value="${CONSOLE_LOG_PATTERN:-%clr(%d{yyyy-MM-dd HH:mm:ss.SSS}){faint} %clr(${LOG_LEVEL_PATTERN:-%5p}) %clr(${PID:- }){magenta} %clr(---){faint} %clr([%15.15t]){faint} %clr(%-40.40logger{39}){cyan} %clr(:){faint} [%X{TRACE_ID}] %m%n${LOG_EXCEPTION_CONVERSION_WORD:-%wEx}}"/>
<!--输出到控制台-->
<appender name="CONSOLE" class="ch.qos.logback.core.ConsoleAppender">
<!--此日志appender是为开发使用,只配置最底级别,控制台输出的日志级别是大于或等于此级别的日志信息-->
<filter class="ch.qos.logback.classic.filter.ThresholdFilter">
<level>info</level>
</filter>
<encoder>
<Pattern>${CONSOLE_LOG_PATTERN}</Pattern>
<charset>UTF-8</charset>
</encoder>
</appender>
<root level="info">
<appender-ref ref="CONSOLE" />
</root>
</configuration>
2.新增拦截器
拦截所有请求,从header里取出traceId然后放到MDC中,这样该工程所有位置都能读取到。如果header里没有,则自己生成一个,生成规则可参考阿里云帮助文档: TraceId 和 SpanId 生成规则
@Component
public class LogInterceptor implements HandlerInterceptor {
private String TRACE_ID = "TRACE_ID";
@Override
public boolean preHandle(HttpServletRequest request, HttpServletResponse response, Object handler) throws Exception {
//如果有上层调用就用上层的ID
String traceId = request.getHeader(TRACE_ID);
if (traceId == null) {
traceId = UUID.randomUUID().toString();
}
MDC.put(TRACE_ID, traceId);
return true;
}
@Override
public void postHandle(HttpServletRequest request, HttpServletResponse response, Object handler, ModelAndView modelAndView)
throws Exception {
// Do nothing because of no business
}
@Override
public void afterCompletion(HttpServletRequest request, HttpServletResponse response, Object handler, Exception ex)
throws Exception {
//调用结束后删除
MDC.remove(TRACE_ID);
}
}
3.注册拦截器
将上一步的日志拦截器注册,并拦截所有路径的HTTP请求,让其生效
@Configuration
public class WebConfig implements WebMvcConfigurer {
@Resource
private LogInterceptor logInterceptor;
@Override
public void addInterceptors(InterceptorRegistry registry) {
registry.addInterceptor(logInterceptor)
.addPathPatterns("/**");
}
}
4.测试效果
到这一步就可以试试日志打印TraceId的效果了,随便写一个接口,并打印日志。如下图已经成功打印出Traceid了
其他方案
上面演示的是最简陋的方式,公司内部一般都会再造一遍轮子,让各个应用接入使用的。后面再写几个开源的TraceId生成框架,更深入的去了解全链路治理