【Trace】分布式追踪系统相关概念
参考信息:https://blog.csdn.net/weixin_72186894/article/details/131883447?spm=1001.2014.3001.5501
一、链路追踪
链路追踪中系统中
- Trace(追踪):是指一个请求或者一个操作从开始到结束的完整路径。它涵盖了分布式系统中所有相关组件的调用关系和性能信息。具体来说,Trace包含了一系列的span(跨度),每个span代表了一个组件的调用或操作。
- span(跨度):一个span会记录下该组件的开始时间、结束时间、耗时、操作类型等信息。通过组合多个Span,就可以构成一个完整的Trace,描述了请求在分布式系统中的流转过程。
Trace的概念在分布式系统中非常重要,它可以帮助开发人员跟踪请求的路径,了解每个组件的耗时情况,从而定位性能瓶颈和系统故障。
通过分析Trace数据,开发人员可以发现系统中的瓶颈点,并进行调优和优化,以提升系统的性能和稳定性。
理解:一条完整的链路就是一个trace,用来描述一条完成的链路。
二、关联关系
在链路追踪中,Trace(追踪)与Span(跨度)之间有三种主要的关系类型,包括:
- 单个Trace包含多个Span(One Trace, Multiple Spans):一个Trace代表了一次请求或操作的完整路径,由多个Span组成。每个Span代表一个组件的调用或操作。
- Span属于同一个Trace(Spans belong to the same Trace):当多个Span被纳入到同一个Trace中时,它们共享同一个Trace ID,表示它们属于同一个请求或操作。Trace ID用于标识整个Trace,而Span ID用于标识各个Span。
- Span之间存在父子关系(Parent-Child relationship between Spans):在一个Trace中,Span之间可以存在父子关系,表示调用链路的嵌套关系。父Span调用了一个或多个子Span,形成了父子关系。父Span会包含一个或多个子Span
三、Trace属性
- 【Trace ID】(追踪标识):每个Trace都有一个唯一的Trace ID,用于标识整个Trace。Trace ID可以在整个分布式系统中跨越多个组件和服务,帮助我们在调用链路中跟踪请求和操作。
- 【Span ID】(跟踪分段标识):每个Span都有一个唯一的Span ID,用于标识这个Span。Span ID在一个Trace中是唯一的,可用于识别和追踪Span。
- 【时间戳(Timestamp)】:每个Span都会记录开始时间和结束时间的时间戳。这些时间戳用于计算Span的持续时间以及在整个Trace中的时间顺序。
- 【操作(Operation)】:每个Span代表一个具体的操作或调用,比如搜索商品、添加到购物车等。
- 【标签(Tags)】:我们可以给Span添加标签来附加更多的元数据信息,比如请求的URL、响应状态码、用户ID等。这些标签可以帮助我们更好地理解Span的上下文和内容。
- 【父Span ID】(Parent Span ID):如果一个Span是另一个Span的子Span,那么它会包含父Span ID来建立父子关系。
三、Span的属性和类型
3.1、span的属性
每个Span都包含了一些关键的信息,如开始时间、结束时间、耗时、所属的Trace ID、Span ID等。
开始时间和结束时间记录了Span的执行时间,而Trace ID和Span ID用于标识Span所属的Trace和上下文关系。
3.2、span的类型
Span(跨度)可以包含多种类型,用于表示不同种类的调用和操作。下面是一些常见的Span类型:
- Entry Span(入口跨度):表示请求进入系统的第一个组件,通常是客户端发起的请求。Entry Span记录了请求的开始时间、请求的路径和入口点等信息。
- Exit Span(出口跨度):表示请求离开系统的最后一个组件,通常是系统对外提供的服务。Exit Span记录了请求的结束时间、请求的路径和出口点等信息。
- Local Span(本地跨度):表示请求在系统内部的一个组件间的调用。Local Span记录了请求在组件内的操作和耗时等信息。
- Remote Span(远程跨度):表示请求调用了位于不同主机或网络节点上的远程组件。Remote Span记录了请求调用远程组件的耗时和网络通信等信息。
- Error Span(错误跨度):表示系统中发生了错误或异常的Span。Error Span记录了错误发生的详细信息,如错误类型、错误码和错误堆栈等。
这些Span类型涵盖了分布式系统中常见的调用和操作场景,通过区分不同类型的Span,可以更好地分析和优化系统的性能和稳定性。
在链路追踪中,Span(跨度)是最小的单元,它代表了一次调用或操作的单个组件。每个Span记录了该组件的关键信息,如开始时间、结束时间、耗时等。通过组合多个Span,就可以构成一个完整的Trace(追踪),描述了请求在分布式系统中的流转过程。
由于Span是最小的单元,它可以记录组件间的调用关系、性能指标和错误状态等重要信息。通过分析和观察这些Span,可以了解请求的路径、耗时和错误等关键指标,从而进行性能优化、故障排查和系统调优。所以在链路追踪中,Span是对系统进行监测和分析的基本单元。
通过最小单元来对每一次具体的分布式服务之中的调用进行描述