链路追踪介绍

一、背景介绍

早期解决方案：最初，开发者使用自定义日志和监控工具来尝试追踪请求，但这种方法难以扩展和维护。
标准化和工具化：随着分布式系统的普及，业界开发了标准化的链路追踪协议（如 OpenTracing、OpenTelemetry）和开源工具（如 Jaeger、Zipkin、skywalking），以支持跨服务的追踪和分析。

追踪（Trace）：一次追踪表示一个请求从开始到结束的完整路径。追踪由一个或多个跨度（Span）组成。

跨度（Span）：跨度是追踪中的一个基本单元，表示一次操作或服务调用。每个跨度记录了操作的开始时间、结束时间、服务名称、操作名称等信息。

上下文传递：链路追踪系统通过上下文传递机制，将追踪信息（如追踪 ID 和跨度 ID）从一个服务传递到下一个服务，确保追踪信息的完整性。

注入上下文：在请求进入系统时，链路追踪工具会注入追踪上下文（如追踪 ID 和跨度 ID）到请求的头部或元数据中。

记录跨度：每个服务在处理请求时，会创建并记录一个或多个跨度，记录处理开始和结束的时间点、服务名称以及相关的元数据。

发送数据：各服务将跨度数据发送到链路追踪系统（通常是一个集中式的追踪存储或服务），这些数据被汇总并用于后续分析。

可视化和分析：追踪系统将收集的数据可视化为请求流图，显示每个请求的路径、耗时、依赖关系等信息。用户可以通过这些视图分析系统性能、发现瓶颈和调试问题。

链路追踪提供了深入的分布式系统观察能力，通过可视化请求路径和性能数据，帮助团队更好地管理和优化复杂系统。