Collector 数据流仪表板

监控 OpenTelemetry Collector 中的数据流至关重要,原因有很多。宏观地了解传入数据(例如采样计数和基数)对于理解 collector 的内部动态至关重要。然而,深入了解细节时,相互连接可能会变得复杂。Collector Data Flow Dashboard 旨在演示 OpenTelemetry 演示应用程序的功能,为用户提供一个坚实的基础。Collector Data Flow Dashboard 在监控哪些指标方面提供了宝贵的指导。用户可以通过添加特定于其用例的必要指标(例如 memory_delimiter 处理器或其他数据流指示器)来定制自己的仪表盘变体。此演示仪表盘可作为起点,使用户能够探索各种用例并将该工具适应其独特的监控需求。

数据流概述

下面的图表提供了系统组件的概述,展示了由 OpenTelemetry 演示应用程序使用的 OpenTelemetry Collector (otelcol) 配置文件衍生的配置。此外,它还突出了系统内的可观察性数据(跟踪和指标)流。

OpenTelemetry Collector Overview

入口/出口指标

下面图表中显示的指标用于监控出口和入口数据流。这些指标由 otelcol 进程生成,通过端口 8888 导出,然后由 Prometheus 抓取。与这些指标相关的命名空间是“otelcol”,作业名称标记为 otel.

OpenTelemetry Collector Ingress and Egress Metrics

标签是识别特定指标集(例如导出器、接收器或作业)的有价值的工具,能够区分整体命名空间内的指标集。需要注意的是,只有在内存限制(在内存分隔器处理器中定义)超出时,才会遇到被拒绝的指标。

入口跟踪管道

  • otelcol_receiver_accepted_spans
  • otelcol_receiver_refused_spans
  • 按(接收器,传输)

入口指标管道

  • otelcol_receiver_accepted_metric_points
  • otelcol_receiver_refused_metric_points
  • 按(接收器,传输)

处理器

目前,演示应用程序中唯一的处理器是批处理器,跟踪和指标管道都使用它。

  • otelcol_processor_batch_batch_send_size_sum

出口跟踪管道

  • otelcol_exporter_sent_spans
  • otelcol_exporter_send_failed_spans
  • 按(导出器)

出口指标管道

  • otelcol_exporter_sent_metric_points
  • otelcol_exporter_send_failed_metric_points
  • 按(导出器)

Prometheus抓取

  • scrape_samples_scraped
  • 按(作业)

仪表盘

您可以访问仪表盘,方法是导航到 Grafana UI,在屏幕左侧的浏览图标下选择“OpenTelemetry Collector”仪表盘。

OpenTelemetry Collector dashboard

仪表盘有四个主要部分

  1. 进程指标
  2. 跟踪管道
  3. 指标管道
  4. Prometheus抓取

第 2、3 和 4 部分使用上述指标表示整体数据流。此外,还为每个管道计算导出比率以了解数据流。

导出比率

导出比率基本上是接收器和导出器指标之间的比率。您会注意到上面仪表盘的屏幕截图显示,指标的导出比率远高于接收的指标。这是因为演示应用程序配置为生成 span 指标,这是一个从 collector 内部的 span 生成指标的处理器,如概述图所示。

进程指标

仪表盘中添加了非常有限但信息丰富的进程指标。例如,在重启或类似情况下,您可能会观察到系统中运行不止一个 otelcol 实例。这对于理解数据流的峰值非常有用。

OpenTelemetry Collector Process Metrics