OpenTelemetry Collector 调查见解

博客文章在发布后不会更新。这篇文章已经发布一年多了,其内容可能已过时,部分链接可能无效。在依赖任何信息之前,请务必核实。

OpenTelemetry (OTel) Collector 已成为观测和监控现代软件应用的核心工具。最近,终端用户 SIG 进行了调查,以收集用户关于 OTel Collector 使用体验的反馈。尽管我们收到的 186 份回复可能不具备统计学意义,但它们代表了一个很好的开端,并提供了宝贵的见解。这些见解包括用户部署实践和实施挑战的详细信息,这对于推动 OTel Collector 的未来发展至关重要。

关键要点

  • 公司通常拥有中到大型 Collector 部署
    • >5 个 Collector: 125/186
    • >10 个 Collector: 100/186
  • 构建自定义 Collector 二进制文件/分发版比预期更受欢迎(61/186),大多数人使用 OTel Collector Builder 来完成此操作(49/61)
  • 绝大多数部署 Collector 在 Kubernetes 上(150/186)
  • 与对新组件(14)的需求相比,对稳定性(59)、自观测性(53)和配置管理(59)的期望更高

详细见解

部署规模与环境

我们的发现表明 OTel Collector 在大规模使用方面表现强劲,53.8%(100/186)的受访者部署了超过 10 个 Collector,13.4%(25/186)运行了 5 到 10 个 Collector,22%(41/186)运行了 2 到 5 个 Collector。

Chart showing how many otel collectors people run in their organization

Kubernetes 是 Collector 部署的主要平台(80.6%),其次是虚拟机(33.3%)和裸金属(10.8%)。

Chart showing where people deploy their otel collectors

使用场景

OTel Collector 主要用作网关(64.5%),这表明它在聚合来自不同来源的遥测数据方面发挥着关键作用。Daemonsets(51.6%)和 sidecars(23.7%)也是流行的部署模式,展示了 OTel Collector 在不同操作环境下的灵活性。

Chart showing the usage scenarios of the otel collector

定制与配置

令人惊讶的是,有很多人构建了自己的 Collector 发行版(61/186),这表明提供一个可组合的 Collector 对社区很重要。大多数构建自己 Collector 发行版的人使用 OTel Collector Builder (OCB)(49/61)。在 49 位使用 OCB 的受访者中,大多数人都能摸索出来,只有 2 位受访者表示它太难用了。

Chart showing how easy people find it to use the otel collector builder

监控与可观测性

在监控 Collectors 方面,绝大多数受访者依赖 Collector 指标和日志(81.7%),只有少数人根本不监控他们的 Collector(16.6%)。当我们深入研究数据时,我们发现,在 125 位拥有超过 5 个 Collector 的受访者中,只有 15 位没有监控他们的 Collector,而在拥有超过 10 个 Collector 的 100 位受访者中,只有 9 位没有监控他们的 Collector。这似乎表明,一旦用户在 Collector 部署方面达到一定的成熟度,他们就会认真对待监控他们的 Collector。

Chart showing how people monitor their otel collector

OTel 组件使用情况

OTel Collector 的灵活性体现在各种环境中使用的各种导出器、接收器、处理器、连接器和扩展器中。这突显了 Collector 与各种工具和系统集成的能力。

根据我们的调查结果,排名前几位的组件如下:

导出器

  1. otlpexporter
  2. prometheusremotewriteexporter
  3. prometheusexporter
  4. lokiexporter
  5. debugexporter

接收器

  1. otlpreceiver
  2. prometheusreceiver
  3. filelogreceiver
  4. hostmetricsreceiver
  5. k8sclusterreceiver

处理器

  1. batchprocessor
  2. attributesprocessor
  3. filterprocessor
  4. memorylimiterprocessor
  5. k8sattributesprocessor

连接器

  1. spanmetricsconnector
  2. servicegraphconnector
  3. routingconnector
  4. countconnector
  5. datadogconnector

扩展

  1. healthcheckextension
  2. basicauthextension
  3. pprofextension
  4. bearertokenauthextension
  5. oauth2clientauthextension

要更详细地了解正在使用的特定导出器、接收器、处理器、连接器和扩展器,您可以查看 原始结果。这些数据清晰地展示了社区中的流行选择以及体现 OTel Collector 可定制性的细微配置。

改进领域

受访者明确表示希望在稳定性(30.6%)、配置管理和解析(30.1%)以及自观测性(28%)方面进行增强,而不是希望有新组件(<8%)

Chart showing interested areas of improvement for the otel collector

OTel Collector 调查结果提供了 Collector 部署和利用率当前状态的快照。显而易见,尽管 OTel Collector 被广泛采用且高度可定制,但仍有机会使其更加用户友好和健壮。

保持联系

感谢所有参与调查的人!我们依赖您的反馈来指导 OpenTelemetry 的未来发展,并确保它能持续满足您不断变化的需求。

我们将在以下渠道发布即将进行的调查: #otel-sig-end-user Slack 频道 – 您也可以在此处联系我们! 终端用户资源页面