OpenTelemetry 人物 - KubeCon EU 2025

我们迎来了第四期《OpenTelemetry 人物》,这一次来自伦敦 KubeCon EU。我和Reese Lee再次采访了 OpenTelemetry 的贡献者和最终用户,了解了他们是如何参与到 OTel 中的。

此外,特别感谢

  • Reese Lee,我的联合采访者
  • Henrik Rexed 提供音频和视频录制设备,并对原始素材进行初步编辑

你可以在这里观看完整录制内容


感谢所有至今为止为 OpenTelemetry 做出贡献的人。我们期待你们在 2025 年及以后继续贡献!🎉

文字记录

如果您更喜欢阅读,请查看以下我们对话的文字记录。

1- 认识 OTel 的人物

MARYLIA GUTIERREZ: 我叫 Marylia Gutierrez。我是 Grafana Labs 的首席软件工程师。我还活跃在 OpenTelemetry 的几个不同小组中。

ADRIEL PERKINS: 我叫 Adriel Perkins。我是美国一家名为 Liatrio 的咨询公司的首席工程师。我们既是最终用户,也是 OpenTelemetry 项目的贡献者。我是 CI/CD SIG 的联合负责人,与 CNCF 大使 Dotan Horvitz 一起工作。我们在 Collector 以及规范存储库中都有贡献。

HANSON HO: 我叫 Hanson Ho,我做 Android 相关工作。特别是 Embrace 公司在 Android 上的可观测性工作。

JAMIE DANIELSON: 我叫 Jamie Danielson。我是 Honeycomb 的一名工程师,我从事仪表盘库和 OpenTelemetry 的工作。

MIKKO VIITANEN: 我是 Mikko Viitanen。我在 Dynatrace 担任产品经理。然后我还是 OTel Demo App 的维护者。

DAMIEN MATHIEU: 我是 Damien Mathieu,我在 OpenTelemetry 做很多事情。我是 OpenTelemetry Go 的维护者。我还是 Collector 中所有关于 profiling 的代码所有者。并且我是 eBPF profiler 的批准者。

JACOB ARONOFF: 我叫 Jacob Aronoff。我是 Omelet 的 CTO。我们是一家新的初创公司,从事可观测性、遥测管道和 OpenTelemetry 的通用工作。

ALOLITA SHARMA: 大家好。我是 Alolita Sharma,我在 Apple 领导 AIML,负责可观测性工程和可观测性基础设施。

2- 你是如何参与到 OpenTelemetry 中的?

MARYLIA GUTIERREZ: 我开始接触 OpenTelemetry 是因为我已经在可观测性领域工作了一段时间,最终你会了解到 OpenTelemetry,并发现这是一种非常棒的工作方式,并且没有依赖性。

ADRIEL PERKINS: 我最初参与 OpenTelemetry 是因为有人让我看一个企业级可观测性解决方案,那时我发现了 OpenTelemetry,特别是 Collector。我之所以发现它,是因为我们有来自不同地方的各种数据源,我们想将它们集中起来,以便获得一个全面的视图。所以这是我的第一次接触,当时我正在寻找 OpenTelemetry 及其 Collector。我当时就觉得,这东西真的、真的、真的太棒了。

HANSON HO: Embrace 寻求如何能更好地服务社区。因此,OpenTelemetry 自然成为了我们关注的对象,因为它是一个开放的框架,大家都可以贡献到通用标准中。当我看到它时,我心想,太好了,这正是我们所需要的。我们曾经有一个专有的 SDK 收集专有的信号发送到我们自己的服务器。有了 OpenTelemetry,我们就可以在不改变 SDK 内部大量代码的情况下,扩展数据发送的目的地,比如开源的 Collector。当我开始研究它时,我心想,嘿,看看移动端。移动端很棒。当时,除了少数例外,很少有人关注 OpenTelemetry 的移动端领域。而且,我觉得自从我参与进来一年左右的时间里,情况已经发生了很大变化,引起了更多的关注。所以我很高兴能参与其中。

JAMIE DANIELSON: 2021 年我开始在 Honeycomb 工作时,我所在的团队开始更多地从事 OpenTelemetry 的工作,以及可观测性和仪表盘库。所以,我开始涉足 Collector 和一些 Java 方面的工作,然后逐渐专注于 OpenTelemetry JavaScript。在过去的三年里,我成为了该项目的批准者,最近更是成为了维护者。

MIKKO VIITANEN: 我大约在三年前开始接触 OpenTelemetry,我开始为 OTel Demo App 做一些小的贡献。我发现这是一个很好的地方,可以学习仪表盘的基础知识以及 Collector 配置。我觉得 Demo App 实际上提供了代码和实践方面的所有内容。所以我觉得它很好。

DAMIEN MATHIEU: 我当时在另一家公司的一个可观测性团队工作,我相当沮丧,因为我很难。我当时已经确信,我们不应该只使用日志,还应该进行跟踪,因此使用 OpenTelemetry。当时很难说服我们公司的一些人。所以,作为 2022 年的新年决心,我决定开始关注 OpenTelemetry Go 存储库并开始贡献。一件事接一件事,一年后,我找到了一份全职工作,专门从事 OpenTelemetry。

JACOB ARONOFF: 我的 OTel 之旅始于我的前雇主 Lightstep。我最初在遥测管道团队工作,与 OTel 生态系统中一些优秀的贡献者一起。我从 Kubernetes 方面入手,负责 OpenTelemetry Operator,并对 Target Allocator 进行了升级,该分配器负责 Collector 的 Prometheus 抓取目标的水平分片。这是生态系统中一个非常技术性但非常重要的部分。

ALOLITA SHARMA: 我参与 OpenTelemetry 已经有六年多了。当时我在 AWS 工作,我一直积极参与开源项目,从最初的 Linux 开始。在我云原生世界的旅程中,当我还在 AWS 构建平台服务时,我们决定,您知道,要构建新一代的 Kubernetes 原生服务。我们团队有机会参与所有崭新的开源可观测性项目,这真的令人兴奋。当然,OpenTelemetry 处于领先地位。这发生在 OpenTracing 和 OpenCensus 合并形成 OpenTelemetry 之后不久,这是一个令人兴奋的变化,现在看到了这个拥有来自两个项目贡献者的美丽新项目,并吸引了像我这样的新贡献者加入。

3- 可观测性对你来说意味着什么?

MARYLIA GUTIERREZ: 对我来说,可观测性意味着你能够找到那些你甚至不知道自己想知道的事情,因为你拥有大量信息。但仅仅拥有信息并没有意义,如果你不知道如何解读。所以,正如他们所说,它实际上源于机械工程。那是试图理解系统,然后你可以将其应用于一切。因此,找到一种理解你系统一切的方法,甚至可以将可观测性带入你的生活,让你了解正在发生的事情。

ADRIEL PERKINS: 可观测性对我个人来说意味着什么?它使我能够发现我不知道的事情并加以改进。我一直是一个热爱持续学习和持续改进的人,而可观测性就是帮助我做到这一点的事情,因为有很多事情是我不知道的。我认为,我越发现自己知道的东西越多,我就越意识到还有更多我不知道的东西。所以可观测性确实帮助我发现了这一点。既有技术层面,比如各种不同的应用程序和服务。但它也帮助我在社会技术方面做到了这一点。对吧?因此,我作为软件开发生命周期一部分所能发现和发现的遥测数据,使我成为一名更好的工程师。所以它就是为我自己的发现提供了帮助。

HANSON HO: 可观测性。我的意思是,用 Hazel Weekly 的话来说,就是关于提出问题并得到答案,特别是那些你最初认为不需要问的问题,然后采取行动。能够从你的数据中行动和学习。它不仅仅是遥测。它是关于。它是通过数据来理解你的系统。

JAMIE DANIELSON: 可观测性意味着对你的系统有洞察力。它是关于理解你的应用程序是如何工作的,你的系统是如何工作的,并能看到你甚至不一定知道重要的事情,直到问题发生。所以能够找到你服务中的那些未知之知,并能够理解那些可能否则无法理解的事情。

MIKKO VIITANEN: 我实际上在很多年前就联想到过…我曾经在电信网络工作过,是的,可观测性非常非常关键。所以,想想你在这里或例如从美国拨打一个电话。电话会经过多个节点,甚至多个运营商。所以,没有可观测性,你就无法查明问题。所以客户会打电话来说,嘿,我的电话为什么断了?所以,你绝对需要拥有非常强大的可观测性才能找出问题所在并查明问题。

DAMIEN MATHIEU: 在从事可观测性工作之前,我曾多年从事,我想是 SRE 或同等职位。我还负责过事件管理,是的,我曾担任过事件指挥官。所以,我经历过许多事件,试图找出根本原因。很难找出原因,因为它发生在周日早上之类的。是的,我不想再经历那种情况了。从事可观测性工作可以确保,如果我回到 SRE 和运营角色,情况会更好。而且,如果[…],对其他人来说也会更好。

JACOB ARONOFF: 对我个人而言,就是了解你的系统在任何给定时间正在发生什么。我通常将可观测性视为,你知道,了解你正在运行的服务器的健康状况。我使用的类比是,当你驾驶汽车时,你的面前有一个仪表盘,上面有,你知道,很多仪器,很多测量值,告诉你汽车是否在有效运行。可观测性也是如此。但对于服务器来说,其规模要比一辆汽车大得多。

ALOLITA SHARMA: 可观测性很重要,因为我认为,你知道,可观测性作为一门学科,尤其是对于云原生基础设施和应用程序而言,是确保你的应用程序和基础设施可观测、可运行的关键部分。作为一名软件工程师,尤其是分布式系统工程师,如果你正在构建应用程序并使用云原生基础设施,无论是公共云还是非公共云的本地 Kubernetes 基础设施,你不可避免地会处理和使用许多复杂的微服务,因此,从第一天起,就在你的应用程序和基础设施中内置可观测性就至关重要。就目前的可观测性而言,它不仅仅是遥测数据的收集,我们有,你知道,我们有数万亿 PB 的数据,不仅由应用程序生成,现在还包括模型以及基础设施,而且还要看整个解决方案在存储、性能、分析和可视化方面的运作方式。

4- OpenTelemetry 对你来说意味着什么?

MARYLIA GUTIERREZ: 对我来说,OpenTelemetry 意味着你不需要依赖任何人,它也关乎社区。所以,这是一种让每个人都能一起工作的方式,你通常会找到你的竞争对手,但实际上你们会一起工作。你参加会议或进行结对编程,你只是想看到…这个社区的发展。你希望人们能够通过共同努力来解决他们的问题。

ADRIEL PERKINS: OpenTelemetry 意味着什么?它意味着很多事情,因为它做了很多工作。能够接触到各个不同的部分,对我来说,它赋予了巨大的意义,但对我来说,它真的意味着它是任何可观测性堆栈中的核心。如果我有 OpenTelemetry,那么我就能弄清楚我需要做的事情,无论我后端使用的是哪个供应商。

HANSON HO: 我认为 OpenTelemetry 是一个让大家能够一起工作的机会,你知道,也许目标略有不同,但都在为所有人实现同一个目标而努力。我相信拥有一个开放的标准很重要,这样我们就能说同一种语言。我们需要一种可观测性的通用语。而不是使用那些没有真正增加太多价值的专有东西。 […] 说同一种语言。也许你们会用不同的方式来组织事物。让我们就词汇达成一致。让我们就字母达成一致。我相信 OpenTelemetry 为我们提供了机会,这样我们就能互相理解,而无需真的被困在同一个…你知道,平台围墙后面。

JAMIE DANIELSON: OpenTelemetry 对我来说有点特别。显然,我参与 OpenTelemetry 已经有几年了,但我喜欢这个概念,即一个厂商中立的标准,每个人都可以使用,大家都从这个标准中受益,而且大家来自四面八方。来自供应商、最终用户以及社区中热衷于此的各种人。这就像和一群朋友以及那些努力工作、互相负责并努力使这个项目做到最好的伙伴在一起。我喜欢这个概念,即供应商在他们的后端和他们的产品特性上竞争,而最终用户为了获得系统的可见性而对应用程序进行仪表盘化则变得更容易,这样他们就不必担心切换到另一个供应商时使用不同的代理。它非常开放,并且对人们来说更容易使用。

MIKKO VIITANEN: OpenTelemetry,就个人而言,我觉得它是一个很棒的开源项目典范,但我们身处一个竞争激烈的行业,并且有这么多公司,超过 100 家公司为 OTel 做出贡献,解决共同的问题并每天进行协作。所以,这感觉非常棒。我认为,这关乎社区和协作。

DAMIEN MATHIEU: 对我来说。我认为,不仅仅是关于解决工程问题,而是,我认为真正的,全球社区非常友好和欢迎。我认为我们能够取得的成就非常令人印象深刻。拥有一个共同的、共享的理解,关于事情应该如何在 15 种不同的语言中工作,这些语言有非常不同的需求和问题,以及解决问题的不同方法,这取决于语言,以及我们作为人类已经能够解决这个问题,这确实非常令人鼓舞,我想。我还可以补充一点,我认为在当前的环境下,看到多家公司,甚至是竞争对手,联合起来构建一些东西,以便他们都能提供更好的价值,而不是仅仅固守自己的小角落,这确实非常罕见。所以,这些都是我发现的关于 OpenTelemetry 的非常了不起的方面。

JACOB ARONOFF: 对我来说,OpenTelemetry 是我们获取所有数据的方式,对吧?这是一个非常庞大的生态系统,人们已经同意应该有一种方法来做某件事,你知道,这是这个领域新颖的、通用的。回到汽车类比。你知道,你学习的是如何驾驶汽车,而不是如何驾驶日产或沃尔沃。对吧?同样,当你学习工程学时,重要的是要有标准,这样你就不必每次去不同的公司都要重新学习一切。对我来说,这就是 OpenTelemetry 的意义所在。

ALOLITA SHARMA: 所以,OpenTelemetry 今天差不多有 80 个存储库。正如你们中的许多人可能知道的,OpenTelemetry 是一个非常庞大的项目。它不仅仅是一组组件,而且还是一个非常棒的社区,在供应商和最终用户之间建立了合作关系和协作,以解决技术挑战并构建 OpenTelemetry 中最好的组件。所以对我来说,OpenTelemetry 不仅是构建云原生应用程序收集架构的组成部分,它也是一个很棒的社区,在这里你可以看到项目不同组件之间的互操作性,以及 OpenTelemetry 协议等开放标准被端到端实现,这确实是行业的变革者。我之所以强调 OpenTelemetry 协议,是因为它真正使用户能够构建端到端的解决方案,并开箱即用,而无需考虑,我的指标、日志、跟踪或配置文件的协议是什么,以及我们收集的所有数据,对吧?但我热爱 OpenTelemetry 这个项目和社区。而且,我喜欢处理所有我参与过的不同部分。我专注于 Collector。Collector contrib 组件,我们添加了集成,改进了 OpenTelemetry Collector 的 Operator,增加了更多的指标、性能特性,例如 Target Allocator 在 Operator 中的改进,以及改进跟踪和日志记录。

5- 你最喜欢的 OpenTelemetry 信号是什么?

MARYLIA GUTIERREZ: 我最喜欢的遥测信号…我仍然喜欢指标。我知道你开始会了解一些关于跟踪的信息,但我发现指标仍然几乎是信号的入口,因为它很容易向人们解释。它是一个数字。然后在这个数字之上,你可以添加,例如,属性,并在其之上获取更多数据。这样,当人们刚开始时,他们就不会被大的跟踪或大的跨度吓倒,但它至少可以吸引更多人进入这个领域。然后,你可以在此基础上进行扩展。

ADRIEL PERKINS: 最喜欢的遥测信号。这真的很难选择一个,因为你可以很好地将它们组合起来。我认为我一开始最喜欢的是指标,因为它们是我在 SDLC 中首先关注的东西。但随着我对跟踪和跟踪管道以及所有这些东西的深入了解,我才意识到它的强大之处。然后我可以从这些跟踪中推导出我需要的所有信号,并且可以直接嵌入其中。所以,我想我目前最喜欢的是跟踪。

HANSON HO: 嗯,跟踪确实是最强大的。所以我现在会选择它,因为你可以。是的,我们来谈谈跨度。是的,我们来谈谈跨度。爱跨度。Span Man。

JAMIE DANIELSON: 我最喜欢的 OpenTelemetry 信号可能是跟踪。我真的很喜欢跟踪。我喜欢从应用程序的一个地方开始,从一个服务开始,看到一个请求从头到尾、从一个服务到另一个服务的流程,并了解其流动方式,而这种可见性在其他情况下可能不会有。因为它是完整的连接跟踪。所以,是的,跟踪。我认为跟踪是我最喜欢的信号。

MIKKO VIITANEN: 我最喜欢的遥测信号。它们都很重要,但我主要,我选择分布式跟踪。我觉得它很特别,因为有了单一视图、单一瀑布图,你可以轻松获得概览。你可以查明问题。所以,如果你的请求被拒绝,你通常可以在视图中看到,是什么服务导致了拒绝。或者如果你的请求返回得非常慢。或者系统运行得非常慢。你可以在分布式跟踪中看到每个服务是如何累加的。所以这提供了很多洞察。

DAMIEN MATHIEU: 哦,我的同事可能会讨厌我。但它是跟踪。我说这话是因为,我做了很多 profiling 工作,而我共事的人真的靠 profiling 生存,是的,并且思考。我认为这两者都很重要。但 profiling 更多的是关于,无论一切正常,你想改进事情。而跟踪是关于,事情出了问题,你需要弄清楚原因。而且,这就是我如何接触 OpenTelemetry 的。这也是我自己的工作经验。这就是为什么我最喜欢的信号是跟踪。

JACOB ARONOFF: 在我看来,我最喜欢的遥测信号是跟踪。跟踪,你知道,在我看来是所有优点中的佼佼者。你可以推导出指标,推导出日志,你可以做很多非常重要的可视化,帮助你理解你的高层可观测性目标,以及你可能需要做的非常低级的调试。它最重要,而且我认为也最被误解。

ALOLITA SHARMA: 我最喜欢的遥测信号,我会说今天名列前茅的是指标和跟踪。我之所以这样说,是因为当你关注实时可观测性时,特别是对于 AI 应用程序,你知道,在下一代应用程序中,跟踪与 profiling 一起非常有价值,以便了解,你知道,模型行为以及软件应用程序行为。结合指标,你知道,通常是获取遥测和了解你的基础设施系统的标准方法,它提供了一种很好的方式,可以真正提供一个端到端的视图,从堆栈的最高层到最低层,实现可观测性和可观测组件。

立即加入我们!

如果您有关于您如何在组织中使用 OpenTelemetry 的故事要分享,我们很乐意倾听!分享方式

请务必在 MastodonBlueskyLinkedIn 上关注 OpenTelemetry,并使用 **#OpenTelemetry** 标签分享你的故事!

别忘了订阅我们的 YouTube 频道,观看更多精彩的 OpenTelemetry 内容!

最后修改日期 2025 年 10 月 2 日:[CI] 升级所有依赖项 (#7978) (28d760e7)