OpenTelemetry 人物志

博客文章在发布后不会更新。这篇文章已经发布一年多了,其内容可能已过时,部分链接可能无效。在依赖任何信息之前,请务必核实。

对 OpenTelemetry 来说,今年是多么不平凡的一年!OTel Demo 迎来一周年OpenTelemetry 项目宣布 OpenTelemetry 规范正式可用基于跟踪的测试已添加到 OTel Demo,我们看到了一些激动人心OTel集成,更不用说我们在 2023 年举办了不止一次,而是两次可观测性日——一次是在阿姆斯特丹的 KubeCon 欧洲展,另一次是在芝加哥的 KubeCon 北美展。这些仅仅是亮点中的一小部分!在之前的OpenTelemetry 聚焦版本中还介绍了更多内容。

这一切的实现都离不开 OpenTelemetry 背后那些了不起的人们。无论您是维护者、贡献者还是实践者,我们都希望您知道,您所做的一切都很有意义!

因此,为了总结 2023 年,我采访了一些过去和现在参与 OTel 的人。

特别感谢Reese Lee的摄像工作!

你可以在这里观看完整录制内容


感谢所有迄今为止为 OpenTelemetry 做出贡献的人,我们期待您在 2024 年的贡献!🎉

文字记录

如果您更喜欢阅读,请查看下方我们对话的文字记录。

1- 认识 OTel 的人物

TYLER YAHN:我叫 Tyler Yahn。我是OpenTelemetry Go SIG的维护者。我们正在自动插桩规范方面做一些工作。

AMY TOBEY:我叫 Amy Tobey。我是 Equinix 的数字互连高级首席工程师。我维护一个名为OTel CLI的工具。

ADRIANA VILLELA:哦,您维护 OTel CLI!

AMY TOBEY:是的,那是我的项目。是的。目前它主要只有 Traces。我一直想实现 Logs 和 Metrics,而 Logs 最近才正式可用,所以是时候做了。但 Traces 一直非常有效,而且人们很喜欢,所以我并没有收到太多其他方面的需求。

ADRIANA VILLELA:OTel CLI 是 OpenTelemetry 的一部分吗?

AMY TOBEY:还没有。我是在我们的 Equinix Labs GitHub 帐户上维护它的。过程不多。大多数时候是我自己,偶尔有 Alex 等人会给我提个 PR。但我曾考虑将其带回社区。但也许我不能离标准太远,因为在命令行中操作,许多标准不太适用。所以在一些地方我稍微偏离了标准。这会很有意义。我跟 Austin 谈过。

ADRIANA VILLELA:嘿,Ted Young 和我在一起!你好!

TED YOUNG:你好!

CARTER SOCHA:我叫 Carter Socha。我做过几件不同的事情。我是少数几个产品经理之一,但我帮助启动了OpenTelemetry Demo,并且是其维护者。我还参与SIG Security,该部门帮助项目改进其安全响应流程。

BOGDAN DRUTU:我叫 Bogdan。我休了育儿假,现在刚回来。好吧,您以前在做什么?我做过很多事情,包括担任TC成员、GC成员、Collector的维护者。我曾是Java的维护者,所以做过很多事情。

CONSTANCE CARAMANOLIS:你好。我叫 Constance Caramanolis。

ADRIANA VILLELA:我知道您曾参与 OpenTelemetry,并且是早期贡献者之一。能谈谈您的参与经历吗?

CONSTANCE CARAMANOLIS:是的,我曾从事 OpenTelemetry Collector 的工作。我为它做出了贡献。我做了很多配置方面的事情。我还在 OpenTelemetry 治理委员会工作。所以,我参与了早期的大量工作,我们进行了孵化过程、启动了整个收集过程、POC、了很多流程的建立,并推动了采用。做了不少演讲,包括 KubeCon 的演讲……

JURACI PAIXĀO KRÖHLING:我叫 Juraci。我是一名软件工程师,几年来我一直从事 OpenTelemetry 系统或可观测性方面的工作。我来自 Tracing 背景,曾是Jaeger的维护者。我曾经是 OpenTracing 的一员,并帮助选择了我们项目当前的名称。现在我是一名 Collector 开发者。我帮助 OpenTelemetry Collector 的一些组件。我也是 OpenTelemetry 治理委员会的成员。

ADRIANA VILLELA:而且最近连任了,对吗?

JURACI PAIXĀO KRÖHLING:是的,我刚连任。

JACOB ARONOFF:我叫 Jacob Aronoff。我是OpenTelemetry Operator项目的维护者。

ALEX BOTEN:嗨,我是 Alex,我是 OpenTelemetry 的贡献者和维护者。我写过一本关于 OpenTelemetry 的书。我不知道还有什么。我做一些关于 OTel 的事情。很酷。我是 OpenTelemetry Collector 和OpenTelemetry Collector Contrib存储库的贡献者和维护者,并且在各种 SIG 和专门工作组中花费了大量时间,涉及配置和安全。之前我花了很多时间维护和贡献Python

PURVI KANAL:嘿,我叫 Purvi。我是一名高级软件工程师。我的职业生涯中,我曾大量接触浏览器和 JavaScript。

2- 可观测性对您意味着什么?

TYLER YAHN:是的,这是一个很好的问题。就个人而言,我认为可观测性意味着,当您凌晨 2 点醒来去解决一个问题时,您能够解决它。理想情况下,第二天您能够重新查看那段代码,并找到一种方法来永远消除这个问题。我认为这对我来说真正意味着的。

AMY TOBEY:这意味着您能够查看开箱即用的东西,并了解内部组件发生了什么。非常方便。

TED YOUNG:首先,它是监控……但实际上,可观测性是一个模糊的术语,但它作为我们思考如何监控系统的一种转变的一部分出现。我想说,我们过去的做法是,您拥有这些不同的信号,您需要日志,所以您有一个日志系统,您需要指标,您构建了一个指标系统,您需要跟踪,但您不知道那是什么,所以您不做。而不是拥有这三个独立的、完全孤立的系统,我们在过去几年中,尤其是在 OpenTelemetry 项目中,一直在努力说明这些事情分开是很糟糕的。或者说四件事,如果您包括剖析。

当您使用这些工具时,您将它们一起使用,您会在它们之间来回切换,对吗?比如,您会收到基于您设置的指标的警报。但当警报因错误或某种峰值而触发时,您接下来想做的是查看导致这些警报的事务中的日志。您想查看特定事务中的日志。您真的想在所有这些日志上都附带一个跟踪 ID,这样您就可以实际查找它们。所以我们希望实际一起使用所有这些工具。

为了能够一起使用所有这些工具,您需要有进入的数据,遥测数据实际上需要集成,所以您不能有三个独立的遥测流。然后在后端,就像,我想进行交叉引用。所有这些遥测数据都必须组织到一个实际的图中。您需要一个图形数据结构,所有这些单独的信号都属于这个结构。对我而言,这就是现代可观测性的一切。

它关于将所有这些数据连接到一个图中,以便我们可以利用机器做好它们擅长的事情,从而减少我们需要花费在调查问题上的时间。而不是像,“我不知道这是否是问题。”因此,我将收集所有日志并进行 grepping,尝试将其缩小到某个范围。我将自己查看所有配置文件,试图弄清楚发生了什么。您可以快速获得许多这些问题的答案,然后继续下一个假设。

我认为,通过现代可观测性节省的时间改变了我们实际实践的方式,这是一个持续的趋势。但随着 OpenTelemetry 今年有效地进入 GA,随着 Tracing、Metrics 和 Logs 的稳定,是的,终于,虽然晚了两年。但我们现在拥有了这个,我们现在拥有了包含所有这些相关性信息的遥测数据,您将开始看到新一波的分析工具,以及所有现有的工具,还有新构建的工具,它们利用了这些数据的可用性,并且它就像一个标准数据格式,一种专有数据格式,一种稳定数据格式。您可以依靠它。

所以,就像在构建您庞大的平台之上,或者构建某种只做一件事并做得很好的精品分析工具一样,是可以的。这就是我看到一切发展方向,这就是可观测性对我的意义。

CARTER SOCHA:可观测性对我的意义……就像,应用程序所有者可以看到他们环境中的情况,并回答与他们的业务相关的问题,以及如何改进他们的服务。

BOGDAN DRUTU:可观测性是当今一个被过度使用的术语,但它意味着能够监控并确定在生产环境中何时出现问题。

CONSTANCE CARAMANOLIS:可观测性意味着……对我来说意味着什么?我将其用作一种工具,以确保事物按您期望的方式运行。它能够深入了解黑盒甚至白盒。我更倾向于这样看待:您可以看到事物,但从中会产生更多问题,然后您会使用可观测性来弄清楚发生了什么。所以,我喜欢称之为“谋杀之谜”。

JURACI PAIXĀO KRÖHLING:这是一个好问题。我认为……我不会严格定义,我认为这真正意味着的是,这是我们理解问题的一种方式……我们在系统中遇到了问题……我们应该能够回答或确定是什么出了问题或发生了什么。无论它来自日志、指标还是跟踪,只要我们能说清楚并理解发生了什么。我认为那时我们就可以说我们拥有了可观测性。它不是非黑即白。它是一个光谱。我不期望从第一天开始就拥有完美的“可观测性”,但我期望拥有某种遥测数据来帮助我理解发生了什么。所以我认为遥测是通往我们理解系统所有信息的,可以说是“乌托邦式”地方的一种途径。

JACOB ARONOFF:可观测性对我来说意味着……我认为可观测性是理解您的应用程序内部正在发生的事情。也许是关于您关心的代码中发生的事情。是的。

ALEX BOTEN:我的天哪。它意味着一切。可观测性就是生命。我认为可观测性意味着,当出现问题时,我可以问一个关于我系统的问题,并大概了解发生了什么,而无需提前知道预期是什么。就像我可以去深入挖掘我的数据,并且我的服务得到了充分的插桩。不是说完美,而是足够好,让我能够弄清楚发生了什么。并且我可以在我自己的环境中重现这个在生产环境中可能发生的事情,以便下次我能更好地改进我的代码来管理它。

ADRIANA VILLELA:我喜欢您说的“插桩不完美”。没有什么是完美插桩的。那是谎言。就像没有“代码完成”一样,对吗?

ALEX BOTEN:那也是个谎言。或者说网络永远不会中断。那是谎言。

PURVI KANAL:哦,这个问题太好了。对我来说,可观测性实际上是关于能够对我的数据保持好奇心,并对我的生产系统拥有更多的信心。因此,能够在我们到来之前就解决问题。在生产环境中进行测试是测试系统的最佳方式,因为不管人们怎么说,生产环境总是截然不同的。如果您拥有非常好的可观测性,您就可以在生产环境中进行测试。这对您的用户和开发人员来说都是一种更好的体验。

3- 您是什么时候开始参与 OTel 的?

TYLER YAHN:我probably在 2019 年开始参与的。

ADRIANA VILLELA:哦,那么算是早期?

TYLER YAHN:早期,是的,我没有参加最初的会议,但是的,我真的很早就进来了。我真的很喜欢写 Go,所以我从那里开始。但我很快就接触了规范并开始在该领域工作,我认为这仅仅是源于运行系统时的痛点。并且成为那个凌晨 2 点醒来的人。我想要一个更好的软件解决方案,我认为我看到了它的价值,然后我加入了。

ADRIANA VILLELA:我们在痛苦和创伤中工作,对吗?

TYLER YAHN:是的,没错。

AMY TOBEY:当我被 Equinix 聘用时,他们聘请我为 Equinix Metal 产品对其整个堆栈进行插桩。这就是我第一年所做的工作。这已经是三年前了,当时还没有完善的 Fancy 自动插桩,我给所有系统添加了插桩。

ADRIANA VILLELA:所以您是 OpenTelemetry 的早期用户。

AMY TOBEY:一点点。

CARTER SOCHA:我在微软工作的团队,至少在我所在的部门,已经在 OpenTelemetry 领域做了很多工作,而且似乎那里发生了很多有趣的事情。所以这引起了我的兴趣。然后我调到一个专门从事 OpenTelemetry 的开发团队,用于外部和内部目的,因为微软在内部大量使用 OpenTelemetry。这就是我被介绍进来的原因。当我开始四处看看,想知道从哪里开始时,我意识到在实际应用中并没有真正好的 OpenTelemetry 使用示例。我认为这是每个供应商可能都有的问题。并且是我们作为社区可以共同解决的问题,而且我们已经解决了。

ADRIANA VILLELA:您从事 OpenTelemetry 工作多久了?

BOGDAN DRUTU:从一开始。

ADRIANA VILLELA:那么,大概 2019 年,还是更早?

BOGDAN DRUTU:甚至更早。

ADRIANA VILLELA:您是和 Ted 一起在……早期开始的吗?

BOGDAN DRUTU:不。实际上,当时有两个竞争项目合并成了 OpenTelemetry。

ADRIANA VILLELA:对。

BOGDAN DRUTU:所以我当时在另一个项目。

ADRIANA VILLELA:哪个,OpenCensus?

BOGDAN DRUTU:是的。

PURVI KANAL:我通过在 Honeycomb 工作接触到了 OpenTelemetry。我参与其中,并且对OpenTelemetry JavaScript,特别是 OpenTelemetry JavaScript 的浏览器端特别感兴趣。能够参与其中真是太好了。

4- OTel 对您意味着什么?

TYLER YAHN:我认为 OpenTelemetry 是,我的意思是,它是一个标准,我认为它是整个可观测性领域的合作。而且,我认为,它是所有插桩的未来之路。这意味着您没有任何供应商锁定,这意味着您只需要一个代码库,总能找到一种方法来查看系统。我认为这是我们未来长期改进软件的方式。

AMY TOBEY:OpenTelemetry 使我的生活更轻松,因为我可以将其与我正在使用的开源组件或专有组件集成。最终,所有 OpenTelemetry 都将流向我的可观测性供应商,我可以在一个地方看到我使用的所有产品之间的跟踪。

BOGDAN DRUTU:这是我的项目……我的灵魂。

CONSTANCE CARAMANOLIS:我认为 OpenTelemetry 变得非常具有偏见,但我感觉这是许多不同观点最终融合在一起的一个非常好的结合,让原本难以实现的进步变得更容易,比如收集数据。困难的部分实际上是理解它。所以他们终于走到了一起。在收集指标、跟踪和日志方面,合作效果非常好。

JURACI PAIXĀO KRÖHLING:哦,这是一个深刻的问题……从技术上讲,对我来说,OpenTelemetry 是一套工具,可以帮助我从典型的应用程序中提取遥测数据。有时也包括基础设施。但 OpenTelemetry 确实是我可以以供应商中立的方式使用的工具,从我的应用程序中提取数据,以便我能够达到那个“乌托邦式”的目标。如果我拥有完美的插桩,那么我就可以达到那个“乌托邦式”的地方。但 OpenTelemetry 为我提供了我需要的工具,让我可以逐步实现这一点。它在某个非常具体的点停止了,也就是说,一旦您发送了数据,OpenTelemetry 就停止了。在那里,您会遇到提供数据库、可视化工具等的供应商或开源工具。但更深层次的方面,OpenTelemetry 是我拥有我的同事,那些我多年来每天都在一起工作的人们的地方。是的,这就是 OpenTelemetry 对我的意义。

JACOB ARONOFF:OpenTelemetry 是由所有人支持的可观测性。它不是一个单一的供应商。它允许您执行与您将数据发送到哪里无关的操作。就像您每次进入新车时都不必重新学习如何驾驶一样。您购买自行车时,不必根据自行车的供应商来学习如何骑行。无论您将数据发送到哪里,都应该能够插桩您的代码。这就是我销售它的方式,我就是这样想的。

JACOB ARONOFF:另一个好处是,我们作为维护者,这里有很多维护者和批准者,所以我们可以协作并共同努力,找出未来几个月真正需要的东西。我几乎将其描述为夏令营。有些人,哦,几个月没见你了。最近怎么样?这是在叙旧。

ALEX BOTEN:比如说,OTel 已经很棒了。项目本身也很棒。它是最早将一堆标准精简成更少标准的几个项目之一。我们采用了 OpenCensus、OpenTracing,并将Prometheus引入了进来。Elastic Cache 格式也在这里。Prometheus也在这里。OpenTelemetry 本身就是一个美好的社区,就是这样。试图通过跨越供应商界限来改善可观测性领域,这正是我以前从未做过的。我从未在一个有如此多供应商和如此多最终用户社区参与的开源项目中工作过,这真是太棒了。

ADRIANA VILLELA:是的。这也是我个人喜欢 OpenTelemetry 的地方,因为每个人都相处融洽,我觉得这是一种非常刻意的做法,“不,我们不会偏袒任何一个供应商。”如果某个供应商试图炫耀,它基本上会被驳回,我觉得这很棒。

ALEX BOTEN:项目中的许多优秀人士都试图将大家推向正确的方向,我对此非常感激。我将特别感谢 Ted Young,尤其是作为那些总是……他在那里,我能看到他正在四处张望。他不知道我们在谈论他。

PURVI KANAL:对我来说,OpenTelemetry 真正是关于社区的。就像社区能够掌控自己的遥测数据,因为供应商不应该决定发送到您系统的遥测数据的类型。因为您系统的可观测性对您的系统来说非常个性化。当您拥有供应商锁定或通过供应商的插桩锁定,它会非常受限。

5- 您最喜欢的遥测信号是什么?

TYLER YAHN:这是一个好问题。我希望我能给出一个好的、细致的答案。比如,我不知道……指标,我接触最久了,我猜。但我认为 Traces 可能更接近,因为您对操作行为有更深的了解。所以,是的,我想我可能会选择 Traces。它对您来说也更自动化一些。您真的需要理解那些指标是什么,并将它们构建成某种东西。相比之下,Tracing 可以根据它们自带的结构显示出来。所以,是的,我选 Traces。

AMY TOBEY:哦,当然是 Traces。

TED YOUNG:我最喜欢的信号……可能是蝙蝠信号。如果每次系统出现故障时都能亮起,我会很高兴。

CARTER SOCHA:所以,我认为我听过这个说法……而且我真的相信它。Traces 只是日志的更酷版本。就像带胡子和也许礼帽的日志。因为本质上,一个 span 就是一个日志,但一个与跟踪相关的日志。所以,我可能说是 Traces,但我的备选答案是 Logs。

BOGDAN DRUTU:信号?我认为最……我喜欢 Metrics。我认为我们试图改变以前 Metrics 的做法,而且我们可能还没有完全成功,但我们正在努力。但这是一个必要的改变,我觉得它改变了一些事情的运作方式。对于 Tracing,我的意思是,我们没有从其他 Dapr 论文或其他东西那里改变太多,但对于 Metrics,我认为我们改变了。

CONSTANCE CARAMANOLIS:我喜欢 Traces,尤其是因为您可以……我最喜欢的例子是,当我以前在 Lyft 工作时,半夜接到电话……一个服务,四层深入……一切都出了问题……所有介于我和前端之间的东西都被叫了。您能够实际弄清楚,比如,哦,这是原因。而不是过度思考它。这就是我喜欢它的地方。这与我们过去习惯谈论的范式非常不同。

JURACI PAIXĀO KRÖHLING: 痕迹。来吧。它们很棒。不,就是这样。痕迹。

JACOB ARONOFF: 痕迹。第一名。它们是最容易使用的。它们非常容易上手,而且比其他任何东西都更有用。所以,全力支持痕迹。

ALEX BOTEN: 痕迹,因为它显然是优雅的日志,但你也可以从中获得指标。它拥有信号所需的一切。它是指标和日志与上下文相关联。它很棒。它们是神奇的。

PURVI KANAL: 哦,这很容易。就是追踪。

立即加入我们!

如果您有关于您如何在组织中使用 OpenTelemetry 的故事要分享,我们很乐意倾听!分享方式

请务必在 MastodonLinkedIn 上关注 OpenTelemetry,并使用 #OpenTelemetry hashtag 分享你的故事!

别忘了订阅我们的 YouTube 频道,观看更多精彩的 OpenTelemetry 内容!

最后修改于 2025 年 1 月 21 日: 拼写:cspell:ignore (#6015) (dc6a2b85)