OpenTelemetry 人物 - KubeCon NA 2024
博客文章在发布后不会更新。这篇文章已经发布一年多了,其内容可能已过时,部分链接可能无效。在依赖任何信息之前,请务必核实。
我们又带来了第三期《OpenTelemetry 人物访谈》,这次是在美国犹他州盐湖城举行的 KubeCon NA。再次,Reese Lee和我采访了 OpenTelemetry 的贡献者和最终用户(以及彼此!),并了解了他们是如何开始接触 OTel 的。
- Hazel Weakly (The Nivenly Foundation)
- Eromosele Akhigbe (Sematext)
- Budha Bhattacharya (Tyk)
- Miguel Luna (Elastic)
- Adriana Villela (Dynatrace)
- David Gohberg (Monday)
- Endre Sara (Causely)
- Braydon Kains (Google)
- Christos Markou (Elastic)
- Reese Lee (New Relic)
此外,特别感谢
- Reese Lee,我的联合采访者
- Henrik Rexed 提供音频和视频录制设备,并对原始素材进行初步编辑
视频
你可以在这里观看完整录制内容
感谢所有迄今为止为 OpenTelemetry 做出贡献的人,我们期待在 2025 年及以后继续得到你们的贡献!🎉
文字记录
如果您更喜欢阅读,我们的谈话记录如下。
1- 认识 OTel 的人物
Hazel Weakly:你好。我叫 Hazel Weakly,我有很多想法。它们永不停止思考。它们永不停止思考。
Eromosele Akhigbe:我叫 Eromosele Akhigbe,目前是 Sematext 的一名软件工程师。大家好。
Budha Bhattacharya:我是 Budha。我是 Tyk 的开发者布道师。除此之外,我与开放标准有着非常深厚的关系,因为我也是 OpenAPI Initiative 的董事会主席,也是 GraphQL Foundation 的董事会成员。
Miguel Luna:我叫 Miguel Luna,是 Elastic 的一名产品经理,在那里我负责公司所有 OpenTelemetry 工作的领导,以及我们为社区所做的贡献。
Adriana Villela:我叫 Adriana Villela,是 Dynatrace 的首席开发者布道师。
David Gohberg:我叫 David,我在 Monday dot com 工作。我是一名软件工程师,在那里我负责 CRM 产品。
Endre Sara:我叫 Endre Sara,是一家名为 Causely 的公司的联合创始人。我两年前创立了 Causely。
Braydon Kains:我叫 Braydon Kains。我是 Google Cloud 组织的一名软件开发者。我负责 Cloud Observability 服务,主要从事客户在其环境中安装以收集遥测信号并将其发送到 Google Cloud 的代理。
Christos Markou:我叫 Christos。我是 Elastic 的一名软件工程师。在过去的五年里,我主要从事可观测性方面的工作,从去年开始,我主要为 OpenTelemetry 生态系统做出贡献。
Reese Lee:你好,我叫 Reese Lee,是 New Relic 的高级开发者关系工程师。
2- 你是如何参与到 OpenTelemetry 中的?
Hazel Weakly:OpenTelemetry。我进入这个项目几乎是偶然的,尽管我认为现在我无论什么事都这么回答。当我说是偶然的时候,那是因为我在寻找我所问题的答案,更重要的是,我该如何教导其他人更好地找到问题的答案,以及我如何继续提升我工作过的团队、我工作过的组织的能力,以弄清楚如何让人们在提问、获得答案和从中学习方面做得更好?我最终偶然发现了 OpenTelemetry。
Eromosele Akhigbe:三月份,我参加了一个名为 Outreachy 的实习项目,在 Outreachy 中,我很荣幸地参与了 OpenTelemetry 项目,并从事使用 Golang 构建日志桥的工作,实习结束时,我成功地使用 OTel zerolog 构建了一个日志桥。
Budha Bhattacharya:我是如何参与到 OpenTelemetry 中的?我认为这是一个多部分的问题或回答,因为有几个原因引起了我的注意。首先是我们的新产品组长的大力倡导,她最近加入,并且是可观测性,尤其是 OpenTelemetry 的坚定支持者。我曾经玩过 OpenTracing 和 OpenCensus 一段时间,但并没有真正深入研究 OpenTelemetry。但一旦她进来,我便成为了它的坚定倡导者,这引起了我的注意。这是第一个触发点。第二个触发点是它是一个开放标准。所以,我认为任何开放标准对我来说都是显而易见的。
我投入大量时间来研究任何能让生活变得更轻松的开放标准。我认为从灵活性角度来看,这是正确的方向。所以这是第二个触发点。第三个触发点实际上是我们开始使用 OpenTelemetry 的时候。所以,我们是一个 API 管理平台 Tyk。对我们来说,OpenTelemetry 既在内部使用,也在外部使用。因此,在内部,我们已经可以看到在解决问题的速度和效率方面取得的成效,以及深入问题的核心。而且这不仅仅局限于 REST API,实际上也包括 GraphQL API,这可能不是你最初会考虑的用例。但我们能够修复我们遇到的其中一些问题。所以这是第三个触发点。所有这些因素共同促使我们说,嘿,OpenTelemetry 值得关注。
Miguel Luna:最初我是一名产品经理。这是一个非常有趣的角色,因为我开始担任一个更多关于协调而非直接贡献的角色。但最近我参与了文档的本地化工作。这意味着翻译文档,尤其是在我的情况下,针对西班牙语使用者。所以,la traducción de la telemetria abierta。所以,traducción… 翻译 OpenTelemetry 文档的西班牙语版本。
Adriana Villela:在我之前的职位上,我当时的经理鼓励我加入 OpenTelemetry 社区。这实际上是我第一次为开源做贡献,我之前从未为开源做过贡献。我在科技行业已经工作了二十多年了,我的经理基本上说,是的,参加几次会议就行。我的第一次会议是 OTel 通讯会议。所以,这基本上是我进入 OpenTelemetry 的入口。
David Gohberg:我的职业生涯始于嵌入式应用程序,在那之前我还在从事 eBPF 跟踪,当时这还不是一项普及的技术。然后我转到了 Dropbox,在那里我们所有的遥测都是内部开发的,直到 OpenTelemetry 普及。现在在 Monday,我继续从事基于跟踪的测试。
Endre Sara:我开始了解 OpenTelemetry。我意识到这是一个让整个行业实现仪器化标准化的绝佳机会,并能够使用通用的语义约定,这样人们就能理解发生了什么。所以我立即兴奋起来,并开始着手这项工作。起初只是一些测试应用程序,然后我玩了一下并向人们演示了如何进行仪器化。但随着我们开始创业,从第一天起我就说,我们必须确保我们正确地对软件进行仪器化,以便在日志、指标和可观测性测试方面获得更多客户时,我们能够正确地运营它,这给我们带来了很多帮助。
Braydon Kains:我参与 OpenTelemetry 是因为我们的团队使用 OpenTelemetry,特别是 OpenTelemetry Collector,来支持客户收集他们环境中的数据。过去 OpenTelemetry 出现 bug 和问题时,团队会进行一些轻微的参与,但基本上我们会打开一个问题然后等待。等待它得到解决。我非常想改变我们团队的这种情况。我们团队中不止一个人想改变这一点。所以,你知道,我们都开始更认真地努力去打开带有 PR 的问题。这普遍地推动了我们整个团队在 OTel 方面投入更多。最终,我在 OTel 方面投入了更多精力,以至于现在我是 Host Metrics Receiver 的代码所有者,这对我们来说是一个重要的接收器,但我可以投入更多时间来确保它对每个人都好,而不仅仅是解决我们自己的问题。
Christos Markou:我最初被要求为 OpenTelemetry 做贡献,通过帮助将 Elastic Common Schema 捐赠给 OpenTelemetry,特别是用于规范和语义约定。从那时起,我越来越多地参与到其他项目中,例如 Collector。目前我主要关注语义约定和 OpenTelemetry Collector,特别是 Collector contrib 项目。
Reese Lee:我参与 OpenTelemetry 的方式是在 New Relic。起初,我第一次接触它是因为我们收到了一些客户采用了 OpenTelemetry 相关的支持工单。然后我得到了一个绝佳的机会,加入了我们当时专门的 OpenTelemetry 团队,担任开发者关系工程师。这大约是在 2021 年 11 月。之后不久,我就能够很好地融入 OpenTelemetry 社区。实际上,我之前的经理 Sharr Creeden,她当时带头建立了终端用户工作组,现在我们是终端用户 SIG。
3- OpenTelemetry 帮助了你什么?
Hazel Weakly:OpenTelemetry 在我工作过的组织中非常有用,因为它已经成为可以与不同供应商、不同工具以及其他中间方式连接的东西。对我来说,它的巨大好处是,我可以整合所有这些不同的知识,不一定是信号,而是公司内不同背景的知识,将它们整合起来,以便我能向人们展示他们问题的答案,无论他们是否在工程部门。这是一个新的能力,因为以前工程部门有点像一个独立的泡泡,而且越来越不能继续这样做。因此,OpenTelemetry 在将我们的知识带出工程部门并将外部知识引入工程部门方面对我产生了巨大的影响。
Budha Bhattacharya:内部效率大大提高。当我与我们的 SRE 团队、DevOps 团队交流时,他们在与我们平台堆栈的不同元素互动或合作时会更开心。管理和处理起来更容易。现在,当我谈论最终用户时,他们可以真正谈论它的价值。就我个人而言,我认为仅仅是布道方面,对我来说就非常有益,让我学到了更多。以不同的方式参与社区。今年早些时候,我很荣幸地组织了一个小型会议,名为 LEAP,即 API 可观测性会议,社区中的许多人都能够发言,讨论 OpenTelemetry 的不同领域和元素,不仅仅局限于工程方面,还包括决策者如何在组织内看待采用 OpenTelemetry 的价值。
Miguel Luna:一切都始于 Elastic,我们决定捐赠 Elastic Common Schema,这与 OpenTelemetry 的目标非常契合,即标准化可观测性并提高将遥测数据汇聚为单一标准所带来的效率。
David Gohberg:在我职业生涯初期,还没有 OpenTelemetry,所以我不得不弄清楚如何进行跟踪,如何将它们与指标关联,以及如何处理日志。但现在所有这些工作都已经被社区标准化了,所以新工程师在入职 OpenTelemetry 时比我容易得多。
Endre Sara:总的来说,我认为与以前的专有仪器化相比,OpenTelemetry 能够从应用程序中提取信号并利用它们来操作环境、理解系统行为的能力要容易得多。我认为更有趣的是,我们用这些数据做什么?大部分信息都通过仪表板展示出来,这些仪表板呈现得非常精美,并根据语义约定进行了情境化。但我认为最大的优势是能够使用软件来合理地处理数据。
Braydon Kains:OpenTelemetry 对我个人的最大帮助在于,我学会了如何与一个大型社区互动。我已经有一些开源社区的经验,而且存在着一种普遍的文化,你知道,你做工作,你就能在项目中发表意见。这在开源领域很常见,我认为这很好。但是 OpenTelemetry 有一个非常大的结构来引入变更。
Christos Markou:我真的很喜欢与 OpenTelemetry 生态系统合作,因为我相信与来自其他公司、其他团队的人合作,对我作为工程师来说帮助很大,因为我可以看到其他人是如何进行可观测性工作的。所以我一直在学习很多。所以,这是我非常喜欢的一点,而且我相信我的团队总体上也非常受益于这一点,也对我自己的工作有帮助。意思是,这太棒了,因为我真的很喜欢开源,我真的很喜欢与开源项目合作。是的,我认为在个人层面,这真的很有帮助。
Reese Lee:OpenTelemetry 在很多方面帮助了我,坦白说,在巨大的意义上,就像在开发者关系部门与 OpenTelemetry 共事,我遇到了很多很棒的人,就像我之前提到的。但作为我工作的一部分,我可以向不同的活动提交话题,其中一部分是我自己学习所有这些不同的主题,并能够与在生产环境中使用它们或自己尝试它们的人交谈,这是一种非常美好的体验。
4- 可观测性对你来说意味着什么?
Hazel Weakly:我对可观测性的定义是:一个人通过这个过程来培养提出有意义问题、获得有用答案,然后根据所学知识采取有效行动的能力。我的意思是,能够找到答案是不够的。有一个过程,你必须一遍又一遍地努力,而且你正在培养一种技能,不仅是个人的,也是组织、团队,甚至更广泛的行业层面的。因此,当你继续这样做,继续获得真正、真正有用的答案和真正、真正有意义的问题时,你就会开始拥有一个跨越我们自我设定的界限的集体学习过程,并让这些界限变得赋能而不是限制。
Eromosele Akhigbe:可观测性工程师就像是你们系统的医生。所以,如果你们的系统出了问题,你们需要我们能够精确地找出哪里出错了,或者具体是什么错了,以及如何解决这些问题。所以,这就是可观测性对我的意义。
Budha Bhattacharya:可观测性对我的意义是什么?有一个技术上的答案,它涉及到监视、日志记录,以及解决所有问题。对我来说,这一切都关乎理解。它本质上是理解你创建的平台的脉搏。我经常处理 API,所以所有基础都与 API 平台有关。因此,理解你的 API 平台的脉搏,不同组件的整合,准确知道哪些在工作,哪些在停止工作,好与坏,以及所有一切,对我来说,这就是可观测性。所以,要能找到问题的症结,要知道什么在工作,什么在停止工作,并做出更有效的决策。
Miguel Luna:监视意味着知道你已知需要提出的问题的答案。可观测性意味着知道你不知道需要提出的问题的答案。
Adriana Villela:对我来说,可观测性意味着能够获得对你系统的洞察。对我来说,这非常有变革性,因为在我生命中有很多次,我曾像这样调试代码,无论是像我这样的开发者的代码,还是生产环境中的代码,却不明白,比如,只是查看日志却不明白,好吧,这与更大的图景有何关联?我有很多次排查生产问题的记忆,就像,哦,系统很慢。所以你问负责管理应用程序服务器的人,嘿,你能查看一下日志吗?不,不是我的问题。你问 DBA,不,不,不是我的问题。然后你问其他人,你一路追问下去,但好像没人能解决。但你仍然看到延迟。我认为可观测性就像是,它揭开了这一切,因为它突然暴露了。就像,它暴露了真正的根本原因在哪里。我认为这就是可观测性的魔力和力量。
David Gohberg:当今软件工程中最重要的事情是用户体验。由于我们的软件越来越复杂,越来越难回答这个问题:我的用户如何体验我的产品?OpenTelemetry 使我们能够回答这些难题,并为我们提供对软件的可见性。
Endre Sara:我认为可能最显而易见的答案是能够收集信号。但我认为可观测性的真正意义在于理解和推理系统的行为。仅仅收集数据并不能真正实现什么。我认为当它变得有意义和有价值时,人们就能利用它来驱动行动,驱动决策。我在哪里需要提高可靠性?我在哪里需要提高应用程序的性能?我在哪里需要进行架构更改?我认为可观测性正是服务于这一点。否则,它就只是一片数据湖。
Braydon Kains:对我的可观测性意味着你可以知道发生了什么。计算机是黑箱,它们只理解 0 和 1 的作用。而作为人类,能够理解在任何给定时间 0 和 1 在做什么,当计算机运行速度如此之快时,你怎么能弄清楚这有什么意义呢?所以,对我来说,可观测性就是人类理解计算机在做什么的方式。
Christos Markou:所以对我来说,可观测性是我。我从大学开始就在研究它,这是一个非常重要的领域,因为我认为当我们在运行系统时,真正重要的是你观察系统的方式,你知道系统是否良好或不佳。特别是,我来自基础设施背景,正如我之前提到的。因此,特别是对于基础设施而言,在成本降低方面非常非常重要。以及整个系统如何工作是其中一个不可或缺的重要环节。
Reese Lee:对我来说,可观测性意味着我,作为各种应用程序和软件程序的最终用户,能够获得更好的体验,因为构建这些产品的公司,你知道,假设他们正在使用可观测性并能够及时了解其代码中出现的问题,这意味着我作为最终用户能够获得更好的体验。
5- OpenTelemetry 对你来说意味着什么?
Hazel Weakly:对我来说,OpenTelemetry 是一种非常有趣的构建方法,它借鉴了一种非常资本主义的理念,即公司需要盈利,公司希望创新,人们希望竞争,人们希望开发不同的解决方案。那么,你如何将所有这些整合到一个足够灵活的项目中,以允许这种竞争,允许这些想法发生,并允许这种创新继续下去,同时又不限制可能发生的事情,也不让行业负担不断演变的复杂性、追求卓越的过程中的中间细节。
Eromosele Akhigbe:OpenTelemetry,我相信,是可观测性的未来。三月份,当我开始研究 OpenTelemetry 时,我发现了它的潜力有多大,并决定要全力投入 OpenTelemetry。所以我相信它是可观测性的未来,每个人都应该接受它。
Budha Bhattacharya:OpenTelemetry 意味着什么?对我来说,那是理解的延伸。从某种意义上说,它是。嗯,同样,技术上的回答是,它是驱动分布式跟踪的开放标准。这都很好。对我来说,这是通过创建一个通用语言或框架(无论你怎么称呼它)来扩展这种理解,你的平台中的不同组件和元素可以团结起来,共同谈论你整个平台的健康状况。这可以从工程角度一直延伸到业务角度。这两者都有其后果。所以,对我来说,这就是 OpenTelemetry 作为一项技术所带来的,无论从业务还是技术角度来看。但它也关乎社区。它又是行业走到一起并就标准达成一致,从而使 SRE、DevOps 组织、工具供应商、最终用户的生活变得更加轻松,因为拥有开放标准意味着你的平台更加灵活,你有更多的自由去发展、成熟,并且实际上更具未来适应性。所以,对我来说,这就是 OpenTelemetry 所带来的灵活性和自由的承诺。
Miguel Luna:对我来说,它意味着一种通用语言。所以,这是一个我们可以共同合作的地方,用户可以聚集在这里,至少可以理解我们收集到的一切都将以相似的方式、以相似的机制收集。还有我们称呼事物的方式。所以,语义约定,我们就称呼事物的方式达成共识。所以,遥测是相同的,并且可以被重复使用。所以,是的,这就是 OpenTelemetry 对我来说的意义。
Adriana Villela:OpenTelemetry 对我来说意味着什么?对我来说,你知道,它,感觉就像家一样,因为在过去的两年半时间里,它就像我的家一样。因此,它在我生活中起到了非常重要的变革作用,因为,正如我所说的,它是我进入开源、进入 CNCF 社区的门户。因此,它对我来说具有非常个人化的意义,远远超出了,你知道,典型的 OpenTelemetry 定义,即这个用于仪器化代码的开放标准。对我来说,它远不止于此。它真的是一个可爱的社区,我们与来自各行各业的供应商合作,我们不是敌人,我们都是朋友,因为我们朝着同一个目标努力。
David Gohberg:OpenTelemetry 基本上是一种标准化所有努力、所有工程师试图提出有关软件的难题的方式。
Endre Sara:OpenTelemetry 为多个供应商提供了一种合作、协同工作的方式,并将仪器化视为理所当然,而不是竞争的职能,真正专注于为如何将这些信息转化为可操作的见解增加价值。我认为这正是人们、供应商、最终用户期望进行创新的地方。所以,OpenTelemetry 基本上是供应商能够专注于真正价值所在之处的赋能者。
Braydon Kains:对我来说,OpenTelemetry 代表着行业的团结,并且理解,你知道,我们到底在竞争什么?就像,作为不同的公司,我们到底想在市场上定位在哪里?我认为我们都集体认为,信号本身真的不值得区分。如果我们不就此达成一致,通常对每个人来说都是净负面影响。如果我们能就信号部分达成一致,那么所有公司就有更多时间在那些真正实际的方面进行区分,就像数据的工作方式一样。
Christos Markou:在过去一年参与 OpenTelemetry 的过程中,我认为 OpenTelemetry 是一个学习东西和认识其他对整个可观测性领域充满热情的人的好地方。我认为它是由真正喜欢自己工作并且在这方面做得很好的人组成的。所以,对于工程师来说,这是一个聚集在一起、共同工作和分享可观测性领域以求发展的绝佳场所。
Reese Lee:对我来说,OpenTelemetry 意味着很多事情,你知道,除了项目以及它如何帮助不同的组织,你知道,将开源融入他们的整个技术栈之外。它也是一个非常庞大、精彩的社区。我真的很喜欢认识维护者并了解最终用户。我和许多 OpenTelemetry 社区的人建立了非常好的关系,这就是它对我的意义。
6- 你最喜欢的 OpenTelemetry 信号是什么?
Hazel Weakly:我最喜欢的 OpenTelemetry 信号。我会稍微偷点懒,我会说我最喜欢的 OpenTelemetry 信号是那个能为人们最感兴趣的问题提供他们认为最有用的答案的信号。
Eromosele Akhigbe:跟踪。跟踪是我最喜欢的信号,因为,就像,它们提供了一个完整的,你知道,对系统中发生的一切的完整画面,并且你可以轻松地发现错误。
Budha Bhattacharya: 最喜欢的 OpenTelemetry 信号。这是一个,这是一个难题。我认为在这个时间点,追踪(traces)必须胜出,因为再次,仅仅考虑事物如何很好地连接。我也非常、非常热切地关注剖析(profiling)。我认为这可能会是我们下次对话中的赢家,因为我认为性能是许多组织的一个大问题,尤其是当我们作为 API 网关,与不同的组件协同工作时,我们需要 API 平台堆栈的一部分来了解是否存在潜在的瓶颈。我们是瓶颈吗?是否存在其他潜在的瓶颈元素?我们如何提高性能?我们如何真正把钱花在最能体现数字的地方?这正是剖析再次,在某种程度上,承诺的要点?
Miguel Luna: 因为我的背景是 Elastic,我不得不说日志(logs)。但当然,你知道,日志,你知道,它们带来了深刻的上下文洞察,但归根结底,你需要它们全部。就像指标(metrics)会让我们知道存在问题。追踪(tracing)将帮助我们理解问题出在哪里,而日志(logs)将帮助我们理解问题是什么。
Adriana Villela: 我最喜欢的信号是追踪(traces),因为我因为追踪(traces)而爱上了可观测性(observability)和 OpenTelemetry。
David Gohberg: 我不得不说,我从追踪(tracing)中获得了最大的价值。但最近我开始将追踪(traces)与指标(metrics)进行关联,我认为这是黄金流程。
Endre Sara: 我一直是分布式追踪(distributed tracing)的忠实粉丝。我认为它能让你了解大型服务是如何相互交互的。但我一直在喜欢剖析(profiling)。我认为它提供了有趣、令人兴奋的机会,让人们更深入地了解他们的系统是如何工作的,尤其是在不同的流程、不同的条件下,以及如何调整、改进他们的架构和系统规模以应对未来的负载。
Braydon Kains: 我目前最喜欢的 OpenTelemetry 信号是日志(logs),因为尽管我现在完全沉浸在 OpenTelemetry 中,并且知道所有三个信号的含义,但我从日志(logs)开始,因为日志(logs)很简单。它非常有意义,我理解人们从可观测性(observability)的第二波浪潮中走来,你知道,一切都应该是追踪(trace)或全局事件(lot wide events)。我理解它的价值,但我就是觉得日志(logs)永远不会消失。
Christos Markou: 我最喜欢的信号来自于基础设施和系统背景。我真的很喜欢指标(metrics),这是我未来几个月个人目标。我将帮助稳定系统指标(system metrics)的语义约定(semantic conventions)和 Kubernetes 指标(Kubernetes metrics),并使收集器(collector)为用户提供更多信心,因为拥有稳定的语义,这将帮助我们。
Reese Lee: 我最喜欢的信号。你知道,我想说是追踪(traces),因为在我进入可观测性(observability)领域时,它们是我首先了解的东西,而且我认为这正是我当时脑袋里理解的。我真的很喜欢追踪瀑布图(trace waterfalls),所以我选择它。
立即加入我们!
如果您有关于您如何在组织中使用 OpenTelemetry 的故事要分享,我们很乐意倾听!分享方式
- 加入 #otel-sig-end-user 频道,位于 CNCF 社区 Slack
- 参加我们的 OTel 实践 会话
- 在 OpenTelemetry 博客上分享你的故事
- 通过 CNCF 社区 Slack 联系我们,了解您想看到的任何其他类型的会议!
请务必关注 OpenTelemetry 在 Bluesky、Mastodon 和 LinkedIn 上的动态,并使用 #OpenTelemetry 标签分享您的故事!
别忘了订阅我们的 YouTube 频道,观看更多精彩的 OpenTelemetry 内容!