OTel 实践:阿里巴巴的 OpenTelemetry 之旅

在最新的“OTel 实践”(OTel in Practice)会议中,工程师Huxing ZhangSteve Rao分享了阿里巴巴在其服务中采用 OpenTelemetry 的历程。

讨论涵盖了广泛的主题,从 Java 代理到 Go 编译时插桩,当然还有 Gen-AI 可观测性!

在 Java 方面,阿里巴巴最初使用了基于 Pinpoint 的内部解决方案,但面临框架支持和异步上下文传播的限制。于是,他们决定迁移到 OpenTelemetry,以利用其强大的生态系统和行业标准地位。

他们带领我们回顾了迁移过程,包括如何首先 fork OTel Java 代理以快速添加必要的自定义功能(如性能剖析能力和对中国流行框架的支持),以及他们如何转向一个更易于维护的模型,该模型直接依赖于官方/上游代理,并将其与他们所有的自定义扩展捆绑在一起。

他们分享的另一项关键创新是其 Go 编译时插桩方法,该方法可在不修改任何代码的情况下自动插桩 Go 应用程序。该项目已捐赠给 OTel 社区,现在是阿里巴巴、Datadog 和 Quesma 之间的协作成果

OpenTelemetry 现在已在阿里巴巴广泛使用,为云服务和现代应用程序提供端到端的可见性,并且该团队将继续致力于将其增强功能贡献回上游项目。

感谢 Huxing 和 Steve 的参与。观看下方录屏回放!