Observability

Laravel + Node.jsスタックでのOpenTelemetry実践ガイド

ポリグロット環境の可観測性の課題

OpenTelemetry導入前は3つの異なるシステムが存在し、フロントエンドリクエストから6つのダウンストリームサービスへの相関が取れていませんでした。


成果 (Results)

指標導入前 (Before)導入後 (After)
クロスサービス問題の平均デバッグ時間45 分4 分
P95 トレースカバレッジ0%94%
アラート MTTR (平均復旧時間)38 分11 分

導入後の最初の1週間で、存在すら知らなかった3つのレイテンシの問題を発見しました。そのうちの1つは、4ヶ月もの間、チェックアウトフローのパフォーマンスを密かに低下させていたものでした。