Observability
Laravel + Node.jsスタックでのOpenTelemetry実践ガイド
ポリグロット環境の可観測性の課題
OpenTelemetry導入前は3つの異なるシステムが存在し、フロントエンドリクエストから6つのダウンストリームサービスへの相関が取れていませんでした。
成果 (Results)
| 指標 | 導入前 (Before) | 導入後 (After) |
|---|---|---|
| クロスサービス問題の平均デバッグ時間 | 45 分 | 4 分 |
| P95 トレースカバレッジ | 0% | 94% |
| アラート MTTR (平均復旧時間) | 38 分 | 11 分 |
導入後の最初の1週間で、存在すら知らなかった3つのレイテンシの問題を発見しました。そのうちの1つは、4ヶ月もの間、チェックアウトフローのパフォーマンスを密かに低下させていたものでした。