「オブザーバビリティ・エンジニアリング」

要約
「オブザーバビリティ・エンジニアリング」という書籍は、システムの監視、トラブルシューティング、およびパフォーマンスの改善を目的としたオブザーバビリティに焦点を当てています。著者たちは、システムの可観測性の重要性を説明し、どのようにしてシステムをより観測しやすくするかを具体的な例を交えて説明しています。
「オブザーバビリティ・エンジニアリング」は、システムの可観測性に関する広範なトピックを網羅し、特にDevOpsエンジニアやSRE(サイトリライアビリティエンジニア)などのITプロフェッショナルにとって、非常に役立つ情報が含まれています。
モチベーション
システムの不具合が発生したとき、直観で解決してきた。環境での斬新な原因を特定するときはインフラ・ネットワーク・アプリケーションログの断片をつなぎ合わせ解決してきたが限界があると認識、直観ではなく事実で解決できるアプローチはないかなと探していた。
なにが学べるか
モニタリング・オブザーバビリティとの哲学的な違いの説明や、ログ・メトリクス・トレースやプロファイルなどのテレメトリーデータの実装方法について学べます。
良かったところ
モニタリングやオブザーバビリティを導入したいけれど、何から手をつけていいかわからないというところからどのように実践していくかまで紹介しているので、とても参考になりました。業務ではAmazon Web Servicesを使用してシステムを構築することが多いのですが、トレースやメトリクスなどのデータをどのように収集・送信するか迷っていたときに、Open Telemetryの説明があったりなど大変参考になりました。Amazon Distro for Open Telemetry (Open Telemetry Collector)から各バックエンドに送信などの実装をしています。カスタム計装やService Level Objectiveベースのアラートの設定なども取り入れたいと思っています。