【紹介】『オブザーバビリティ・エンジニアリング』
はじめに
システムの不具合が発生したとき、直観で解決してきた。環境での斬新な原因を特定するときはインフラ・ネットワーク・アプリケーションログの断片をつなぎ合わせ解決してきたが限界があると認識、直観ではなく事実で解決できるアプローチはないかなと探していた。
モニタリング・オブザーバビリティとの哲学的な違いの説明や、ログ・メトリクス・トレースやプロファイルなどのテレメトリーデータの実装方法について学べます。
オブザーバビリティ・エンジニアリング
本書は、近年のクラウドベースのソフトウェアシステム開発における設計プラクティスなどにおいて触れられる概念「オブザーバビリティ(可観測性)」に関する書籍です。オブザーバビリティとは何か、どのように役立てるのかなど、登場の背景から実践方法、組織、企業への適用といった幅広い視点で解説します。今後、ソフトウェアシステムの開発においてオブザーバビリティが果たすであろう、より大きな役割についても触れています。さらにSlackのゲスト寄稿者により、テストとデプロイプロセスへのオブザーバビリティの適用と、パイプラインによるテレメトリー管理についてのケーススタディを紹介。本書はソフトウェアに関わる多くの人々にと…

第1部 オブザーバビリティの道
第2部 オブザーバビリティの基礎
第3部 チームのためのオブザーバビリティ
第4部 大規模なオブザーバビリティ
第5部 オブザーバビリティの文化を拡大する
おわりに
モニタリングやオブザーバビリティを導入したいけれど、何から手をつけていいかわからないというところからどのように実践していくかまで紹介しているので、とても参考になりました。業務ではAmazon Web Servicesを使用してシステムを構築することが多いのですが、トレースやメトリクスなどのデータをどのように収集・送信するか迷っていたときに、Open Telemetryの説明があったりなど大変参考になりました。Amazon Distro for Open Telemetry (Open Telemetry Collector)から各バックエンドに送信などの実装をしています。カスタム計装やService Level Objectiveベースのアラートの設定なども取り入れたいと思っています。