tag:ポストモーテム
差分
このページの2つのバージョン間の差分を表示します。
| 両方とも前のリビジョン前のリビジョン | |||
| tag:ポストモーテム [2026/01/31 03:03] – ["事件" Related Articles] d.azuma | tag:ポストモーテム [2026/01/31 03:06] (現在) – d.azuma | ||
|---|---|---|---|
| 行 1: | 行 1: | ||
| ====== ポストモーテム ====== | ====== ポストモーテム ====== | ||
| + | |||
| + | ===== ポストモーテム(Post-mortem)の概要 ===== | ||
| + | |||
| + | ポストモーテムは、重大なインシデントやプロジェクトの終了後に行われる**振り返りの記録**です。 | ||
| + | |||
| + | その目的は、誰かを責めることではなく、「システムやプロセスのどこに弱点があったのか」を特定し、学習することにあります。 | ||
| + | |||
| + | |||
| + | |||
| + | ===== 1. ポストモーテムの主要構成要素 ===== | ||
| + | |||
| + | 効果的なポストモーテム報告書には、通常以下のセクションが含まれます。 | ||
| + | |||
| + | * **インシデント概要 (Incident Summary): | ||
| + | * 何が起きたのか、どの程度の深刻度だったのかを簡潔にまとめます。 | ||
| + | |||
| + | * **影響範囲 (Impact): | ||
| + | * ユーザー数、サービス停止時間、損失したデータなど、具体的な影響を記載します。 | ||
| + | |||
| + | * **タイムライン (Timeline): | ||
| + | * 発生から検知、対応、解決までの出来事を時系列で記録します。 | ||
| + | |||
| + | * **根本原因 (Root Cause): | ||
| + | * 「なぜ」を繰り返す(5 Whys)などの手法を用い、表面的なミスではなく、その背後にあるシステム上の問題を特定します。 | ||
| + | |||
| + | * **アクションアイテム (Action Items): | ||
| + | * 再発を防止するための具体的で期限のあるタスクを定義します。 | ||
| + | |||
| + | * **教訓 (Lessons Learned): | ||
| + | * うまくいった点、改善が必要な点を抽出します。 | ||
| + | |||
| + | ===== 2. 「非難なし(Blameless)」の文化 ===== | ||
| + | |||
| + | ポストモーテムにおいて最も重要なのは、**心理的安全性**を確保することです。 | ||
| + | |||
| + | > 「インシデントは、個人が悪いのではなく、個人がミスを犯すことを許容してしまったシステムに問題がある」と捉えます。 | ||
| + | |||
| + | * **目的: | ||
| + | * 失敗を隠さず報告できる文化を築き、組織全体の回復力(レジリエンス)を高めること。 | ||
| + | |||
| + | * **方法: | ||
| + | * 質問を「誰が(Who)」ではなく「何が(What)」「どのように(How)」という視点に変えて分析します。 | ||
| + | |||
| + | |||
| + | |||
| + | ===== 3. ポストモーテムを実施するメリット ===== | ||
| + | |||
| + | ^ メリット ^ 内容 ^ | ||
| + | | **信頼の回復** | ユーザーに対して透明性のある報告を行うことで、信頼関係を再構築できる。 | | ||
| + | | **レジリエンスの向上** | 同じ失敗を繰り返さないための具体的なガードレール(自動テスト、監視の強化など)が整備される。 | | ||
| + | | **ナレッジの共有** | 特定の担当者だけでなく、チーム全体で技術的な知見を共有できる。 | | ||
| + | |||
| + | ===== 4. 実施のトリガー ===== | ||
| + | |||
| + | 以下のような状況が発生した場合、ポストモーテムを作成することが推奨されます。 | ||
| + | |||
| + | - ユーザーに影響を与えるダウンタイムやサービスの劣化。 | ||
| + | - データの損失。 | ||
| + | - 監視システムの不備によるインシデント検知の遅れ。 | ||
| + | - 手動による緊急介入が必要だったケース。 | ||
| + | |||
| ===== " | ===== " | ||
tag/ポストモーテム.1769828635.txt.gz · 最終更新: by d.azuma