devops / observability
Alerting playbook
Symptom vs cause, severity tiers, routing, борьба с alert fatigue и runbook'и в каждом alert'е.
alertingon-callpagerduty
Открыть
Средний30-60 мин
devops / incidentFeatured
Orchestrator: incident response от alert до post-mortem
Семь фаз с таймерами, выходами и ролями — от детекта до post-mortem. Управляет шумом, ролями и коммуникацией под давлением.
incidentsreon-call
Открыть
Продвинутый1-2 часа
devops / incident
Runbook design checklist
Чеклист runbook'а: trigger, severity, первые 5 команд, диагностика, mitigation, эскалация, verification, что НЕ делать.
runbookincidenton-call
Открыть
Средний30-60 мин
devops / incident
Дизайн on-call ротации
Размер ротации, длительность шифта, follow-the-sun, primary/secondary, компенсация, признаки burnout и протокол handoff.
on-callrotationteam
Открыть
Средний30-60 мин
devops / incident
Дизайн эскалационных путей
Тиры (L1/L2/L3 + leadership), критерии и тайминги эскалации, как не перегрузить senior'ов, конвенции war room.
escalationincidenton-call
Открыть
Средний30-60 мин