RU

Хроники Облачного княжества: как я приручал монолит‑дракона: Орден SLO и игла Кощея

Часть 3. Самая опасная магия в IT — это магия целей. Потому что цель легко обещает, а потом требует процентами отчёта. Есть особый вид страха, который…

инцидентыпродакшнDevOpsSREмониторингмикросервисыбаза данныхотказоустойчивостьпостмортем
Habr
RU

Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения

У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборд…

мониторингobservabilitydevopsнадёжностьsreархитектураотказоустойчивость
Habr
RU

Хроники Облачного княжества: как я приручал монолит‑дракона: Ночной алерт и инквизиция безопасности

Часть 2. Если вам кажется, что инцидент — это про баги, вы просто ещё не видели, как баги превращаются в совещания. Первый ночной алерт приходит в мом…

инцидентыпродакшнDevOpsSREмониторингмикросервисыбаза данныхотказоустойчивостьпостмортем