RU

Почему Go-сервисы начинают тормозить без ошибок (и при чём тут goroutines). Часть 1

Часто про Go говорят:  «это язык, где конкурентность почти бесплатная» . И знаете что? Это правда. Почти. Но  «почти»  — это самое опас…

изучение языковgogolanggoroutinegoroutinesпрограммированиепроизводительностьмониторингсистемное программированиеархитектура
Habr
RU

Хроники Облачного княжества: как я приручал монолит‑дракона: Орден SLO и игла Кощея

Часть 3. Самая опасная магия в IT — это магия целей. Потому что цель легко обещает, а потом требует процентами отчёта. Есть особый вид страха, который…

инцидентыпродакшнDevOpsSREмониторингмикросервисыбаза данныхотказоустойчивостьпостмортем
Habr
RU

OpenTelemetry и Sentry: как мы выстроили сбор телеметрии в микросервисной системе

В распределенной системе понять, что именно произошло во время выполнения запроса, бывает сложнее, чем исправить саму ошибку. Логи показывают события …

OpenTelemetrySentryмикросервисымониторинг
Habr
RU

Кто мониторит монитор? Рекурсивная задача, у которой нет чистого решения

У вас есть Grafana. Она показывает графики с Prometheus. Prometheus скрейпит метрики с ваших сервисов. Если сервис упал — вы видите красный на дашборд…

мониторингobservabilitydevopsнадёжностьsreархитектураотказоустойчивость
Habr
RU

Как найти причину латенси в пайплайне обработки HTTP запроса за 5 минут: разбираем шаг за шагом

Как найти причину латенси в пайплайне обработки HTTP запроса за 5 минут: разбираем шаг за шагом Я достаточно ленивый и рациональный человек. В конце п…

мониторингdevopsnginxlatencyпроизводительностьsrecloudflare
Habr
RU

Хроники Облачного княжества: как я приручал монолит‑дракона: Ночной алерт и инквизиция безопасности

Часть 2. Если вам кажется, что инцидент — это про баги, вы просто ещё не видели, как баги превращаются в совещания. Первый ночной алерт приходит в мом…

инцидентыпродакшнDevOpsSREмониторингмикросервисыбаза данныхотказоустойчивостьпостмортем