Architecture — Tech News

All EN RU

ИИ-агент 4 месяца дежурит на наших прод-логах: 113 алертов, 2 галлюцинации и фикс за 3,5 часа

Пользователи почти не сообщают о багах: напишет 1 из 0, остальные молча уйдут. На прод-логи мы посадили автономного ИИ-агента: 300 тысяч строк в сутки…

ии-агенты автономные агенты мониторинг логи grafana loki aiops галлюцинации ии

От фичи к продукту: как мы хотели развязать себе руки, а открыли глаза заказчикам

Эта история началась не с продуктовой сессии, не с исследования рынка и даже не с запроса заказчиков. Отправной точкой стала встреча с коммерческой ко…

мультифактор multistatus программирование мониторинг информационная безопасность облачные сервисы микросервисы

Кто работает, когда ничего не работает: от алерта до постмортема

Когда 20 ноября 2025 года из-за ошибки в конфигурации одного коммутатора отказала дисковая подсистема всей платформы, пятьдесят наших клиентов одновре…

инцидент инцидент-менеджмент техническая поддержка мониторинг zabbix monq облака

MCP в мониторинге: когда «просто спросить» работает, а когда нет

Вступление: Почему мы заговорили об MCP? Наверняка, вы, как читатели Хабра в 2025-2026 годах заметили всплеск интереса к аббревиатуре  MCP . Мног…

observability mcp mcp-server мониторинг

Как желание написать простой CRUD привело к созданию целой видеоплатформы

От CRUD на FastAPI до видеоплатформы: история одного pet-проекта: История о том, как учебный CRUD-проект на FastAPI постепенно превратился в стенд с м…

fastapi devops kubernetes docker postgresql rabbitmq redis микросервисы gitlab ci мониторинг

Как мы построили централизованную CMDB для управления Zabbix с RFC, аудитом и откатом изменений

Привет, Хабр! Чем больше растет инсталляция Zabbix, тем сложнее становится управлять ее конфигурацией. Особенно если речь идет не об одном сервере мон…

мониторинг cmdb zabbix zabbix мониторинг rfc postgres

Как производственная компания мигрировала 1С на новую серверную инфраструктуру без остановки работы

Производственная компания с 5 филиалами и более чем 180 пользователями столкнулась с серьезными проблемами производительности 1С ERP: проведение докум…

Миграция 1С мониторинг нагрузка zabbix Технологический журнал grafana

SLA как инструмент, а не отчёт

Это вторая часть разбора того, как мы выстраивали SLA и инцидент-менеджмент в большом продукте. В этой части речь пойдёт о следующем этапе — масштабир…

аналитика backend инцидент-менеджмент sla управление рисками мониторинг дашборды надежность сервисов расчет потерь бизнес-аналитика

VictoriaLogs vs Loki vs Elasticsearch

Привет, Хабр! В этой статье разбираем плюсы и минусы VictoriaLogs как решения для логирования в облачной платформе. Читать далее

victorialogs victoriametrics мониторинг логи метрики loki elasticsearch dbrain микросервисы логирование

Multi-region quorum: «все регионы согласны» против «N из M»

К-of-N или all-must-agree? Два подхода к quorum-логике в multi-region мониторинге. Я остановился на all-must-agree с consecutive-failure threshold. С …

мониторинг quorum SRE false positive Redis distributed systems alerting threshold uptime incident management