DevOps — Tech News

RU

Технический и продуктовый мониторинг за кастомизациями Битрикс24: как настроить и на что смотреть

Рассказываем и показываем, как можно использовать мониторинг за кастомизациями Битрикс24. Для работы используем телеметрическую инфраструктуру на базе…

open telemetry otel collector observability мониторинг grafana clickhouse телеметрия продуктовая аналитика битрикс24 технические метрики

RU

Дашборд для SSRS и Power BI Report Server, которого нет ни у кого: собираем сами и забираем готовым

Готового мониторинга для SSRS и Power BI Report Server в сети нет - одни обзоры «SQL Server» с CPU и памятью. Собрал свой на Grafana: трейс упавших ра…

ssrs powerbi pbirs grafana mssql мониторинг windows_exporter victoriametrics prometheus дашборд

RU

Что спросить у вендора ESB, если вы подбираете интеграционную шину

На связи Сергей Скирдин, технический директор ИТ-интегратора «Белый код». Последние два года я изучаю российский рынок ESB и интеграционных платформ, …

шины данных опросный лист интеграции коннектор мониторинг производительность ESB интеграционные платформы kafka open source

RU

Сервер работает. Продукт — уже нет

Большинство команд следят за серверами, базами данных и доступностью приложений. Но самые дорогие инциденты часто происходят совсем в другом месте. Ис…

мониторинг saas devops observability stripe openai webhook api интеграции надежность

RU

Дело о молчаливой JVM: мониторинг Spring Boot с Prometheus и Grafana. Production-нуар

Она умерла в воскресенье вечером, и никто не услышал ни звука. Детективная история о том, как поставить прослушку на собственное приложение: Prometheu…

spring boot prometheus grafana micrometer мониторинг метрики slo alertmanager jvm promql

RU

Как производственная компания мигрировала 1С на новую серверную инфраструктуру без остановки работы

Производственная компания с 5 филиалами и более чем 180 пользователями столкнулась с серьезными проблемами производительности 1С ERP: проведение докум…

Миграция 1С мониторинг нагрузка zabbix Технологический журнал grafana

RU

Как я писал скрипт: от идеи до рабочего инструмента

Пришла в голову  задача, которая на словах звучит просто. «Сделай скрипт, который смотрит логи и шлёт в Telegram»  ну что тут сложного? Bash…

bash linux мониторинг системное администрирование devops journald telegram бот отладка скриптов server monitoring bash scripting

RU

Простая сложная VictoriaMetrics

Привет, я Сергей Истомин, DevOps-инженер в KTS . А ниже моя история про построение мультитенантного скоупа кластеров VictoriaMetrics с разными периода…

monitoring мониторинг victoriametrics victoria metrics vmstorage vmcluster grafana kubernetes мультитенантность

RU

Визуализация кастомных метрик Angie в Grafana

Возвращаемся к теме мониторинга в Angie. Ранее мы запускали базовую конфигурацию с экспортом метрик в Prometheus и визуализацией в…

grafana prometheus angie мониторинг

RU

VictoriaLogs vs Loki vs Elasticsearch

Привет, Хабр! В этой статье разбираем плюсы и минусы VictoriaLogs как решения для логирования в облачной платформе. Читать далее

victorialogs victoriametrics мониторинг логи метрики loki elasticsearch dbrain микросервисы логирование

RU

От Prometheus к Victoria Metrics: как мы пересобрали мониторинг в Kubernetes

1.   Введение Всем привет! Меня зовут Яблоков Олег, я — ведущий инженер ИТ-отдела Navio и отвечаю за систему мониторинга основной инфраструктуры …

victoriametrics prometheus kubernetes мониторинг observability sre devops gitops grafana alertmanager

RU

OTel Collector в кастомизации Битрикс24: подключаем Observability

Рассказываем про инструмент для наблюдения за кастомизациями Битрикс24 — телеметрическую инфраструктуру на базе OpenTelemetry Collector. Для проектов …

open telemetry мониторинг observability логирование трассировка grafana clickhouse docker devops битрикс24

RU

Как фронтендер из Bay Area, который почти не пишет код руками, сделал на Rust трекер расходов для ИИ-агентов — и зачем

Я фронтенд-разработчик. Работаю в Bay Area, в компании, которая выдаёт всем инженерам корпоративные подписки на Claude Code и Cursor. То есть лично из…

rust claude code cursor ai open source observability мониторинг vibe coding opentelemetry sqlite

RU

HikariCP в проде: пять настроек, которые часто крутят неправильно

В проде connection pool редко падает громко — чаще он тихо превращает сервис в очередь ожидания: запросы висят, база задыхается, Kubern…

HikariCP JDBC Spring Boot connection pool Postgres пул соединений таймауты production настройка сервиса мониторинг

RU

[Перевод] Логи, метрики и счёт в конце месяца: как телеметрия превращается в архитектурный долг

После инцидента команда почти всегда хочет видеть больше: добавить поле в лог, сохранить еще одну метку, оставить дашборд «на всякий случай». В момент…

observability телеметрия логи OpenTelemetry метрики кардинальность мониторинг трейсинг sre архитектурный долг

RU

Пять самых крупных ошибок, которые допускают компании при внедрении SRE

SRE часто внедряют как набор инструментов, дашбордов и новых должностей, но через полгода команда всё так же тушит инциденты по ночам, а бюджеты ошибо…

Site Reliability Engineering SRE надежность систем распределенные системы мониторинг observability slo бюджет ошибок инциденты

RU

Inspector v3: как я сделал свой центр управления Kubernetes на старом ноутбуке

Привет, Хабр! Меня зовут Артём, в YADRO я работаю инженером инфраструктуры: виртуализация, мониторинг, контейнеризация — это мое ежедневное. Также зан…

k8s monitoring kubernetes инференс мониторинг

RU

Облачная LLM на 16 ГБ VRAM — часть 2: LangGraph Server, LangSmith и SDK

Друзья, привет! Возвращаюсь с продолжением. В первой части мы разобрались, как поднять локальную LLM и пробросить к ней внешний доступ. Но до настояще…

langgraph selectel it-инфраструктура llm ai cloud rest api интерфейс трейсинг мониторинг

RU

Лёгкий мониторинг Proxmox-кластера: Pulse вместо большого Zabbix-стека

Полчаса в день у меня уходило на ручной обход шести нод Proxmox через веб-интерфейс — он показывает по одной ноде за раз. И часть рутины всё равно про…

pulse proxmox мониторинг proxmox backup server monitoring telegram byok zfs lxc proxmox ve

RU

Как мы вывели в админку ошибки yt-dlp, которые жили только в логах. Bridge на 200 строк и борьба с alert-fatigue

История о том, как сделать видимыми ошибки yt-dlp, которые молча умирали в логах воркера. Bridge на 200 строк, классификатор content vs infra, борьба …

yt-dlp fastapi observability alert-fatigue мониторинг python devops

RU

Собрал MCP-сервер для Windows-администрирования: 42 инструмента, от Event Viewer до диагностики служб

Собрал MCP-сервер для Windows: 42 инструмента в 8 модулях Тут собраны Services, Event Viewer, Task Scheduler, Processes, Network, Diagnostics, Observa…

MCP Windows PowerShell администрирование DevOps AI Claude автоматизация мониторинг Event Viewer

RU

Multi-region quorum: «все регионы согласны» против «N из M»

К-of-N или all-must-agree? Два подхода к quorum-логике в multi-region мониторинге. Я остановился на all-must-agree с consecutive-failure threshold. С …

мониторинг quorum SRE false positive Redis distributed systems alerting threshold uptime incident management

RU

Зачем нужны APM-платформы, если есть Prometheus и Grafana

Зачем APM-платформы, если есть Prometheus и Grafana Всем привет! Мы разрабатываем APM-платформу и регулярно сталкиваемся с вопросом — зачем платить, е…

apm apm-мониторинг observability monitoring мониторинг zabbix prometheus grafana opensource opentracing

RU

[Перевод] Декодируем трафик Zabbix Proxy для быстрого устранения неполадок

Обычно для базовой диагностики прокси достаточно просто заглянуть на страницу администрирования Zabbix proxy или посмотреть метрики состояния прокси. …

zabbix zabbix proxy мониторинг wireshark tshark tcp dump сетевой анализ devops linux диагностика

RU

Как я Zabbix с LLM дружил в свободное время. Архитектурный обзор взаимодействия с нейросетью. Часть 1 «При чем тут ТЗ»

Это первая статья из цикла о том, как я пытался сделать алерты Zabbix в домашней лаборатории чуть умнее, прикрутив к ним локальную LLM и не получить н…

zabbix llm aiops мониторинг алерты тз it-инфраструктура rca

RU

Loki «Next Wave»: как Grafana Labs переписала правила логирования на GrafanaCON 2026

Всем привет. В этой статье расскажу о новостях касаемо Loki. О том что было представлено на GrafanaCON 2026 в Барселоне. Чего нам ждать от новой архит…

grafana loki logs observability kafka логи графана мониторинг