RU

[Перевод] Логи, метрики и счёт в конце месяца: как телеметрия превращается в архитектурный долг

После инцидента команда почти всегда хочет видеть больше: добавить поле в лог, сохранить еще одну метку, оставить дашборд «на всякий случай». В момент…

observabilityтелеметриялогиOpenTelemetryметрикикардинальностьмониторингтрейсингsreархитектурный долг
Habr
RU

Пять самых крупных ошибок, которые допускают компании при внедрении SRE

SRE часто внедряют как набор инструментов, дашбордов и новых должностей, но через полгода команда всё так же тушит инциденты по ночам, а бюджеты ошибо…

Site Reliability EngineeringSREнадежность системраспределенные системымониторингobservabilitysloбюджет ошибокинциденты
Habr
RU

14 лет Solar JSOC: кто стоит за защитой от киберугроз в крупнейшем коммерческом SOC страны

В конце нулевых кибербезопасность казалась довольно простым делом: антивирус на конечной точке, файервол на периметре и пентест раз в год. Тогда мало …

соларкибербезопасностьsocмониторингкиберугрозыинформационная безопасность
Habr
RU

Бизнес-аналитика для сети из 300 аптек: прогноз продаж и другие показатели

Привет! На связи Анна Астахова, директор по развитию ИТ-интегратора «Белый код». Недавно мы внедрили аналитику для сети аптек «Лаки Фарма», в которой …

бизнес-анализдашбордыаптечные сетиbiмониторинганализ продажостаткифинансы
Habr
RU

SLA как инструмент, а не отчёт. Часть 1. Как подружить бизнес и инженеров через общие цифры

Наш прежний SLA формально выглядел корректно: была формула, «четыре девятки» и отчёты. Но в моменты сбоев это не помогало ответить бизнесу на вопросы:…

инцидент-менеджментslabackendуправление рискамианалитикамониторингвременные рядыдашбордынадежность сервисоврасчет потерь
Habr
RU

Стек российского сисадмина в 2026

Ушел TeamViewer, Veeam не купить, Jira SM превратилась в тыкву. Собрали актуальный стек российского сисадмина в 2026: шесть категорий, только то что р…

импортозамещениесисадминITAMitsmмониторингZabbixбэкапудалённый доступService Deskроссийское ПО
Habr
RU

Облачная LLM на 16 ГБ VRAM — часть 2: LangGraph Server, LangSmith и SDK

Друзья, привет! Возвращаюсь с продолжением. В первой части мы разобрались, как поднять локальную LLM и пробросить к ней внешний доступ. Но до настояще…

langgraphselectelit-инфраструктураllmaicloudrest apiинтерфейстрейсингмониторинг
Habr
RU

Probe-сеть из 10 регионов: что я не учёл про AS-разнесённость

Я делаю Valpero — uptime-мониторинг с проверками из 10 регионов мира. Когда я только собирал probe-сеть, я был уверен, что 10 географических точек это…

мониторингuptimeBGPASautonomous systemprobelatencyWebSocketинфраструктураfalse positive
Habr
RU

Лёгкий мониторинг Proxmox-кластера: Pulse вместо большого Zabbix-стека

Полчаса в день у меня уходило на ручной обход шести нод Proxmox через веб-интерфейс — он показывает по одной ноде за раз. И часть рутины всё равно про…

pulseproxmoxмониторингproxmox backup servermonitoringtelegrambyokzfslxcproxmox ve
Habr
RU

Как я Zabbix с LLM дружил в свободное время. Архитектурный обзор взаимодействия с нейросетью. Часть 3 HLD и немного LLD

Это третья статья из цикла о том, как я пытался сделать алерты Zabbix в домашней лаборатории чуть умнее, прикрутив к ним локальную LLM и не получить н…

zabbixllmaiopsмониторингалертыавтоматизацияit-инфраструктураhldlldc4
Habr
RU

Как мы вывели в админку ошибки yt-dlp, которые жили только в логах. Bridge на 200 строк и борьба с alert-fatigue

История о том, как сделать видимыми ошибки yt-dlp, которые молча умирали в логах воркера. Bridge на 200 строк, классификатор content vs infra, борьба …

yt-dlpfastapiobservabilityalert-fatigueмониторингpythondevops
Habr
RU

Собрал MCP-сервер для Windows-администрирования: 42 инструмента, от Event Viewer до диагностики служб

Собрал MCP-сервер для Windows: 42 инструмента в 8 модулях Тут собраны Services, Event Viewer, Task Scheduler, Processes, Network, Diagnostics, Observa…

MCPWindowsPowerShellадминистрированиеDevOpsAIClaudeавтоматизациямониторингEvent Viewer
Habr
RU

Как я Zabbix с LLM дружил в свободное время. Архитектурный обзор взаимодействия с нейросетью. Часть 2 «Выбор модели»

Это вторая статья из цикла о том, как я пытался сделать алерты Zabbix в домашней лаборатории чуть умнее, прикрутив к ним локальную LLM и не получить н…

zabbixllmaiopsмониторингалертыit-инфраструктураrca
Habr
RU

Энергоэффективность ASIC под пристальным взглядом: что J/TH показывает в реальности и где обманывает паспорт

Энергоэффективность — единственная метрика, которая в долгом периоде определяет, заработает ли ваша майнинг-ферма деньги. Хешрейт можно нарастить, цен…

энергоэффективностьundervoltautotuningпрошивкиASICтестовый стендмониторинг
Habr
RU

Wazuh: ручная регистрация агента — пошаговый гайд для сложных сетей

Автоматическая регистрация агента через веб-интерфейс Wazuh — это удобно. Но не тогда, когда за спиной NAT, VLAN, split-horizon DNS или корпоративные …

информационная безопасностьмониторингwazuhwazuh-managerwazuh-agent
Habr
RU

[Перевод] Декодируем трафик Zabbix Proxy для быстрого устранения неполадок

Обычно для базовой диагностики прокси достаточно просто заглянуть на страницу администрирования Zabbix proxy или посмотреть метрики состояния прокси. …

zabbixzabbix proxyмониторингwiresharktsharktcp dumpсетевой анализdevopslinuxдиагностика
Habr
RU

Как я Zabbix с LLM дружил в свободное время. Архитектурный обзор взаимодействия с нейросетью. Часть 1 «При чем тут ТЗ»

Это первая статья из цикла о том, как я пытался сделать алерты Zabbix в домашней лаборатории чуть умнее, прикрутив к ним локальную LLM и не получить н…

zabbixllmaiopsмониторингалертытзit-инфраструктураrca
Habr