Sidemark: Active Telemetry Comments for C#
OpenTelemetry has quietly become table stakes. That's a good thing, but if you've instrumented a real codebase, you know the tax. A method that does o…
Tech news from the best sources
OpenTelemetry has quietly become table stakes. That's a good thing, but if you've instrumented a real codebase, you know the tax. A method that does o…
После инцидента команда почти всегда хочет видеть больше: добавить поле в лог, сохранить еще одну метку, оставить дашборд «на всякий случай». В момент…
Когда Impala-запрос начинает выполняться заметно дольше обычного, первое место, куда обычно идут смотреть, — query profile. Там есть план выполнения, …
If you’ve spent any time modernizing a Java-based microservices architecture recently, you’ve likely hit the "Observability Wall." The ecosystem is dr…
В прошлой статье мы разбирали kubectl describe pod : как читать вывод, в котором Kubernetes уже часто сам написал причину проблемы — в Events, Conditi…
Статья о том, как получить наблюдаемость (observability) в приложении с минимальным кодом, а бонусом получить структурированные логи с типизированными…
SRE часто внедряют как набор инструментов, дашбордов и новых должностей, но через полгода команда всё так же тушит инциденты по ночам, а бюджеты ошибо…
Unlocking Insights with Observability: My Journey with OpenTelemetry As a Full Stack Engineer specializing in DevOps, AI Infrastructure, and Cloud, I'…
TLDR Monitoring AI agents in production requires distributed tracing: a single user request fans out into 10 or more internal operations, and logs alo…
I have a production Claude agent that has been running for about four months. It does code review on incoming PRs, drafts changelog entries, and occas…
Introduction Good forecasts help with capacity planning and quieter alerts. But one traffic spike or memory leak can make any forecast useless. The go…
Микросервис работает, но иногда тормозит — и вы не знаете, где копать. Логи чистые, метрики в норме, а пользователи жалуются.…
Book: LLM Observability Pocket Guide: Picking the Right Tracing & Evals Tools for Your Team Also by me: Thinking in Go (2-book series) — Complete …
Book: LLM Observability Pocket Guide: Picking the Right Tracing & Evals Tools for Your Team Also by me: Thinking in Go (2-book series) — Complete …
Book: LLM Observability Pocket Guide: Picking the Right Tracing & Evals Tools for Your Team Also by me: Thinking in Go (2-book series) — Complete …
Book: LLM Observability Pocket Guide: Picking the Right Tracing & Evals Tools for Your Team Also by me: Thinking in Go (2-book series) — Complete …
I like Go channels. They are one of those language features that feel simple in the best possible way. You can write something like this: jobs := make…
Most ASP.NET Core logging setups tell you that something failed — but not what actually happened during the request lifecycle. I built AsGuard to prov…
A React Native WebView debugging story about LCP, data URLs, and trace attributes We recently ran into a strange Sentry performance issue in a React N…
Authored by Marco Aquilanti Today we're introducing BrontoScope , one of the Bronto AI Labs initiatives aimed at reducing user toil, increasing team e…
Running large language model inference servers in production exposes gaps that neither stock Prometheus dashboards nor the official documentation of v…
Istio 1.30 Deep Dive — Agentgateway, Ambient Multicluster, TrafficExtension API, and 4 CVE Patches (JWKS RSA Leak, XDS Debug Auth) On May 18, 2026, th…
20 мая в 06:01:55 МСК Watchtower по расписанию проверил 14 контейнеров на нашем VPS, нашёл 5 обновлений и пересоздал. Среди обновлённых - n8n, который…
6-я статья из цикла туториалов о кастомизации своего бизнес-портала в Битрикс24. Во всех наших туториалах мы опираемся на стартовый шаблон-репозиторий…
Authored by Mike Neville-O'Neill Let's face it — logging is broken. Not just a little broken, but fundamentally misaligned with the needs of modern en…
Authored by Benoit Gaudin Every second, your CDN is generating thousands of logs that tell a critical story about your application's performance, secu…
Authored by Benoit Gaudin In Part I (Ingestion) and Part II (Storage) of this series, I explored the challenges of designing, running, and managing a …
История о том, как сделать видимыми ошибки yt-dlp, которые молча умирали в логах воркера. Bridge на 200 строк, классификатор content vs infra, борьба …
В инфраструктуре Яндекса работают тысячи микросервисов, которые каждую секунду генерируют миллионы временных рядов — метрик. Это могут быть количества…
Когда продакшен падает в три часа ночи, строка ERROR Something went wrong не помогает никому. В статье разбираем, почему привычные текс…