[Перевод] GPU-автоскейлинг на Kubernetes с KEDA: создание внешнего скейлера
Если вы запускаете GPU-нагрузки (графические ускорители) на Kubernetes — vLLM, Triton, обучающие задачи или более новые стеки агентного инференса, — в…
Latest DevOps news from Tech News
Если вы запускаете GPU-нагрузки (графические ускорители) на Kubernetes — vLLM, Triton, обучающие задачи или более новые стеки агентного инференса, — в…
Короткий пик нагрузки может закончиться раньше, чем Kubernetes успеет добавить готовую ёмкость. Разбираю, почему HPA и MPC-подходы упираются не только…
Karpenter on AKS in 2026: What Actually Works Karpenter on AKS has gone from "interesting experiment" to "something you can actually run in production…
Классическая проблема аналитических систем: кластер СУБД сайзится под пик, а 28 дней в месяц он задействован чуть больше чем наполовину. StarRocks (sh…
Originally published on graycloudarch.com . The morning after go-live, the first thing I looked at was CPU. One of the two delivery services was sitti…