DevOps — Tech News

All EN RU

[Перевод] GPU-автоскейлинг на Kubernetes с KEDA: создание внешнего скейлера

Если вы запускаете GPU-нагрузки (графические ускорители) на Kubernetes — vLLM, Triton, обучающие задачи или более новые стеки агентного инференса, — в…

kubernetes keda gpu autoscaling external scaler nvml vllm triton helm greenops

Model Predictive Control для Kubernetes autoscaling: что получилось, где HPA оказался сильнее

Короткий пик нагрузки может закончиться раньше, чем Kubernetes успеет добавить готовую ёмкость. Разбираю, почему HPA и MPC-подходы упираются не только…

kubernetes hpa autoscaling автоскейлинг prometheus readiness p95 p99 Model Predictive Control mpc

Karpenter on AKS in 2026: What Actually Works

Karpenter on AKS in 2026: What Actually Works Karpenter on AKS has gone from "interesting experiment" to "something you can actually run in production…

kubernetes aks karpenter autoscaling

Автоскейлинг StarRocks в Kubernetes: как я довел его до предела

Классическая проблема аналитических систем: кластер СУБД сайзится под пик, а 28 дней в месяц он задействован чуть больше чем наполовину. StarRocks (sh…

starrocks olap kubernetes autoscaling selena субд mpp

What the first 24 hours of production CloudWatch data told us

Originally published on graycloudarch.com . The morning after go-live, the first thing I looked at was CPU. One of the two delivery services was sitti…

ecs cloudwatch autoscaling rightsizing