RU

[Перевод] Нехватка CUDA-памяти при обучении с GRPO: как перестать гадать и начать считать

Ошибка CUDA out of memory при обучении LLM обычно превращается в бесконечный цикл случайных правок: уменьшили batch size, урезали sequence length, сни…

NLPLLMGRPOобучение с подкреплениемCUDA out of memoryvLLMоптимизация GPU памятидообучение моделейLoRAPyTorch
Habr
RU

Хотел упростить мониторинг проектов и в отпуск — пришлось обучать свой LLM.Часть 3.Дистилляция

Третья часть про DevOps-агента Oni. В первой статье я встретился с реальностью — локальные модели не справляются с простыми задачами. Во второй разбир…

LLMфайнтюнингfine-tuningLoRADevOps-агентOllamaобучение LLMcatastrophic forgettingUnslothAI-агент
Habr
RU

Хотел упростить мониторинг проектов и в отпуск — пришлось обучать свой LLM.Часть 2.Обучение

Продолжаем серию про файнтюнинг и создание DevOps-агента Oni. В прошлой части я встретился с реальностью — ни одна локальная модель не справилась с пр…

LLMфайнтюнингfine-tuningQwen3LoRADevOps-агентобучение LLMcatastrophic forgettingUnslothAI-агент
Habr