RU

Как я пытался создать шедевр в Qwen, Luma и Pika, и что из этого вышло

Помните, как полтора-два года назад в коротких видео стали появляться видео сомнительного качества, которые можно с легкостью пометить как сгенерирова…

selectelopen sourcellmvideoqwenlumapikaииии и машинное обучение
Habr
RU

Tesla v100 SXM2  X2 32GB total

 В этом материале я разбираю практический кейс: развёртывание Qwen3.6-27B на двух Tesla V100-SXM2-16GB под управлением автономного агента Hermes …

tesla v100v100SXM2qwenqwen3.62017
Habr
RU

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сл…

mlopsselectelllm-моделиqwenphi-4mistralgpt-ossdeepseekaiai-агенты
Habr
RU

MTP у Qwen3.6 в llama.cpp обещает ×2 по скорости. Я прогнал ту же модель через своего агента — и получил обратное

Привет, Хабр. Меня зовут Лазутин Алексей, я  не профессиональный разработчик . SEO, аудиты сайтов, куча рутины с CSV, curl, отчётами для программ…

локальные llmqwenmtplm studioбенчмаркагентыtool calling
Habr
RU

Qwen3.6 MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s для Qwen3.6 27B без искажений

В llama.cpp добавили поддержку MTP Qwen3.6. Дополнительные слои Multi-Token Prediction позволяют сгенерировать сразу несколько токенов за 1 проход, чт…

искусственный интеллектmtpllama.cppqwenqwen3.6
Habr