RU

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Всем привет! Продолжаю тему локальных LLM. В предыдущей статье  мы сравнивали железо для инференса — Nvidia DGX Spark, Mac Studio M3 Ultra и Stri…

claude-codestrix haloии-агентыпрограммированиеantropicqwen3.6локальный ииllama.cppvibecoding
Habr
RU

Qwen3.6 MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s для Qwen3.6 27B без искажений

В llama.cpp добавили поддержку MTP Qwen3.6. Дополнительные слои Multi-Token Prediction позволяют сгенерировать сразу несколько токенов за 1 проход, чт…

искусственный интеллектmtpllama.cppqwenqwen3.6
Habr