RU

В llama.cpp предложили поддержку MTP — Qwen3.6 27B быстрее в 2,4 раза

В llama.cpp предложили поддержку Multi Token Prediction. Qwen3.6 27B Q8_0 ускорился с 7 до 16–22 ток/с, accept rate 72%. Разбираем PR, бенчмарки, как …

Open SourceИнструментыПроизводительностьМашинное обучениеИскусственный интеллектНовости
Tproger
RU

Сравнение гибридных языковых моделей класса 9B для промышленного инференса

В материале сравниваются три открытые гибридные модели класса 9B (NVIDIA Nemotron‑Nano‑9B‑v2, Bamba‑9B‑v2, Qwen3.5‑9B) с референсной плотной Llama 3.1…

ПроизводительностьРаботаБотыIBMNVIDIAМаркетингQAАналитикааналитикGPUСтатьи
Tproger
RU

Аналоги Jira 2026: лучшие российские альтернативы для управления проектами и задачами

Чем заменить Jira в России? Сравнение аналогов: SimpleOne, Kaiten, YouGile. Функционал, цены, миграция данных. Пошаговый план по переходу для команд р…

ИнструментыПроизводительностьРаботаСтатьи