AI & ML — Tech News

RU

Как я пытался создать шедевр в Qwen, Luma и Pika, и что из этого вышло

Помните, как полтора-два года назад в коротких видео стали появляться видео сомнительного качества, которые можно с легкостью пометить как сгенерирова…

selectel open source llm video qwen luma pika ии ии и машинное обучение

RU

Finetune Lora Qwen3vl и прочие приключения

У меня была видеокарта NVIDIA A100, максимальный объём памяти 79,254 Гб. Нужно было извлечь ключевую информацию (задача Qwestion Answering) из 6000 мн…

qwen lora fine-tuning vlm

RU

Как дообучить LLM. Рассказываю шаг за шагом

В этой статье я шаг за шагом расскажу, как дообучить LLM под свою задачу. В качестве примера возьму open-source модель Qwen2.5-0.5B и дообучу её извле…

SFT LoRA fine-tuning LLM qwen дообучение llm

RU

Идеальный склероз в сером ящике — мой опыт в ИИ-программировании

ИИ все прочнее входит в работу программиста. Кто-то все еще отрицает его роль, кто-то с энтузиазмом пробует все новые возможности, но квалифицированно…

llm ai-coding архитектура qwen gemma гранулярность опыт.

RU

Почему маленькие модели побеждают большие – и что это значит для вашего стека

Есть такое устойчивое интеллектуальное заблуждение: если модель больше — значит, она лучше. Больше параметров, больше обучающих данных, больше де…

llm gpt-5-mini qwen claude mythos rlm архитектура ии-моделей ии-оркестрация rag

RU

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сл…

mlops selectel llm-модели qwen phi-4 mistral gpt-oss deepseek ai ai-агенты

RU

Эксперимент с локальной Qwen на Go-сервисе

После выхода новой локальной модели Qwen 3.5 мне захотелось проверить не абстрактный бенчмарк, а более приземленную вещь: можно ли отдать маленькой ло…

go ai localai qwen

RU

Мой опыт с ИИ в России глазами европейца

Это история о том, как я собрал полностью локальную ИИ-среду разработки (и почему вам стоит сделать то же самое). Переезд из Евросоюза в Москву казалс…

localai codingai localllm continue antigravity qwen gemini

EN

Best Local Coding LLM in 2026: Qwen2.5-Coder vs DeepSeek-Coder-V2 vs Codestral

This article was originally published on runaihome.com Three open-weight coding models are worth taking seriously for local inference in 2026: Qwen2.5…

coding llm qwen deepseek

RU

MTP у Qwen3.6 в llama.cpp обещает ×2 по скорости. Я прогнал ту же модель через своего агента — и получил обратное

Привет, Хабр. Меня зовут Лазутин Алексей, я  не профессиональный разработчик . SEO, аудиты сайтов, куча рутины с CSV, curl, отчётами для программ…

локальные llm qwen mtp lm studio бенчмарк агенты tool calling

RU

Как использовать Qwen3.7-Max и Grok Build 0.1 для ИИ-агентов в России

20 мая вышло сразу две модели, на которые стоит обратить внимание. Alibaba объявила Qwen3.7-Max, а xAI тихо выложила на OpenRouter Grok Build 0.1. Обе…

ии-агенты создать ии-агента qwen qwen3.7-max grok Grok Build 0.1 как использовать в России искусственный интеллект автоматизация бизнеса нейросети для бизнеса

EN

Qwen 3.6 enable_thinking — The MoE Pitfall That Broke My Agent JSON Parsing

Qwen 3.6 enable_thinking — The MoE Pitfall That Broke My Agent JSON Parsing I lost two hours last week to a Qwen 3.6 quirk that doesn't show up in any…

qwen mlx localai llminference

RU

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Ge…

llm бенчмарк gemma qwen openrouter русский язык dora sft спорт llm-judge

EN

Running Qwen3.6-27B on a 16GB M1 MacBook Pro: A Practical Engineer’s Guide

Running Qwen3.6-27B on a 16GB M1 MacBook Pro: A Practical Engineer’s Guide Running a 27B model on a 16GB M1 MacBook Pro sounds a little unfair to the …

ai apple qwen mlx

RU

Qwen3.6 MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s для Qwen3.6 27B без искажений

В llama.cpp добавили поддержку MTP Qwen3.6. Дополнительные слои Multi-Token Prediction позволяют сгенерировать сразу несколько токенов за 1 проход, чт…

искусственный интеллект mtp llama.cpp qwen qwen3.6

RU

Локальные LLM в реальной работе: Gemma 4, Qwen 3.6 и Qwen Coder

Привет, меня зовут Вячеслав. Я интересуюсь локальными LLM и тем, как они ведут себя в реальных задачах — не на синтетических …

llm llm-модели llama.cpp gemma4 qwen3.6 qwen opencode

EN

Local LLMs in 2026: What Actually Works on Consumer Hardware

Local LLMs in 2026 work on three hardware lanes: 32-core CPU with 64GB+ RAM hits 10-25 tokens per second on Qwen 3 14B, an RTX 4090 hits 30-80 tokens …

ai localllm ollama qwen

RU

Хотел упростить мониторинг проектов и в отпуск — пришлось обучать свой LLM

Я работаю по ИП, поэтому не только пишу код, но и поддерживаю как DevOps свои проекты у заказчика. Эта история началась банально: я собирался в отпуск…

machine-learning llm fine-tuning qwen ollama devops python openclaw

RU

Кириллица в LLM: почему русский язык в нейросетях стоит дороже и работает медленнее

Когда вы пишете запрос в ChatGPT или другую нейросеть, она не работает с буквами или словами — она режет ваш текст на&nb…

llm токенизация нейросети локальный ии self-hosted кириллица qwen gigachat llama yandexgpt

RU

Они точно попадут в ИИ-библию

Скидываю на ваше обозрение результаты небольшого эксперимента. Я спросил у самых популярных нейронок, какой фильм/книгу/игру/человека они бы занесли в…

llm gpt gemini claude гигачат сбер deepseek qwen философия медиа