Как я пытался создать шедевр в Qwen, Luma и Pika, и что из этого вышло
Помните, как полтора-два года назад в коротких видео стали появляться видео сомнительного качества, которые можно с легкостью пометить как сгенерирова…
Latest AI & ML news from Tech News
Помните, как полтора-два года назад в коротких видео стали появляться видео сомнительного качества, которые можно с легкостью пометить как сгенерирова…
У меня была видеокарта NVIDIA A100, максимальный объём памяти 79,254 Гб. Нужно было извлечь ключевую информацию (задача Qwestion Answering) из 6000 мн…
В этой статье я шаг за шагом расскажу, как дообучить LLM под свою задачу. В качестве примера возьму open-source модель Qwen2.5-0.5B и дообучу её извле…
ИИ все прочнее входит в работу программиста. Кто-то все еще отрицает его роль, кто-то с энтузиазмом пробует все новые возможности, но квалифицированно…
Есть такое устойчивое интеллектуальное заблуждение: если модель больше — значит, она лучше. Больше параметров, больше обучающих данных, больше де…
Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сл…
После выхода новой локальной модели Qwen 3.5 мне захотелось проверить не абстрактный бенчмарк, а более приземленную вещь: можно ли отдать маленькой ло…
Это история о том, как я собрал полностью локальную ИИ-среду разработки (и почему вам стоит сделать то же самое). Переезд из Евросоюза в Москву казалс…
This article was originally published on runaihome.com Three open-weight coding models are worth taking seriously for local inference in 2026: Qwen2.5…
Привет, Хабр. Меня зовут Лазутин Алексей, я не профессиональный разработчик . SEO, аудиты сайтов, куча рутины с CSV, curl, отчётами для программ…
20 мая вышло сразу две модели, на которые стоит обратить внимание. Alibaba объявила Qwen3.7-Max, а xAI тихо выложила на OpenRouter Grok Build 0.1. Обе…
Qwen 3.6 enable_thinking — The MoE Pitfall That Broke My Agent JSON Parsing I lost two hours last week to a Qwen 3.6 quirk that doesn't show up in any…
Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Ge…
Running Qwen3.6-27B on a 16GB M1 MacBook Pro: A Practical Engineer’s Guide Running a 27B model on a 16GB M1 MacBook Pro sounds a little unfair to the …
В llama.cpp добавили поддержку MTP Qwen3.6. Дополнительные слои Multi-Token Prediction позволяют сгенерировать сразу несколько токенов за 1 проход, чт…
Привет, меня зовут Вячеслав. Я интересуюсь локальными LLM и тем, как они ведут себя в реальных задачах — не на синтетических …
Local LLMs in 2026 work on three hardware lanes: 32-core CPU with 64GB+ RAM hits 10-25 tokens per second on Qwen 3 14B, an RTX 4090 hits 30-80 tokens …
Я работаю по ИП, поэтому не только пишу код, но и поддерживаю как DevOps свои проекты у заказчика. Эта история началась банально: я собирался в отпуск…
Когда вы пишете запрос в ChatGPT или другую нейросеть, она не работает с буквами или словами — она режет ваш текст на&nb…
Скидываю на ваше обозрение результаты небольшого эксперимента. Я спросил у самых популярных нейронок, какой фильм/книгу/игру/человека они бы занесли в…