RU

Месяц с LLM Wiki Андрея Карпатого: главная сила LLM — не в пересказе, а в умении «связывать» знания

Читать статьи и веб-материалы через суммаризацию от LLM — это уже почти норма. Даже один только разбор общей картины плюс диалоговые вопросы заметно п…

ai-агентыwiki
Habr
RU

Токен-оптимизация агентов: на что уходит контекстное окно MCP

Чем больше задач берёт на себя агент, тем чаще он упирается не в качество модели, а в контекстное окно: туда нужно уместить инструкции, историю диалог…

mcpclaudeanthropicllmai-агентыopensourcecontext-engineeringaiclaude-codetokens
Habr
RU

Veai 5.12: агент в любимой IDE, которому не нужно заранее объяснять формат задачи

Главная ценность релиза — разработчик начинает с рабочей задачи, а не с выбора режима. Каждый день есть задачи, которые хочется сделать быстро и …

ai-агентыaiпрограммированиеjavakotlinkotlin nativeаналитикаideкурсор
Habr
RU

Как я прошёл путь от «сам быстрее напишу» до своего фреймворка для агентной разработки

Когда я пытался делегировать ИИ-агентам написание кода для рабочих задач, то быстро наступил на все возможные грабли. В итоге на ревью и исправление о…

claude codespec driven developmentsuperpowerscontext rottddvibecodingvibe-codingai-агентыии-агентыllm
Habr
RU

Как платформа управления AI-агентами будет справляться с нагрузкой: архитектура без магии

Когда говорят про AI-агентов, обычно обсуждают качество модели, промпты, рассуждения, hallucinations, стоимость токенов и скорость ответа. Но если убр…

aiai-агентыai agentai-agentai securityossecurity sectors
Habr
RU

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сл…

mlopsselectelllm-моделиqwenphi-4mistralgpt-ossdeepseekaiai-агенты
Habr
RU

Как перестать жечь токены впустую: переходим от вайбкодинга к агентной разработке с Claude Code

AI-инструменты уже давно перестали быть просто «умными чатами». Сегодня Claude Code, Codex и другие агенты постепенно превращаются в полноценную инжен…

claude codeии-агентыai-агентыllmвайбкодингуправление контекстомагентная инженерияtddэкономия токеновmcp
Habr
RU

Evals для чайников. Как тестировать AI-агента, чтобы понимать, где именно он ломается

Большинство команд оценивают производительность AI-агентов через end-to-end метрики: success rate, количество токенов, tool usage, стоимость запроса, …

ai-агентыllmragevalsorchestrationretrievaltool callingcontext engineeringproductionai infrastructure
Habr
RU

Как и почему умирает ИИ-внедрение: пять bottlenecks

Привет, Хабр. Меня зовут Виктор Овчинников, я руковожу разработкой интеграционной платформы Digital Q.Integration в компании Диасофт.  Больше два…

программированиеaiai-агентыai-agentинтеграцияискусственный интеллектбезопасностьобучение нейронных сетей
Habr
RU

Как оценивать ИИ-агентов в проде: нижняя планка, трассы и кодовые проверки

Если агент уже ходит в инструменты, читает документы, меняет состояние системы и принимает часть решений сам, проверка одного промпта почти ничего не …

evalaiai-агентыllmтестированиеdata analysisагенты в продакшенеагенты иитрассировкаharness engineering
Habr
RU

Как тестируют кодинг-агентов в 2026 — и почему вашему продакшну нужен свой бенчмарк

Ни для кого не секрет, что эра «спросить что-то у GPT» постепенно уходит в прошлое. На смену генеративному AI приходит Agentic AI, который не просто п…

mlaibenchmarkai-агентыai-agentswe-benchswe-bench verifiedOSWorldGAIAterminal-bench
Habr
RU

Spec-driven development в микросервисах, часть 2: как archspec делает контекст сервисов явным

В первой части я разбирал, почему spec-driven development начинает ошибаться, когда фича проходит через несколько микросервисов. Пробле…

spec-driven developmentai-assisted developmentclaude codellmai-агентымикросервисыархитектура микросервисовdocs as codeservice contractsoutbox pattern
Habr
RU

Качество кода в эпоху AI: как не утонуть в багах и уязвимостях

Это конспект вебинара. Спикер — Даниил Степанов, разработчик-исследователь Veai, преподаватель ИТМО, ранее работал в Jet…

программированиеjavajavascriptai-агентыaillm-моделиllm-агентllmkotlinkotlin native
Habr
RU

Я попросил ИИ выбрать нишу для стартапа. Готовой кнопки почти нет

Эксперимент с zero-human компанией: GitHub-агенты, SaaS-валидаторы, поиск боли и почему готовой кнопки выбора ниши пока почти нет Некоторые из вас зна…

искусственный интеллектai-агентыстартаппоиск ниш и продуктов через aisaasopen sourcegithubпродуктовая разработкаzero human companyпредпринимательство
Habr
RU

Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 2]

Продолжаем рассмотрение, того как правильно оценивать качество ИИ систем, в данной части поговорим о двух крайне полезных метриках: одна универсальный…

метрики качестваragasai-агенты
Habr
RU

Veai 5.10: общие скиллы и подсказки в чате

Главное в Veai 5.10 – скиллы теперь подхватываются из dot-директорий других ассистентов. В чат добавили быструю документацию по ссылкам на код. Запуск…

ai-агентыllmавтоматизация тестированиягенерация кода aiавтоматизация разработкиai в разработкеавтоматическая генерация кодаии-ассистентintellij idea pluginдокументация
Habr
RU

Я «нанял» AI-команду разработки и управлял ею через Kanban: опыт на реальном продукте

Я руководитель проектов и у меня есть команда разработки продуктов. Аналитики исследуют и анализирует новые фичи, пишут спецификации. Есть разработчик…

управление проектамиvibecodingai-агенты