RU

Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах

32 tools в промпте - дешевле, чем 7. Да, да - если вы строите агентов, это не опечатка. Это следствие того, как работает prefix cache в агентском цикл…

llm-агентprefix cachingтокеныai-агентыaiprompt cachingprompt-engineeringcontext-engineering
Habr
RU

Очередная методичка разработки с LLM: работает только если ты разработчик

С 2024 года, когда LLM стали (плюс/минус) пригодны для генерации кода и решения рабочих задач, я начал тащить их в свои проекты. Сначала кусками: помо…

LLMai driven developmentразработка с LLMclaude-codeметодология разработкиsub-agentsmcpcontext-engineeringвайбкодингвайб-кодинг