RU

Промпты, RAG, LLM-тюнинг, Harness… Идём дальше?

Автономная диагностика СУБД требует от LLM-агента не просто генерации текста, а точной последовательности действий: сбора телеметрии, анализа планов з…

harnessmeta-harnessпаретодискретная оптимизацияprompt tuningRAG tuningharness engineeringmeta-agentmeta-llmllm as a judge
Habr
RU

[Перевод] Месть дата-сайентиста: почему LLM не отменили нашу профессию

LLM упростили запуск AI-функций до нескольких вызовов API, и дата-сайентисты будто бы выпали из критического пути. На практике именно здесь начинаются…

harnessData Scienceдата-сайентистоценка моделейllmllm-as-a-judgeметрики качестваанализ ошибокразметка данныхmlops
Habr
RU

«Мементо»: как фильм Нолана 2000 года удивительно точно иллюстрирует работу ИИ- агентов

По-настоящему культовые произведения искусства отличаются от заурядных тем, что люди спустя годы продолжают находить в них смыслы, которые авторы и не…

МементоКристофер НоланИИ-агентыLLMконтекстное окноknowledge cutoffсистемный промптprompt injectionharnessискусственный интеллект
Habr
RU

Harness вокруг LLM: что я понял за полтора года ежедневной работы

Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества б…

LLMClaude CodeAI-агентыprompt engineeringharnessAnthropiccontext engineeringAgent Skillsllms.txtvibecoding
Habr