RU

Промпты, RAG, LLM-тюнинг, Harness… Идём дальше?

Автономная диагностика СУБД требует от LLM-агента не просто генерации текста, а точной последовательности действий: сбора телеметрии, анализа планов з…

harnessmeta-harnessпаретодискретная оптимизацияprompt tuningRAG tuningharness engineeringmeta-agentmeta-llmllm as a judge
Habr
RU

Как оценивать ИИ-агентов в проде: нижняя планка, трассы и кодовые проверки

Если агент уже ходит в инструменты, читает документы, меняет состояние системы и принимает часть решений сам, проверка одного промпта почти ничего не …

evalaiai-агентыllmтестированиеdata analysisагенты в продакшенеагенты иитрассировкаharness engineering