RU

Как мы строили eval и автоматизировали оптимизацию AI-агента для умного помощника

Привет! Меня зовут Алексей, я разработчик в Битрикс24.  В первой части рассказывал про retrieval-часть нашего RAG для AI-помощника Марты: как мы …

ragevalоптимизациядатасетбитрикс24база знаний
Habr
RU

Как оценивать ИИ-агентов в проде: нижняя планка, трассы и кодовые проверки

Если агент уже ходит в инструменты, читает документы, меняет состояние системы и принимает часть решений сам, проверка одного промпта почти ничего не …

evalaiai-агентыllmтестированиеdata analysisагенты в продакшенеагенты иитрассировкаharness engineering
Habr