AI & ML — Tech News

All EN RU

Как мы строили eval и автоматизировали оптимизацию AI-агента для умного помощника

Привет! Меня зовут Алексей, я разработчик в Битрикс24.  В первой части рассказывал про retrieval-часть нашего RAG для AI-помощника Марты: как мы …

rag eval оптимизация датасет битрикс24 база знаний

Как оценивать ИИ-агентов в проде: нижняя планка, трассы и кодовые проверки

Если агент уже ходит в инструменты, читает документы, меняет состояние системы и принимает часть решений сам, проверка одного промпта почти ничего не …

eval ai ai-агенты llm тестирование data analysis агенты в продакшене агенты ии трассировка harness engineering

4 Types of Hallucinations: One Detection Pattern Per Type

Book: LLM Observability Pocket Guide: Picking the Right Tracing & Evals Tools for Your Team Also by me: Thinking in Go (2-book series) — Complete …

ai llm observability eval