Tech News — Latest News

All EN RU

Как мы с Claude Code учились оценивать качество RAG системы

Уверен, на Хабре найдётся немало статей, посвященных оценке качества RAG систем. Тема по-прежнему остаётся актуальной, потому что даже готовые библиот…

claude-code skill.md rag_api rag система автоматизация рутины клод код mcp-server оценка качества

AI Evals: Почему без оценки качества ваш продукт стоит на месте

Вы меняете системный промпт, надеетесь, что все заработало и деплоите фичу в продакшен. На следующее утро прилетает жалоба: агент выдумал дедлайн или …

evals оценка качества улучшение llm llm as a judge human in the loop Faithfulness Completeness

SciGraph: как я учил ИИ читать научные статьи не только по словам, но и по связям

SciGraph показывает, почему GraphRAG для научных статей — это не только про графы и LLM, но и про честные метрики. В&nbs…

GraphRAG RAG LLM NLP граф знаний научные статьи извлечение знаний цитирования оценка качества F1-метрика