RU

[Перевод] Claude против краевых случаев: как LLM-агент нашёл баги в NumPy и других Python-библиотеках

Исследователи Anthropic собрали LLM-агента, который читает код Python-библиотек, сам формулирует свойства, пишет property-based тесты на Hypothesis и …

property-based testingтестирование на основе свойствClaudeLLM-агентыhypothesisавтоматизация тестированияпоиск баговpython-библиотекиNumPy
Habr
RU

Свой биллинг для ИИ-агента: микрокредиты и контроль расходов

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем, как написать биллинг для продакшн ИИ-агента. Когда ваш ИИ-бот начинае…

LLM-агентыбиллингLangChainContextVarии-агентытокенытрейсинг
Habr
RU

Агентные фреймворки: обещали революцию,  что осталось в 2026

Два года назад все хотели агента, который «сам пишет код, сам его тестирует и сам деплоит в прод».  Сейчас 2026 год. Давайте честно поговорим о т…

LLM-агентыLangChainLangGraphAutoGenMCPRAGагентные системыAI в продакшенеLlamaIndex
Habr
RU

Мультимодальность в ИИ-агентах: картинки на вход, картинки на выход и отказ от Multimodal RAG

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем мультимодальность в ИИ-агентах на реальном примере из продакшена. Мы п…

RAGmultimodal RAGмультимодальностьvision LLMimage-onlyColPaliCLIPLLM-агентыLangChaincontext engineering
Habr
RU

Как мы научили ИИ-агента отвечать за свои слова: 10 000 сообщений, Венгерский алгоритм и немного магии

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем самое больное место разработки ИИ-агентов — как доказать, что они реал…

evaluationметрики качестваLLM-агентыRagasLangFuseRAGВенгерский алгоритмAI-driven разработкаLangChainlangchain агенты.
Habr
RU

[Перевод] Как мы перешли на Opus и стали платить меньше

На прошлой неделе мы писали о том, как  скармливали терабайты CI-логов LLM . Большинство вопросов на Hacker News касались не самих логов — спраши…

LLM-агентыmulti-agentClaude OpusClaude HaikuоркестраторtriagerClickHouseсемантический поискстоимость инференса