AI & ML — Tech News

RU

Харнесс вокруг кодящего агента, или Как я создал собственного монстра

Качество работы с кодящим агентом почти не зависит от того, какая под капотом модель. Я довольно долго в это не верил — менял модели, крутил промпты, …

claude code ии-агенты для разработки харнесс context engineering agentic coding

RU

Evals для чайников. Как тестировать AI-агента, чтобы понимать, где именно он ломается

Большинство команд оценивают производительность AI-агентов через end-to-end метрики: success rate, количество токенов, tool usage, стоимость запроса, …

ai-агенты llm rag evals orchestration retrieval tool calling context engineering production ai infrastructure

RU

Чем умнее модель, тем меньше ей нужно: четыре дисциплины production‑агента

Если твой агент обвешан пошаговыми инструкциями и десятком узких инструментов под каждый шаг — он, скорее всего, работает хуже, чем мог&nbsp…

AI-агенты production-агенты context engineering инженерия контекста Anthropic Claude LLM Agent Skills промпт-инжиниринг tool design

RU

Мультимодальность в ИИ-агентах: картинки на вход, картинки на выход и отказ от Multimodal RAG

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем мультимодальность в ИИ-агентах на реальном примере из продакшена. Мы п…

RAG multimodal RAG мультимодальность vision LLM image-only ColPali CLIP LLM-агенты LangChain context engineering

RU

Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — памят…

LangChain ИИ-агенты RAG context engineering LLM AI-driven разработка llmstart контекст-инжиниринг production production-ready

RU

Почему ломается ваш AI-агент — и почему смена модели обычно его не чинит

Представьте внутреннего AI-агента, который помогает компании искать общие документы и управлять ими. Он работает. До тех пор, пока 12–15% запросов не …

ai-агенты llm rag orchestration retrieval tool calling context engineering evals production ai infrastructure

RU

От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С…

RAG LLM ИИ-агенты LangChain LangFuse Ragas метрики качества context engineering мультимодальность ии

RU

Анатомия production AI агента: разбор двух открытых промптов Anthropic

Что должно быть в теле production AI агента? Не «один длинный промпт», а структурированная система: роль, бюджет вызовов, OODA loop, потолки ресурсов,…

claude anthropic ai-агенты llm context engineering agent skills system prompt claude code multi-agent

RU

Harness вокруг LLM: что я понял за полтора года ежедневной работы

Полтора года в Claude Code, несколько релизов моделей, десятки экспериментов с командой в Kaiten. Всё это время я ждал, что главным рычагом качества б…

LLM Claude Code AI-агенты prompt engineering harness Anthropic context engineering Agent Skills llms.txt vibecoding