RU

Мультимодальность в ИИ-агентах: картинки на вход, картинки на выход и отказ от Multimodal RAG

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем мультимодальность в ИИ-агентах на реальном примере из продакшена. Мы п…

RAGmultimodal RAGмультимодальностьvision LLMimage-onlyColPaliCLIPLLM-агентыLangChaincontext engineering
Habr
RU

От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С…

RAGLLMИИ-агентыLangChainLangFuseRagasметрики качестваcontext engineeringмультимодальностьии
Habr
RU

Все на завод! Робот импровизирует и решает промышленные задачи с 99% успеха

Роботы долгое время умели одно: безупречно копировать заученные движения. Но стоило реальности чуть отклониться от сценария — и они терялись. Теперь о…

роботыроботостроениеробототехникажелезомоделиVLAGEN-1гуманоидымультимодальностьphysical ai