RU

Почему портал самообслуживания не работает — и при чём тут когнитивная нагрузка

Портал есть, каталог на 200 услуг есть, база знаний есть. А сотрудник всё равно звонит на первую линию. Разбираем, почему так — и что реально меняет И…

ITSMService Deskпортал самообслуживаниясамообслуживаниеRAGискусственный интеллектCynefinкогнитивная нагрузкауправление ИТ-услугамиавтоматизация
Habr
RU

Контекстное окно: почему нейросеть забывает части разговора

Представьте, что вы разговариваете с невероятно умным и эрудированным собеседником. Только очень странным. Несмотря на весь свой интеллект и тысячи фа…

контекстконтекстное окноLLMSelf-AttentionтокенLost in the MiddleRAGKV-cacheнейросетьвектор
Habr
RU

Как я мерил точность ИИ в распознавании еды: бенчмарк, LLM-as-judge и баг с варёной гречкой

Строю приложение для подсчёта калорий по фото. Пользователь снимает тарелку, модель определяет блюдо, считает КБЖУ. Идея не новая, но мне важно, чтобы…

LLMбенчмаркраспознавание едыcomputer visionRAGGeminiподсчёт калорийLLM-as-judgeоценка качества моделейнутриенты
Habr
RU

Графы знаний в юридическом домене: эксперимент с LightRAG (продолжение)

Юридический домен требует понимания многочисленных связей между сущностями, рассеянными по множеству документов. Поэтому кажется, что область знаний, …

RAGretrieval-augmented generationaiartificial intelligencellmlarge language modelsvector databasegraph databaseknowledge graphslightrag
Habr
RU

Что такое контекстное окно и почему модели забывают

Ты час разговариваешь с ChatGPT. Даёшь контекст, объясняешь задачу, уточняешь детали. А потом модель вдруг начинает противоречить тому, что говорила р…

контекстное окноLLMтокеныпамять ИИChatGPTязыковые моделиlost in the middleRAGGPTконтекст
Habr
RU

Как нейросети решают, чей бренд процитировать: разбор RAG-архитектуры поиска и что из этого следует для GEO

Когда Алиса, ChatGPT или Perplexity отвечают пользователю и называют конкретный бренд, за этим стоит конвейер из нескольких алгоритмов извлечения и ра…

GEOGenerative Engine OptimizationRAGЯндекс НейроАлисаLLMнейросетипоисковая оптимизацияBlockRankAI Overviews
Habr
RU

Как я за месяц перевела команду с SQL-промптов на мультиагентную систему и сэкономила команде 200 часов

Привет! Меня зовут Дарья Воронкина. Я строила и руководила командой DataHub в медтех-компании OneCell (цифровая патология — ИИ ищет опухоли и метастаз…

ИИ-агентыагентные системымультиагентные системыLLMRAGClaude Codeнейросетиавтоматизация процессовn8nагентная инженерия
Habr
RU

Топ-советы по Claude Code от Бориса Черни и не только: гайд на 56k звёзд — что реально работает, а что мимо

Наткнулся на репозиторий claude-code-best-practice — под 56 тысяч звёзд, #1 в GitHub Trending, внутри собраны в том числе советы самого создателя Clau…

Claude CodeAI-агентыagentic-engineeringRAGripgrepGraphifyоркестрация-агентовcode-search
Habr
RU

Трансформеры и бизнес: где ИИ даёт эффект, а где сжигает бюджет

Короче, такая история. В моей практике бывало такое, что приходит команда и говорит: «хотим внедрить ИИ». А под этим она понимает что-то среднее между…

нейросетьязыковая модельтрансформерLLMвнедрение ИИавтоматизацияRAG
Habr
RU

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

Недавно делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны, интеграции с монит…

RAGLLMFastAPIPythonOllamaOpenWebUIBM25SREранбукиOpenAI-compatible API
Habr
RU

Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова

Дело моё — программы писать, а сходиться им положено с мастеровой грамотой: ГОСТами, СТО, спецификациями. Хочу спросить оракула в писарне про точный п…

RAGFAISSMCPлокальный RAGсемантический поискэмбеддингиCursorFastAPIdoc-ragюмор
Habr
RU

AI для PHP-разработчиков. Часть 7: Экосистема AI-агентов в PHP – от простых вызовов OpenAI до мультиагентных платформ

За последние два года в экосистеме PHP вокруг AI-разработки сформировалась целая индустрия. Если раньше интеграция LLM выглядела как несколько строк к…

phpии-агентыLLMOpenAIMulti-Agent SystemsPrism PHPLaravel AINeuron AIRAGStructured Output
Habr
RU

Агентные фреймворки: обещали революцию,  что осталось в 2026

Два года назад все хотели агента, который «сам пишет код, сам его тестирует и сам деплоит в прод».  Сейчас 2026 год. Давайте честно поговорим о т…

LLM-агентыLangChainLangGraphAutoGenMCPRAGагентные системыAI в продакшенеLlamaIndex
Habr
RU

Мультимодальность в ИИ-агентах: картинки на вход, картинки на выход и отказ от Multimodal RAG

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем мультимодальность в ИИ-агентах на реальном примере из продакшена. Мы п…

RAGmultimodal RAGмультимодальностьvision LLMimage-onlyColPaliCLIPLLM-агентыLangChaincontext engineering
Habr
RU

Почему RAG — это не просто «добавить поиск»: latency, качество и выбор стратегии retrieval

Когда говорят про RAG, его часто описывают как простой способ улучшить LLM‑систему: добавить поиск по внешним данным, найти релевантный…

RAGLLMretrievallatencyChromaOllamavector searchembeddingstop-kchunk size
Habr
RU

Как команда становится AI Native: методология из 4 этапов

Подписки купили, тренинг провели, через два месяца все вернулись в Excel. Знакомо? Делюсь методологией, через которую мы прошли в Alpina Digital и кот…

ai nativeкорпоративный ИИвнедрение ИИAI adoptionLLMкорпоративное обучениеAlpinaGPTAI ассистентыRAGAI трансформация
Habr
RU

Как мы научили ИИ-агента отвечать за свои слова: 10 000 сообщений, Венгерский алгоритм и немного магии

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем самое больное место разработки ИИ-агентов — как доказать, что они реал…

evaluationметрики качестваLLM-агентыRagasLangFuseRAGВенгерский алгоритмAI-driven разработкаLangChainlangchain агенты.
Habr
RU

Что скрывается за AI-стратегией SAP, Oracle и Palantir: зачем корпоративному ИИ семантическое ядро

SAP, Oracle, Palantir, Celonis, Alibaba и Yonyou всё активнее строят вокруг корпоративного ИИ семантические слои: knowledge graph, ontology, process i…

искусственный интеллекткорпоративный ИИИИ-агентыRAGknowledge graphontologyсемантическое ядроERPуправление даннымиархитектура ПО
Habr
RU

Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости»

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем горячую тему, на которой спотыкаются многие разработчики ботов — памят…

LangChainИИ-агентыRAGcontext engineeringLLMAI-driven разработкаllmstartконтекст-инжинирингproductionproduction-ready
Habr
RU

От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде

На связи Сергей Смирнов, AI-инженер LLMStart.ru. Сегодня расскажу о полноценном кейсе, который мы делали для компании Айтон: агенте-консультанте по 1С…

RAGLLMИИ-агентыLangChainLangFuseRagasметрики качестваcontext engineeringмультимодальностьии
Habr
RU

Ты уже используешь агента. Просто не заметил

"Эксперты" говорят, что ближайшие несколько лет у каждого появится персональный ИИ-агент. Он будет писать код, помогать выбрать кофемашину, считать ка…

агенты ИИперсональный агентChatGPTClaudeавтоматизацияworkflowRAGтихое внедрение
Habr
RU

RAG в энтерпрайзе: почему демо работает, а прод нет

Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней докуме…

RAGLLMretrieval-augmented generationвекторные базы данныхэмбеддингичанкингкорпоративный поискгаллюцинации LLMOpenAIPinecone
Habr
RU

SciGraph: как я учил ИИ читать научные статьи не только по словам, но и по связям

SciGraph показывает, почему GraphRAG для научных статей — это не только про графы и LLM, но и про честные метрики. В&nbs…

GraphRAGRAGLLMNLPграф знанийнаучные статьиизвлечение знанийцитированияоценка качестваF1-метрика
Habr
RU

Графы знаний в юридическом домене: эксперимент с LightRAG

Юридический домен требует понимания многочисленных связей между сущностями, рассеянными по множеству документов. Поэтому кажется, что область знаний, …

RAGretrieval-augmented generationaiartificial intelligencellmlarge language modelsvector databasegraph databaseknowledge graphslightrag
Habr
RU

Могут ли LLM находить flaky‑тесты по одному только коду теста? Разбор одного исследования

Flaky‑тесты сложно ловить даже привычными инженерными методами: они ломают CI, подрывают доверие к автотестам и часто воспроизводятся только тогд…

flaky-тестыLLMавтотестытестирование ПОнестабильные тестыQAмашинное обучениеанализ кодапромптингRAG
Habr
RU

Внедрение ИИ‑агента в бизнес‑процесс за один день: от развертывания до прототипа

Когда руководитель просит «внедрить ИИ в бизнес‑процесс», обычно за этим стоит неприятная реальность: бюджета нет, данные нельзя отдавать в&…

ИИ-агентлокальная LLMOllaman8nавтоматизация процессовRAGпромпт-инжинирингбизнес-процессылокальная модельпрототипирование
Habr