RU

Эволюция 'More Like This'

Во многих поисковых сценариях пользователь начинает не с пустой строки запроса, а с существующего результата. Пользователь открывает статью и хочет на…

nlpобработка естественного языкавекторный поископтимизация производительностиполнотекстовый поисксемантический поискранжирование поискаtf-idfbm25
Habr
RU

Раннее завершение KNN-поиска в Manticore Search

Современные поисковые системы уже не просто сопоставляют ключевые слова. Когда вы ищете «уютный детектив, действие которого происходит в Париже», а по…

knnknn-searchвекторный поисксемантический поискhnswembeddingsoversamplingполнотекстовый поиск
Habr
RU

Obsidian Hybrid Search (OHS). MCP и CLI, которые выводят поиск по заметкам с AI-агентами на новый уровень

AI-агенты умеют искать по Obsidian-хранилищу, но делают это слишком топорно через glob и grep. Да, для кода эти инструменты работают потрясающе, но хр…

ObsidianObsidian Hybrid SearchMCPAI-агентыгибридный поисксемантический поискBM25RRFбаза знанийPKM
Habr
RU

Защита от дублирования кода агентами: семантические концепции

Я строю Telegram-first SaaS в одиночку, а весь код за меня пишут ИИ-агенты Claude Code, и довольно быстро я уперся в неприятное: каждый новый агент пр…

ИИ-агентыClaude Codeдедупликация кодаграф концептовэмбеддингисемантический поискType-4 клоныretrievalDRYпамять агентов
Habr
RU

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и с…

семантический поискструктурирование инфомациилокальный поиск по документамэмбеддингиduckdb wasmwllamallm-приложенияsqlragllm
Habr
RU

[Перевод] Как мы перешли на Opus и стали платить меньше

На прошлой неделе мы писали о том, как  скармливали терабайты CI-логов LLM . Большинство вопросов на Hacker News касались не самих логов — спраши…

LLM-агентыmulti-agentClaude OpusClaude HaikuоркестраторtriagerClickHouseсемантический поискстоимость инференса