Tech News — Latest News

RU

RAG от А до Я: шпаргалка архитектора (векторные базы, чанкинг, реранкинг и 8 граблей продакшена)

Создать демо-версию RAG сегодня можно за 15 минут: LangChain, ChromaDB, API OpenAI — и бот отвечает на простые вопросы. Но когда этот прототип сталкив…

RAG LLM LangChain эмбеддинги векторная база данных чанкинг реранкинг промпт-инжиниринг гибридный поиск machine learning

RU

П維чему нейро考ети дел思ют так

Если вы хоть раз тестировали локальную модель (да и нелокальную тоже) и замечали, как она посреди нормального текста вдруг выдает иероглиф, то заголов…

нейросети машинное обучение эмбеддинги grokking гроккинг llm векторное пространство mechanistic interpretability токены selectel

RU

Векторы по косинусу считают. Косинусное сходство, альтернативы, плюс — фановые проекты с эмбеддингами

Недавно мы в Beeline Cloud делали подборку руководств и обучающих материалов по теме эмбеддингов. Сегодня решили поговорить о распространенном подходе…

beeline cloud векторный поиск косинусное расстояние семантический поиск эмбеддинги

RU

Что происходит внутри LLM, когда ты отправляешь сообщение

Каждый день миллионы людей разговаривают с системой, про которую не могут ответить на простой вопрос: а что она вообще делает, когда отвечает? Не в см…

LLM трансформер нейросети токенизация attention GPT машинное обучение эмбеддинги генерация текста как работает ИИ

RU

Одна строка — много объектов: как агрегировать эмбеддинги для ML-моделей

Иногда одна строка датасета соответствует не одному объекту, а целому набору связанных объектов: новостям, комментариям, изображениям или&nb…

машинное обучение искусственный интеллект эмбеддинги агрегация MIL llm feature engineering pooling attention NLP

RU

Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова

Дело моё — программы писать, а сходиться им положено с мастеровой грамотой: ГОСТами, СТО, спецификациями. Хочу спросить оракула в писарне про точный п…

RAG FAISS MCP локальный RAG семантический поиск эмбеддинги Cursor FastAPI doc-rag юмор

RU

Я собрал Telegram-бота с лентой новостей, которая учится на твоих реакциях — и хостится за $5 в месяц

Хотел ленту новостей без двух вещей: дублей (одно событие из пяти каналов с разными заголовками) и потока негатива по утрам. Получился Telegram-бот, к…

telegram-бот python aiogram sqlite sqlite-vec pgvector эмбеддинги рекомендательная система openrouter fly.io

RU

Прокачать SQLite и сократить векторы в видеоформате — открытые инструменты для работы с эмбеддингами

Мы в Beeline Cloud подготовили новую подборку по теме векторных СУБД, в которой собрали примечательные инструменты по теме: например, решение, позволя…

beeline cloud векторные представления векторные субд эмбеддинги анализ текста

RU

Защита от дублирования кода агентами: семантические концепции

Я строю Telegram-first SaaS в одиночку, а весь код за меня пишут ИИ-агенты Claude Code, и довольно быстро я уперся в неприятное: каждый новый агент пр…

ИИ-агенты Claude Code дедупликация кода граф концептов эмбеддинги семантический поиск Type-4 клоны retrieval DRY память агентов

RU

RAG в энтерпрайзе: почему демо работает, а прод нет

Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней докуме…

RAG LLM retrieval-augmented generation векторные базы данных эмбеддинги чанкинг корпоративный поиск галлюцинации LLM OpenAI Pinecone

RU

Надо ли бороться с анизотропией эмбеддингов

Анизотропия эмбеддингов не всегда зло, но «сырой» косинус часто даёт слишком размытый сигнал. Центрирование убирает общий фон и помогает увидеть …

эмбеддинги анизотропия эмбеддингов база знаний векторный поиск калибровка эмбедингов косинусное сходство

RU

Вам продают ИИ. Покупать нужно не его

Звонил мне на днях один знакомый CIO. Питерский, ритейл, средний бизнес, ничего особенного. Слушай, говорит, надо нам с ИИ что-то делать: все вокруг в…

llm rag искусственный интеллект локальные модели эмбеддинги архитектура данных хранилища данных внедрение ии data engineering цена ошибки

RU

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и с…

семантический поиск структурирование инфомации локальный поиск по документам эмбеддинги duckdb wasm wllama llm-приложения sql rag llm

RU

Как я превратила Obsidian в структурированную память для ИИ‑агентов

Эта статья про NOUZ — локальный MCP‑сервер между Obsidian и ИИ‑агентом. Он превращает базу заметок в структурированную память: с у…

Obsidian RAG ИИ-агенты MCP базы знаний DAG эмбеддинги

RU

«Эмбеддинги на примерах с собаками», или как работать с векторными представлениями: книги и руководства по теме

Мы в Beeline Cloud собрали для вас подборку открытых руководств и обучающих материалов по теме эмбеддингов: что собой представляют подходы TF-IDF и Wo…

beeline cloud эмбеддинги векторные представления семантический анализ семантический поиск

RU

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе.…

RAG embeddings эмбеддинги реранкер reranker nDCG информационный поиск юридический ИИ USER2-base бенчмарк