AI & ML — Tech News

RU

П維чему нейро考ети дел思ют так

Если вы хоть раз тестировали локальную модель (да и нелокальную тоже) и замечали, как она посреди нормального текста вдруг выдает иероглиф, то заголов…

нейросети машинное обучение эмбеддинги grokking гроккинг llm векторное пространство mechanistic interpretability токены selectel

RU

Что происходит внутри LLM, когда ты отправляешь сообщение

Каждый день миллионы людей разговаривают с системой, про которую не могут ответить на простой вопрос: а что она вообще делает, когда отвечает? Не в см…

LLM трансформер нейросети токенизация attention GPT машинное обучение эмбеддинги генерация текста как работает ИИ

RU

Одна строка — много объектов: как агрегировать эмбеддинги для ML-моделей

Иногда одна строка датасета соответствует не одному объекту, а целому набору связанных объектов: новостям, комментариям, изображениям или&nb…

машинное обучение искусственный интеллект эмбеддинги агрегация MIL llm feature engineering pooling attention NLP

RU

Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова

Дело моё — программы писать, а сходиться им положено с мастеровой грамотой: ГОСТами, СТО, спецификациями. Хочу спросить оракула в писарне про точный п…

RAG FAISS MCP локальный RAG семантический поиск эмбеддинги Cursor FastAPI doc-rag юмор

RU

Я собрал Telegram-бота с лентой новостей, которая учится на твоих реакциях — и хостится за $5 в месяц

Хотел ленту новостей без двух вещей: дублей (одно событие из пяти каналов с разными заголовками) и потока негатива по утрам. Получился Telegram-бот, к…

telegram-бот python aiogram sqlite sqlite-vec pgvector эмбеддинги рекомендательная система openrouter fly.io

RU

Защита от дублирования кода агентами: семантические концепции

Я строю Telegram-first SaaS в одиночку, а весь код за меня пишут ИИ-агенты Claude Code, и довольно быстро я уперся в неприятное: каждый новый агент пр…

ИИ-агенты Claude Code дедупликация кода граф концептов эмбеддинги семантический поиск Type-4 клоны retrieval DRY память агентов

RU

RAG в энтерпрайзе: почему демо работает, а прод нет

Представьте себе типичное совещание. Кто-то из руководства возвращается с конференции, садится напротив и говорит: «У них там бот по внутренней докуме…

RAG LLM retrieval-augmented generation векторные базы данных эмбеддинги чанкинг корпоративный поиск галлюцинации LLM OpenAI Pinecone

RU

Вам продают ИИ. Покупать нужно не его

Звонил мне на днях один знакомый CIO. Питерский, ритейл, средний бизнес, ничего особенного. Слушай, говорит, надо нам с ИИ что-то делать: все вокруг в…

llm rag искусственный интеллект локальные модели эмбеддинги архитектура данных хранилища данных внедрение ии data engineering цена ошибки

RU

Некорпоративный Хабр: семантический поиск и фильтрация по структурированным полям

Классический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и с…

семантический поиск структурирование инфомации локальный поиск по документам эмбеддинги duckdb wasm wllama llm-приложения sql rag llm

RU

Как я превратила Obsidian в структурированную память для ИИ‑агентов

Эта статья про NOUZ — локальный MCP‑сервер между Obsidian и ИИ‑агентом. Он превращает базу заметок в структурированную память: с у…

Obsidian RAG ИИ-агенты MCP базы знаний DAG эмбеддинги

RU

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе.…

RAG embeddings эмбеддинги реранкер reranker nDCG информационный поиск юридический ИИ USER2-base бенчмарк