AI & ML — Tech News

EN

Build a RAG Pipeline From Scratch (Production Patterns That Actually Matter)

Most RAG tutorials stop at "embed your docs, do a similarity search, stuff the results in a prompt." That gets you a demo. It does not get you somethi…

rag llmengineering vectordatabases embeddings

RU

Зачем backend разработчику Python, если он не собирается становиться data scientist

Долго воспринимал Python как язык из соседнего мира. Где то там data science, pandas, ноутбуки, модели, эксперименты. А у меня обычный backend: API, м…

python backend llm rag ai fastapi embeddings api production enterprise

EN

RAG with OpenAI Embeddings, pgvector and LangChain

Retrieval-Augmented Generation (RAG) is a practical pattern: store knowledge as embeddings, retrieve the most relevant chunks with semantic search, th…

openai rag embeddings langchain

RU

Как мы боремся с галлюцинации AI Master: гибридный Guard на Embedding + LLM Extractor на примере AI-RPG «Стирая Грань»

Каждый, кто пробовал создавать текстовые RPG или симуляторы на базе LLM (будь то GPT-4, DeepSeek или локальная 70B), сталкивался с проблемой «Yes-And»…

LLM gamedev NLP embeddings python deepseek геймдизайн искусственный интеллект rpg архитектура

RU

Раннее завершение KNN-поиска в Manticore Search

Современные поисковые системы уже не просто сопоставляют ключевые слова. Когда вы ищете «уютный детектив, действие которого происходит в Париже», а по…

knn knn-search векторный поиск семантический поиск hnsw embeddings oversampling полнотекстовый поиск

RU

Как заставить ИИ играть по правилам ролевой системы: архитектура авторитарного бэкенда для AI RPG

Сделать текстовую игру на базе LLM легко, если вас устраивает бесконечный неконтролируемый чат, который ломается через 30 ходов из-за модельного дрейф…

python fastapi pgvector flutter искусственный интеллект rag deepseek embeddings dnd разработка игр

RU

Почему RAG — это не просто «добавить поиск»: latency, качество и выбор стратегии retrieval

Когда говорят про RAG, его часто описывают как простой способ улучшить LLM‑систему: добавить поиск по внешним данным, найти релевантный…

RAG LLM retrieval latency Chroma Ollama vector search embeddings top-k chunk size

RU

Почему RAG — фундамент любой AI-трансформации

За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные п…

rag искусственный интеллект llm retrieval augmented generation векторная база данных embeddings корпоративные данные ai automation knowledge base hallucinations

RU

Хакатон Samsung IT Academy Hack 2026: как студенты оптимизировали поиск в корпоративном мессенджере

Поиск — штука настолько привычная, что её редко рассматривают как отдельную инженерную задачу. На деле это связка из четырёх частей: парсинг и нормали…

хакатон поиск информационный поиск elasticsearch qdrant embeddings векторный поиск ранжирование vk workspace vk tech

RU

RAG в enterprise: 70-80% проблем не в модели, а в данных

Эта статья родилась из работы над AlpinaGPT . Мы недавно зарелизили в нём по-настоящему крутых AI-ассистентов и AI-проекты: с подключаемыми базами зна…

RAG enterprise AI retrieval augmented generation embeddings GraphRAG Agentic RAG BM25 chunking LLM AlpinaGPT

RU

Notion + RAG + Telegram: архитектура AI-копирайтера для сети ресторанов

В таком сценарии копирайтеру недостаточно просто писать тексты. Ему нужно помнить факты о каждом заведении: часы работы, фирменные блюда, формат кухни…

llm rag автоматизация telegram-бот генерация контента notion ai embeddings векторная база данных prompt engineering

RU

Клиент — это тоже вектор? Как мы хотели улучшить ML-модель, а построили similarity engine

Поговорим о том, как превращать последовательности пользовательских событий в векторы, зачем обучать BERT на "языке" клиентского поведения и почему em…

машинное обучение анализ данных bert deep learning machine learning embeddings transformers

RU

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе.…

RAG embeddings эмбеддинги реранкер reranker nDCG информационный поиск юридический ИИ USER2-base бенчмарк