Programming — Tech News

All topics AI agents ai api architecture automation aws beginners career claude database devchallenge devops javascript learning llm machinelearning mcp opensource performance productivity programming python react rust security showdev tutorial typescript webdev

All EN RU

Build a RAG Pipeline From Scratch (Production Patterns That Actually Matter)

Most RAG tutorials stop at "embed your docs, do a similarity search, stuff the results in a prompt." That gets you a demo. It does not get you somethi…

rag llmengineering vectordatabases embeddings

Зачем backend разработчику Python, если он не собирается становиться data scientist

Долго воспринимал Python как язык из соседнего мира. Где то там data science, pandas, ноутбуки, модели, эксперименты. А у меня обычный backend: API, м…

python backend llm rag ai fastapi embeddings api production enterprise

RAG with OpenAI Embeddings, pgvector and LangChain

Retrieval-Augmented Generation (RAG) is a practical pattern: store knowledge as embeddings, retrieve the most relevant chunks with semantic search, th…

openai rag embeddings langchain

Как мы боремся с галлюцинации AI Master: гибридный Guard на Embedding + LLM Extractor на примере AI-RPG «Стирая Грань»

Каждый, кто пробовал создавать текстовые RPG или симуляторы на базе LLM (будь то GPT-4, DeepSeek или локальная 70B), сталкивался с проблемой «Yes-And»…

LLM gamedev NLP embeddings python deepseek геймдизайн искусственный интеллект rpg архитектура

Как заставить ИИ играть по правилам ролевой системы: архитектура авторитарного бэкенда для AI RPG

Сделать текстовую игру на базе LLM легко, если вас устраивает бесконечный неконтролируемый чат, который ломается через 30 ходов из-за модельного дрейф…

python fastapi pgvector flutter искусственный интеллект rag deepseek embeddings dnd разработка игр

Почему RAG — это не просто «добавить поиск»: latency, качество и выбор стратегии retrieval

Когда говорят про RAG, его часто описывают как простой способ улучшить LLM‑систему: добавить поиск по внешним данным, найти релевантный…

RAG LLM retrieval latency Chroma Ollama vector search embeddings top-k chunk size

Бенчмарк 7 эмбеддингов и 4 реранкеров на корпусе судебной практики

Привет, Хабр. Это мой первый пост здесь, поэтому пара слов о себе. Я практикующий юрист, 8+ лет практики, последние годы - в производственном секторе.…

RAG embeddings эмбеддинги реранкер reranker nDCG информационный поиск юридический ИИ USER2-base бенчмарк