RU

Современные морфоанализаторы русского языка: от словарей к нейросетям

В статье «Извлечение и обработка требований из документов с помощью NLP-инструментов » я уже показывал, как переход от LLM к NLP-библиотекам помогает …

морфологический анализморфологический словарьnlp
Habr
EN

Day 6 - Embedding - RAG

In the previous post, we saw what chunking is and the various methdologies of chunking. In this post, we are going to see the next stage of the RAG pi…

ainlpragtutorial
Dev.to
RU

Ask.com закрылся. Что это был за сервис? Вспоминаем 90-е

На главной странице Ask.com недавно появилось короткое уведомление: сервис официально прекратил работу 1 мая 2026 года. Компания-владелец решила закры…

selectelask.comистория интернетапоисковые системыnlpвеб-археологияask jeeves
Habr
RU

Кастомный пайплайн BERTopic: как кластеризовать тексты и получить интерпретируемые темы с помощью LLM

Привет, Хабр! Меня зовут Антон и я занимаюсь задачами NLP в компании Ростелеком Информационные технологии. Если вам приходилось разбирать большие масс…

кластеризацияbertopicllmhdbscannlpumap
Habr
RU

Как мы пытаемся снизить возвраты животных из приютов с помощью NLP

Четыре года я была волонтером в приюте. Самое тяжелое — видеть «вернувшихся» животных. Ещё вчера у них был дом, а сегодня снова клетка. В России 3,6 м…

nlpllmживотныеприютыстартапмашинное обучениесоциальные проектыволонтерстворекомендательные системы
Habr
EN

Day 4 - Chunking continued - RAG

Semantic Chunking Lets Consider two paragraphs A and B, focussing on strings in python. para A focus on typecasting and para B focus on accessing char…

ainlppythonrag
Dev.to
RU

Битва двух ёкодзун: почему детекторы ИИ и гуманизаторы делают тексты еще хуже

В век, когда абсолютно все площадки, включая Хабр, захлебываются под цунами сгенерированного контента, особенно ценными становятся статьи, написанные …

контентseo-оптимизациякопирайтингэкспертный контентllm-моделидетекторы иинейросетиnlpконтент-маркетингgptzero
Habr