EN

Can LLMs save themselves from verbosity?

« Je n'ai fait celle-ci plus longue que parce que je n'ai pas eu le loisir de la faire plus courte. » — Blaise Pascal, Lettres provinciales , Lettre X…

ainlp
Dev.to
RU

Почему WER недостаточно: Семантическая декомпозиция ошибок ASR

В продуктах, построенных поверх моделей распознавания речи (Automatic Speech Recognition models, ASR), качество распознавания речи напрямую влияет на …

werasrnernlpречевые технологиираспознавание речиwhisperмашинное обучениеОценка качества моделейречь в текст
Habr
RU

Эволюция 'More Like This'

Во многих поисковых сценариях пользователь начинает не с пустой строки запроса, а с существующего результата. Пользователь открывает статью и хочет на…

nlpобработка естественного языкавекторный поископтимизация производительностиполнотекстовый поисксемантический поискранжирование поискаtf-idfbm25
Habr
EN

Prompting styles - Basic

Query which we ask the LLM is referred to as prompt. The way in which we provide prompt to LLM makes a difference and there are different ways to to p…

aibeginnersllmnlp
Dev.to
RU

Современные морфоанализаторы русского языка: от словарей к нейросетям

В статье «Извлечение и обработка требований из документов с помощью NLP-инструментов » я уже показывал, как переход от LLM к NLP-библиотекам помогает …

морфологический анализморфологический словарьnlp
Habr
EN

Day 6 - Embedding - RAG

In the previous post, we saw what chunking is and the various methdologies of chunking. In this post, we are going to see the next stage of the RAG pi…

ainlpragtutorial
Dev.to
RU

Ask.com закрылся. Что это был за сервис? Вспоминаем 90-е

На главной странице Ask.com недавно появилось короткое уведомление: сервис официально прекратил работу 1 мая 2026 года. Компания-владелец решила закры…

selectelask.comистория интернетапоисковые системыnlpвеб-археологияask jeeves
Habr
RU

Кастомный пайплайн BERTopic: как кластеризовать тексты и получить интерпретируемые темы с помощью LLM

Привет, Хабр! Меня зовут Антон и я занимаюсь задачами NLP в компании Ростелеком Информационные технологии. Если вам приходилось разбирать большие масс…

кластеризацияbertopicllmhdbscannlpumap
Habr
RU

Как мы пытаемся снизить возвраты животных из приютов с помощью NLP

Четыре года я была волонтером в приюте. Самое тяжелое — видеть «вернувшихся» животных. Ещё вчера у них был дом, а сегодня снова клетка. В России 3,6 м…

nlpllmживотныеприютыстартапмашинное обучениесоциальные проектыволонтерстворекомендательные системы
Habr
EN

Day 4 - Chunking continued - RAG

Semantic Chunking Lets Consider two paragraphs A and B, focussing on strings in python. para A focus on typecasting and para B focus on accessing char…

ainlppythonrag
Dev.to