Testing & QA — Tech News

EN

Impact of Inference Backends on LLM Reproducibility: Notes from a Research Paper

Recently I read aboyt this article: The Silent Hyperparameter: Quantifying the Impact of Inference Backends on LLM Reproducibility Here is what I lear…

ai llm computerscience nlp

RU

Облачные ИИ не справляются, MiniLM-L6 ломается на философии: строим локальный RAG для сложных семантических текстов

Этот проект долго вынашивался и, в конце концов, начался как очередная попытка разобраться в философских текстах, написанных Джейн Робертс во второй п…

rag local llm nlp python vector search

EN

yasbd-lib vs PySBD: two philosophies of sentence boundary detection

Sentence boundary detection sounds boring. Split on . ? ! , done, right? Anyone who has tried knows otherwise. Abbreviations, decimals, URLs, nested q…

nlp python sentencesplitter rulebased

RU

Почему «чем проще, тем лучше» не работает на ИИ-классификаторе

Обучил multi-label классификатор на 15 классов для модерации Discord-сообщества, получил micro F1 = 0.9358 — цифра, с которой можно закрывать задачу и…

machine learning multi-label classification ruBERT class imbalance nlp pytorch bert text classification

EN

Which Is to Be Master? Language, Authority and LLMs

Introduction “When I use a word,” Humpty Dumpty said in rather a scornful tone, “it means just what I choose it to mean—neither more nor less.” “The q…

ai computerscience llm nlp

RU

AI-база: модели, агенты, агентные механизмы

Привет, хабр, меня зовут Кияшева Екатерина. Вообще я из QA, но сегодня сделаю шаг в сторону и разберу  AI-базу. За последний год встречалась масс…

LLM ai-агенты ai-agent mcp rag nlp как выбрать модель

EN

What Building an AI Detector Taught Me About Machine Learning

When I started building Naturalmelo , I thought the difficult part would be training a machine learning model to distinguish AI-generated text from hu…

ai llm machinelearning nlp

EN

CHE MCP — Building Argentina's First National MCP Ecosystem: 5-Stage Classifier, WMA Online Learning, 748 Datasets

Argentina just got its first national MCP ecosystem — and it was built from Bahía Blanca. CHE MCP is an intelligent gateway that connects any AI agent…

ai mcp nlp showdev

RU

RAG не только для вопросов и ответов: почему он естественно подходит для рекомендаций

Retrieval-Augmented Generation (RAG) чаще всего рассматривается в контексте вопросно-ответных систем и чат-ботов поверх базы знаний. Большинство публи…

EN

How Self-Attention Works — QKV, Softmax, and Matrix Computation

Self-Attention is not just “looking at important words.” It is a matrix operation. And that is exactly why Transformers scale. Core Idea Self-Attentio…

ai machinelearning nlp transformers

RU

DCD: доменно-ориентированная архитектура для построения RAG-систем

Привет! Это Роботы. Недавно мы выпустили статью на arXiv , где представили архитектурный подход DCD (Domain–Collection–Document) для структурирования …

llm rag nlp genai

EN

I Built an "Amazon-Style" AI Review Summarizer for Any Dataset (NLP, Transformers, Streamlit)

Have you seen those new AI-generated review summaries on Amazon? They are incredibly useful for buyers, but there’s a catch: they are completely locke…

ai deeplearning nlp showdev

EN

Tokenization under the hood: BPE, WordPiece, SentencePiece, and Unigram compared

Tokenization under the hood: BPE, WordPiece, SentencePiece, and Unigram compared You deploy a chatbot. English queries average 42 tokens each. Then a …

tokenization llm ai nlp

EN

Can LLMs save themselves from verbosity?

« Je n'ai fait celle-ci plus longue que parce que je n'ai pas eu le loisir de la faire plus courte. » — Blaise Pascal, Lettres provinciales , Lettre X…

ai nlp

EN

Bridging the Rigidity Gap: Deploying Secure Agentic RAG in Healthcare Governance

In the healthcare industry, data is both an organization's most valuable asset and its most heavily guarded liability. While industries like e-commerc…

ai rag nlp automation

EN

The Macro Failure of "One-Size-Fits-None" Reporting: Why Healthcare Providers Fail to Act on Patient Feedback - Part I

Every month, healthcare jurisdictions pool millions of dollars into collecting Patient-Reported Experience Measures (PREMs). Millions of text files an…

ai nlp visualization automation

RU

Почему WER недостаточно: Семантическая декомпозиция ошибок ASR

В продуктах, построенных поверх моделей распознавания речи (Automatic Speech Recognition models, ASR), качество распознавания речи напрямую влияет на …

wer asr ner nlp речевые технологии распознавание речи whisper машинное обучение Оценка качества моделей речь в текст

RU

Эволюция 'More Like This'

Во многих поисковых сценариях пользователь начинает не с пустой строки запроса, а с существующего результата. Пользователь открывает статью и хочет на…

nlp обработка естественного языка векторный поиск оптимизация производительности полнотекстовый поиск семантический поиск ранжирование поиска tf-idf bm25

RU

Ask.com закрылся. Что это был за сервис? Вспоминаем 90-е

На главной странице Ask.com недавно появилось короткое уведомление: сервис официально прекратил работу 1 мая 2026 года. Компания-владелец решила закры…

selectel ask.com история интернета поисковые системы nlp веб-археология ask jeeves

EN

What Reddit Can Teach Us About Women’s Watch Preferences (Python + NLP Project)

Most “what watch should I buy?” discussions online skew heavily male. A friend wanted to launch a women’s watch, so I helped with a small data analysi…

python nlp sentimentanalysis datascience

EN

Did My LoRA Learn Tenacious Style—or Just Memorize Augmented Patterns?

In Week 11 Tenacious-Bench, we trained a LoRA adapter on Tenacious-style B2B sales emails using Supervised Fine-Tuning (SFT). We got a real performanc…

deeplearning llm machinelearning nlp

EN

Auto-Furigana in the Browser — Lazy-Loading kuromoji.js's 4 MB Dictionary from a CDN to Annotate Japanese Kanji With Their Readings

Furigana are the small hiragana annotations that sit above kanji to show how they should be read. Schoolbooks, kid manga, and language-learning materi…

javascript japanese nlp frontend

RU

Битва двух ёкодзун: почему детекторы ИИ и гуманизаторы делают тексты еще хуже

В век, когда абсолютно все площадки, включая Хабр, захлебываются под цунами сгенерированного контента, особенно ценными становятся статьи, написанные …

контент seo-оптимизация копирайтинг экспертный контент llm-модели детекторы ии нейросети nlp контент-маркетинг gptzero