AI & ML — Tech News

RU

Алгоритмы векторного поиска: IVF и HNSW

В данной статье я хочу пройтись по двум самым популярным алгоритмам векторного поиска, используемым на практике. Попробуем понять, почему точный поиск…

vector db ml ivf hnsw python

RU

Новые модели в FMC и патчи безопасности в SELECTOS: дайджест Selectel за май

Одними из первых в России выпустили патчи безопасности в SELECTOS и закрыли уязвимости в ядре Linux. Расширили список моделей в FMC, чтобы вы могли ав…

selectel it-компании it-инфраструктура kubernetes ml серверная оптимизация

EN

A line-by-line translation of the OCaml runtime from C to Rust

c rust ml vibecoding

RU

ICLR 2026 в Рио-де-Жанейро: главные ML-тренды, математика и инсайты

В конце апреля в Рио‑де‑Жанейро прошла ICLR-2026 (International Conference on Learning Representations) — одна из главных кон…

яндекс iclr iclr 2026 ml ai ии-агенты конференции

RU

Деплой LLM on-prem: Это наша корова и мы ее доим

Кто виноват? Что делать?© Заметили, что в наше веселое турбулентное время рождения многополярного мира все больше запросов на он‑п…

ai ml исскуственный интеллект

RU

Как мы перепридумали голосовую активацию для Яндекс Дропс и уместили новую модель в 200 килобайт

Голосовая активация в умных колонках — задача в целом решённая: несколько микрофонов, стабильное питание от розетки, хороший проце…

машинное+обучение ai ии ml алгоритмы звук наушники споттер голосовая активация модели

EN

Self-hosting email the hard way from your own routable IPv4 block up

security networking ml

RU

GPU без магии: что важно знать инженеру перед выбором ускорителя

Если вы технарь и работаете с инфраструктурой, то регулярно слышите слова GPU, HBM, NVLink, Tensor Cores, FP8, PCIe и тому подобное. Термины вроде зна…

gpu gpu-ускорители gpu computing gpupassthrough выделенные серверы нейросети ml дата-центры selectel сетевые технологии

RU

Как Anthropic меняет подходы к разработке в софтверных компаниях

На заметку всем, кто интересуется, как меняется современная разработка ПО. Недавно Anthropic выпустил отличную статью о том, как меняется современная …

antropic ml claude-code

RU

Агент против агента: опыт участия в агентских соревнованиях BitGN PAC1 и AgentBeats

Меня зовут Егор Спирин , я руковожу лабораторией прикладных агентов (ЛаПА) в магистратуре AI Talent Hub при ИТМО. Мне всегда были интересны соревнован…

агент агенты ии соревнование соревнования по машинному обучению ml ai ai-агенты карьера

RU

Как шахматный подход помог разобраться с фотолентой Яндекс Диска

Когда вы загружаете фотографии на Яндекс Диск, они не просто лежат в облаке: ML‑модели анализируют снимки, группируют их в альбомы…

разметка данных машинное обучение ml обучение моделей разметка фотографий алгоритмы

RU

Только Сигма выбирают Delta Lake

Привет, Хабр! Меня зовут Дмитрий Кравчук, я занимаюсь всем, что связано с данными в блоке AI&ML MAGNIT TECH. Расскажу про фундамент прибыльных про…

bigdata deltalake spark flink iceberg kubernetes hadoop ml datalake lakehouse

RU

Гибридный поиск в RAG: как мы подняли Top-1 с 62% до 88% на базе из 50 000 документов

Если вы строили RAG, вы знаете эту боль: вектор-поиск красиво работает на демо-вопросах, но в продакшене теряется на номерах договоров, артикулах и аб…

RAG Гибридный поиск ai ml

EN

strace-ui, Bonsai_term, and the TUI renaissance

linux ml

RU

Разбираемся в ML без воды: от базы до Attention. Часть 7: SVM и SGD

В шестой части мы разобрали логистическую регрессию и увидели, как линейная модель может разделять классы с помощью вероятностного подхода. В этой час…

svm классификация kernel trick sgd стохастический градиентный спуск hinge loss data science ml

RU

Трансформер в on-premise AppSec: как мы встроили ML-модель для классификации секретов в продукт без GPU

Рассказываем, как мы интегрировали CodeBERT-based модель классификации секретов в production-продукт с жёсткими ограничениями по железу, сократив врем…

appsec onnx mlops opensource оптимизация codescoring ml

RU

Как тестируют кодинг-агентов в 2026 — и почему вашему продакшну нужен свой бенчмарк

Ни для кого не секрет, что эра «спросить что-то у GPT» постепенно уходит в прошлое. На смену генеративному AI приходит Agentic AI, который не просто п…

ml ai benchmark ai-агенты ai-agent swe-bench swe-bench verified OSWorld GAIA terminal-bench

RU

Inside AI Meetup — как это было? Делимся записями докладов, фото и атмосферой

Привет! 20 мая прошел  Inside AI Meetup от Wildberries & Russ — про практические кейсы внедрения ИИ: векторный поиск и модерация с 200+ модел…

ai ии искуственный интеллект ml machine learning машинное обучение митап ds data science meetup

RU

Поднимаем Llama 3 в облаке: Ollama и Open WebUI

Локально запустить LLM сегодня можно за десять минут — например, с помощью LM Studio. Но как только модели нужно дать доступ команде, подключить RAG и…

llm-модели self-hosted ollama selectel ai ml llm lmstudio

RU

Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест

Пока инфо-бизнесмены продают очередные курсы по промпт-инжинирингу, в индустрии пересобирают саму архитектуру ИИ-систем. Главные вызовы сегодня л…

selectel LLM ai ml искусственный интеллект дайджест железо и софт nvidia amd sambanova

RU

[Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 3. Траснформеры

Это продолжение цикла статей о масштабировании тренировки и инференса LLM. Предыдущая статья А теперь перейдем к чему-то более практическому, а именно…

ai ml gpu gpu вычисления трансформеры анализ и проектирование систем

RU

DRAйверы для GPU: как Kubernetes научился выделять устройства через стандартный API

Device Plugin в Kubernetes сводит GPU к счётчику на узле: планировщик видит только количество устройств, но не их профиль, объём памяти или режим шари…

gpu kubernetes deckhouse kubernetes platform ai ml dra machine learning

RU

[Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 2. Шардинг

Это продолжение цикла статей о масштабировании тренировки и инференса LLM. Предыдущая глава находится по этой ссылке . Итак, с основами разобрались, д…

ai ml gpu gpu вычисления анализ и проектирование систем

RU

Как LLM научила рекомендательную модель видеть больше, чем историю взаимодействий

Привет, Хабр! Меня зовут Алексей Васильев, я тимлид команды «Рекомендательные системы и персонализация» Sber AI Lab — Центра практического искусс…

RU

От фич и каскадов к генеративной модели: как мы переосмыслили рекомендации с помощью ARGUS

Классические рекомендательные системы в крупных компаниях — это десятки микросервисов, каскадная фильтрация и тысячи ручных признаков. Такой…

RU

Отвечай, как топовый специалист: как службе поддержки решать настоящие, а не озвученные проблемы клиентов

За типичной заявкой «не работает, посмотрите» может скрываться необходимость пересмотра архитектуры системы. В то же время, «добавьте мне новый процес…

service desk тимлид служба поддержки техподдержка itsm365 системная аналитика ml ии-ассистент

RU

От видимости сети до кибербезопасности: главный миф о сетевой телеметрии, который мешает раскрыть потенциал NetFlow

Привет, Хабр! На связи Станислав Грибанов, я руководитель продукта NDR компании «Гарда», автор блога «Кибербезопасность и продуктовая экспертиза для б…

ndr nta netflow ipfix ml TI feeds анализ сетевого трафика ngips anomaly detection

RU

RAG для тех, кто разочаровался: почему retrieval ломается и как это починить

Вы собрали RAG-пайплайн: загрузили документы, нарезали на чанки, сгенерировали эмбеддинги, подключили векторную базу. Задаёте вопрос — модель отвечает…

ml python retrieval rag LLM векторный поиск

RU

Почему 4 сеньёра могут быть эффективнее команды из 15 человек

Есть компании, которые верят в то, что уж лучше много джунов за копейки, чем несколько сеньоров за дорого. Очевидно, мнения могут быть разными, поэтом…

ml llm senior junior mlops прототипирование

RU

Как мы контролируем сборку печатных плат: опыт внедрения ML-модели на производстве

Привет, Хабр! Меня зовут Дмитрий Горбунов, я ведущий инженер в AI-дивизионе в YADRO, работаю в команде SmartFab. Мы решаем задачи на собственном произ…

система контроля ai ml машинное обучение