RU

Базовые нейросетевые модели для кредитного скоринга физических лиц

Всем привет! Мы команда прикладных исследований и разработки моделей глубокого обучения Альфа-банка. В этой статье мы хотели бы рассказать о наши…

нейросетинейронные сетимашинное+обучениетуториалкредитный скорингtransformersrnnкарточные транзакциибюро кредитных историй
Habr
RU

Нейросети в IT: где учиться, чтобы оптимизировать работу и больше получать

По данным опроса Stack Overflow Developer Survey 2025 года , 65% разработчиков используют ИИ-инструменты для написания кода как минимум раз в неделю. …

образование в итобразование в itшколы программированиянейронные сетинейросетиииобразование онлайн
Habr
RU

Рождение LLM: история, которую мало кто знает

Когда люди слышат "языковая модель", у большинства сразу всплывает ChatGPT, Gemini, ну или на худой конец что-то связанное с Яндексом. Но мало кто зад…

LLMбольшие языковые моделиистория ИИмашинное обучениенейронные сетиистория машинного обученияdeep learningOpenAIGoogle Brainискусственный интеллект
Habr
RU

Откуда в обучении берётся nan: численная нестабильность в ML и почему всё считают в логарифмах

Многие ML‑инженеры знают, что нужно использовать CrossEntropyLoss , log_softmax и logsumexp . Гораздо меньше людей могут объяснить, что имен…

численная стабильностьмашинное обучениенейронные сетиsoftmaxlogsumexpfloat32градиентыпереполнениеunderflowPyTorch
Habr
RU

Иллюзия ширины и геометрия глубины: почему глубокие нейросети умнее, и в чем лжет теорема об аппроксимации

Базовая теорема машинного обучения гласит, что нейросеть с одним скрытым слоем может выучить любую функцию в мире, если сделать этот слой достаточно ш…

нейронные сетитрансформерыllm
Habr
RU

Геометрия превосходства: Почему DeepSeek-V4 и Moonshot AI убили AdamW, и как оптимизатор Muon меняет физику обучения

Долгие 10 лет индустрия молилась на оптимизатор AdamW, слепо применяя его ко всем параметрам нейросети. Но весной 2026 года вышли DeepSeek-V4 и Kimi K…

оптимизатор adammuonоптимизаторнейронные сетиdeepseekkimi-k2.5
Habr
RU

Проклятие адаптивности: почему живучесть нейросетей ваш главный враг (и как я случайно ампутировал трансформер)

В классическом программировании ошибка в коде приводит к крашу. В Deep Learning ошибка в коде часто приводит к тому, что модель просто находит способ …

градиентный спусктрансформерынейронные сетиискусственный интеллектоптимизатор
Habr
RU

Perceptron: Как работала самая первая нейросеть в истории?

Сегодня мы расскажем с чего началась эпоха современного ИИ. Это произошло через год после полета первого искусственного спутника Земли и имело не мене…

ИИaiперцептронперцептроныистория itнейронные сетинейронная сетьнаучно-популярное