RU

DREM для линейной регрессии: как развязать веса перцептрона и ускорить обучение

Разбор применения метода DREM (Dynamic Regressor Extension and Mixing) для обучения линейного перцептрона. Рассматривается алгоритм декомпозиции много…

DREMлинейная регрессияперцептронградиентный спускидентификация параметров
Habr
RU

Разбираемся в ML без воды: от базы до Attention. Часть 3

Во второй части мы рассмотрели аналитическое решение задачи линейной регрессии и наткнулись на ряд неприятностей — сингулярность, плохая обусловленнос…

градиентградиентный спусклинейная регрессияпрактика
Habr
RU

Проклятие адаптивности: почему живучесть нейросетей ваш главный враг (и как я случайно ампутировал трансформер)

В классическом программировании ошибка в коде приводит к крашу. В Deep Learning ошибка в коде часто приводит к тому, что модель просто находит способ …

градиентный спусктрансформерынейронные сетиискусственный интеллектоптимизатор