Tech News — Latest News

All EN RU

DREM для линейной регрессии: как развязать веса перцептрона и ускорить обучение

Разбор применения метода DREM (Dynamic Regressor Extension and Mixing) для обучения линейного перцептрона. Рассматривается алгоритм декомпозиции много…

DREM линейная регрессия перцептрон градиентный спуск идентификация параметров

Разбираемся в ML без воды: от базы до Attention. Часть 3

Во второй части мы рассмотрели аналитическое решение задачи линейной регрессии и наткнулись на ряд неприятностей — сингулярность, плохая обусловленнос…

градиент градиентный спуск линейная регрессия практика

Как технология LayerScale спасает сверхглубокие трансформеры (и почему о ней молчат туториалы)

Все знают, что трансформеры можно масштабировать: просто добавь больше слоев, и модель станет умнее. Но на практике попытка обучить трансформер глубин…

градиентный спуск трансформеры искусственный интеллект нейросети

Проклятие адаптивности: почему живучесть нейросетей ваш главный враг (и как я случайно ампутировал трансформер)

В классическом программировании ошибка в коде приводит к крашу. В Deep Learning ошибка в коде часто приводит к тому, что модель просто находит способ …

градиентный спуск трансформеры нейронные сети искусственный интеллект оптимизатор

Как связывание эмбеддингов душит трансформеры и уничтожает градиенты

Долгие годы в NLP считалось правилом хорошего тона связывать матрицу входных эмбеддингов с матрицей выходного классификатора (Weight Tying), чтобы сэк…

трансформеры llm градиент градиентный спуск обучение нейронных сетей нейросеть

Обратное распространение ошибки: от интуиции до кода

Многие умеют вызывать loss.backward() в PyTorch, но не всегда понимают, что именно происходит под капотом. Как сеть вычисляет, какой из миллионов весо…

машинное обучение нейросети backpropagation обратное распространение ошибки градиентный спуск deep learning python математика вычислительные графы micrograd

Мой первый ИИ: Пишем нейросеть на Python с нуля

Написал гайд для тех, кто хочет понять нейросети изнутри. Создаем свой ИИ для распознавания цифр на чистом Python всего в 50 строк кода. Вся математик…

Нейросети для начинающих python машинное обучение алгоритмы numpy градиентный спуск распознавание образов искусственный интеллект