Open Source — Tech News

All topics AI agents ai api architecture automation aws beginners career claude database devchallenge devops javascript linux llm machinelearning mcp opensource performance productivity programming python react security showdev softwareengineering tutorial typescript webdev

All EN RU

Как технология LayerScale спасает сверхглубокие трансформеры (и почему о ней молчат туториалы)

Все знают, что трансформеры можно масштабировать: просто добавь больше слоев, и модель станет умнее. Но на практике попытка обучить трансформер глубин…

градиентный спуск трансформеры искусственный интеллект нейросети

Проклятие адаптивности: почему живучесть нейросетей ваш главный враг (и как я случайно ампутировал трансформер)

В классическом программировании ошибка в коде приводит к крашу. В Deep Learning ошибка в коде часто приводит к тому, что модель просто находит способ …

градиентный спуск трансформеры нейронные сети искусственный интеллект оптимизатор

Обратное распространение ошибки: от интуиции до кода

Многие умеют вызывать loss.backward() в PyTorch, но не всегда понимают, что именно происходит под капотом. Как сеть вычисляет, какой из миллионов весо…

машинное обучение нейросети backpropagation обратное распространение ошибки градиентный спуск deep learning python математика вычислительные графы micrograd