Open Source — Tech News

All topics AI agents ai api architecture automation aws beginners career claude database devchallenge devops javascript linux llm machinelearning mcp opensource performance productivity programming python react security showdev softwareengineering tutorial typescript webdev

All EN RU

Откуда в обучении берётся nan: численная нестабильность в ML и почему всё считают в логарифмах

Многие ML‑инженеры знают, что нужно использовать CrossEntropyLoss , log_softmax и logsumexp . Гораздо меньше людей могут объяснить, что имен…

численная стабильность машинное обучение нейронные сети softmax logsumexp float32 градиенты переполнение underflow PyTorch

Проклятие адаптивности: почему живучесть нейросетей ваш главный враг (и как я случайно ампутировал трансформер)

В классическом программировании ошибка в коде приводит к крашу. В Deep Learning ошибка в коде часто приводит к тому, что модель просто находит способ …

градиентный спуск трансформеры нейронные сети искусственный интеллект оптимизатор