RU

Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026

Почему в каждом разговоре про промышленный ИИ в России за спиной заказчика оказывается одна из двух компаний - Сбер или Яндекс? Я съездил на ЦИПР-2026…

ципр-2026ципрконференцияагрегатор нейросетейнейросетьнейросетиинференсобучение нейронных сетейинференс нейросетейсбер
Habr
RU

Как связывание эмбеддингов душит трансформеры и уничтожает градиенты

Долгие годы в NLP считалось правилом хорошего тона связывать матрицу входных эмбеддингов с матрицей выходного классификатора (Weight Tying), чтобы сэк…

трансформерыllmградиентградиентный спускобучение нейронных сетейнейросеть
Habr
RU

Вспомнить всё. Спектр весов нейросети

В данной публикации попробуем сформировать простейшую нейросеть. Будем использовать Colab. Данный выбор также хорош тем, что то, что позволено Ю py те…

веса моделинейронная сетьобучение нейронных сетейпостеризацияпреобразование фурьеспектрограммафункция потерьточность прогноза