RU

Запускаем DeepSeek-V4 (1.6T) на «калькуляторе»: SVD-трансмутация, Identity Theft и гаражный MLOps

Что делать, если у вас есть 1.6-триллионная модель и видеокарта из прошлого десятилетия? Пока корпорации покупают H100 фурами, мы используем SVD-транс…

DeepSeek-V4-ProMoESVDНизкоранговое разложениеОптимизация нейросетейMLOpsKaggleNVIDIA T4Сжатие моделейGhetto AI
Habr
RU

Почему ИИ-пилоты не доходят до реального производства и как это исправить архитектурой

8–9 апреля на конференции Data Fusion ВТБ публично признал: их ИИ-проекты массово застревают между пилотом и промышленной эксплуатацией. Это не жалоба…

низкоэнтропийная автоматизацияИИ в производствеMLOpsLoRAfine-tuninghuman-in-the-loopcompounding entropyлокальные LLMцифровой двойник
Habr
RU

Как мы провели лоботомию 744-миллиардной нейросети GLM-5.1, чтобы запустить её на 16 ГБ VRAM

У нас не было фермы. У нас была бесплатная виртуальная машина на Kaggle с одной старушкой NVIDIA T4 на 16 ГБ VRAM. И у нас была концепция экстремально…

LLMMLOpsHugging FacePyTorchGLM-5.1Kaggleнейросетиоптимизациятензорыискусственный интеллект
Habr