RU

Железный дайджест за май: тесты B300, GPU от Alibaba и PCIe 8.0

Изучаем самые интересные новинки серверного железа за май, делимся техническими деталями и оцениваем перспективы свежих решений. В фокусе внимания — р…

selectelit-компанииit-инфраструктуражелезо и технологиинакопителисерверыgpu
Habr
RU

Три фикса, четыре ошибки, один файл

# Как мы четыре раза неправильно диагностировали зависание на джобе 281 339 Несколько месяцев назад я писал, [как мы четыре раза неправильно чинили ме…

rustwgpugpuinstanced renderingоптимизация производительностирендерингcomputer graphicsedavulkan api
Habr
RU

Cколько железа нужно ИИ-агенту? Как мы считали ресурсы для on-premise LLM и почему калькуляторы ошиблись в 5 раз

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Один из самых частых вопросов от бизнеса: «Сколько и какого железа нужно, чтобы разверну…

llmaigpuon-premiseagentperformancetpsttfttokens
Habr
RU

GPU без магии: что важно знать инженеру перед выбором ускорителя

Если вы технарь и работаете с инфраструктурой, то регулярно слышите слова GPU, HBM, NVLink, Tensor Cores, FP8, PCIe и тому подобное. Термины вроде зна…

gpugpu-ускорителиgpu computinggpupassthroughвыделенные серверынейросетиmlдата-центрыselectelсетевые технологии
Habr
RU

Украсть пиксели и не задохнуться в сетевом канале. Протокол SPICE в современном графическом стеке, часть 3

Мы продолжаем увлекательное путешествие по миру удалённого доступа . Это третья часть цикла про протокол доставки рабочего стола SPICE и то, как он вы…

spicewindowswinapidirectxvideo streamingreal-timescreencastremote desktopgpu
Habr
RU

Как мы четыре раза неправильно чинили мерцание при рендеринге 4,4 миллиона полигонов на wgpu

Уже год мы небольшой командой пишем на Rust + wgpu редактор топологий интегральных схем — что-то вроде KLayout, только с прицелом на российский рынок.…

rustwgpugpuinstanced renderingоптимизация производительностирендерингcomputer graphicsedavulkan api
Habr
RU

Тестируем выделенный L40S и vGPU на 16 ГБ по производительности (llama.cpp, ComfyUI)

Сегодня в интернете какой только нет информации об искусственном интеллекте или его применении в разных сферах. Можно сказать, что он уже плотно вошел…

gpuvgpullmllama.cppнейросетиcomfyuivdsпроизводительностьтестированиеfirstvds
Habr
RU

64 прямоугольника хватит всем

«Студент-программист реализовал на FPGA полноценную игровую приставку с нуля за полтора месяца, не имея опыта цифрового проектирования». Для меня само…

fpgaигровая консольплисБрус-16микроархитектурааппаратная реализацияcpugpuverilogtang nano 9k
Habr
RU

Из чего состоит GPU-кластер: обзор серверов с L40S, A16 и AMD EPYC на платформе mClouds

Привет, Хабр! Мы облачный провайдер mClouds, и у нас работает GPU-платформа с видеокартами NVIDIA L40S , A16 и другими. Задействуется для задач AI-раз…

серверцодnvidiagpuвидеокартыdellamd epycоблачный сервервиртуализацияработа с данными
Habr
RU

[Перевод] Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

С ростом сложности рабочих нагрузок инференса больших языковых моделей (LLM) единый монолитный процесс обслуживания упирается в свои пределы. У префил…

vk cloudllmkubernetesinferencegpunvidiaдезагрегированный инференсоркестрацияавтомасштабированиепланирование подов
Habr
RU

[Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 3. Траснформеры

Это продолжение цикла статей о масштабировании тренировки и инференса LLM. Предыдущая статья А теперь перейдем к чему-то более практическому, а именно…

aimlgpugpu вычислениятрансформерыанализ и проектирование систем
Habr
RU

[Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 2. Шардинг

Это продолжение цикла статей о масштабировании тренировки и инференса LLM. Предыдущая глава находится по этой ссылке . Итак, с основами разобрались, д…

aimlgpugpu вычисленияанализ и проектирование систем
Habr
RU

Компьютерное зрение: что получается, когда у вас не идеальная лаборатория, а дождь, снег и подвижный манипулятор

В проектах с компьютерным зрением есть неприятная правда: почти все выглядит убедительно, пока не сталкивается с реальной площадкой. На слайдах обычно…

искусственный интеллекткомпьютерное зрениеgpuоблачные вычисленияинфраструктура бизнеса
Habr
RU

Великий парадокс VRAM: почему мы платим миллионы за память, чтобы делать всё, лишь бы ей не пользоваться

Главный страх любого инженера ошибка  CUDA Out of Memory . Мы выстраиваемся в очереди за H200 на 140 ГБ. Но как только мы спускаемся с уровня Pyt…

нейронные сетиgpunvidiavramтрансформеры
Habr
RU

Препарируем графическую подсистему Windows. Протокол SPICE в современном графическом стеке, часть 2

Мы продолжаем увлекательное путешествие по миру удалённого доступа . В предыдущей части заглядывали под капот протокола доставки рабочего стола SPICE …

spicewindowswinapiqxldirectxgpux11
Habr
RU

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 2 — тестирование в бенчмарках и играх

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 2 — тестирование в бенчмарках и играх Читать далее

nvidia tesla v100nvidia teslanvidiagpugpu-ускорителивидеокартыпк игрыжелезо и технологиижелезо для игржелезо для нейросетей
Habr
RU

Мы можем решать задачи компьютерного зрения без видеокарт. И вам советуем

Когда-нибудь спрашивали себя, какие технологии должны быть в башке терминатора из фильмов Джеймса Кэмерона, чтобы он (терминатор) мог обрабатывать дан…

компьютерное зрениеtapeиндексирование данныхиндексирование видеоэнергоэффективностьgpuалгоритмы обработки видеоалгоритмы обработки изображений