Tech News — Latest News

All EN RU

Железный дайджест за май: тесты B300, GPU от Alibaba и PCIe 8.0

Изучаем самые интересные новинки серверного железа за май, делимся техническими деталями и оцениваем перспективы свежих решений. В фокусе внимания — р…

selectel it-компании it-инфраструктура железо и технологии накопители серверы gpu

Три фикса, четыре ошибки, один файл

# Как мы четыре раза неправильно диагностировали зависание на джобе 281 339 Несколько месяцев назад я писал, [как мы четыре раза неправильно чинили ме…

rust wgpu gpu instanced rendering оптимизация производительности рендеринг computer graphics eda vulkan api

Почему тебе нужно стать нейро-панком прямо сейчас

Небольшое эссе на тему того, почему сообществу разработчиков надо по максимуму вкладываться в LLM, которые будут свободны от корпорации и государств. …

open-source llm gpu

Cколько железа нужно ИИ-агенту? Как мы считали ресурсы для on-premise LLM и почему калькуляторы ошиблись в 5 раз

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Один из самых частых вопросов от бизнеса: «Сколько и какого железа нужно, чтобы разверну…

llm ai gpu on-premise agent performance tps ttft tokens

[Перевод] GPU-автоскейлинг на Kubernetes с KEDA: создание внешнего скейлера

Если вы запускаете GPU-нагрузки (графические ускорители) на Kubernetes — vLLM, Triton, обучающие задачи или более новые стеки агентного инференса, — в…

kubernetes keda gpu autoscaling external scaler nvml vllm triton helm greenops

GPU без магии: что важно знать инженеру перед выбором ускорителя

Если вы технарь и работаете с инфраструктурой, то регулярно слышите слова GPU, HBM, NVLink, Tensor Cores, FP8, PCIe и тому подобное. Термины вроде зна…

gpu gpu-ускорители gpu computing gpupassthrough выделенные серверы нейросети ml дата-центры selectel сетевые технологии

Украсть пиксели и не задохнуться в сетевом канале. Протокол SPICE в современном графическом стеке, часть 3

Мы продолжаем увлекательное путешествие по миру удалённого доступа . Это третья часть цикла про протокол доставки рабочего стола SPICE и то, как он вы…

spice windows winapi directx video streaming real-time screencast remote desktop gpu

Как мы четыре раза неправильно чинили мерцание при рендеринге 4,4 миллиона полигонов на wgpu

Уже год мы небольшой командой пишем на Rust + wgpu редактор топологий интегральных схем — что-то вроде KLayout, только с прицелом на российский рынок.…

rust wgpu gpu instanced rendering оптимизация производительности рендеринг computer graphics eda vulkan api

Тестируем выделенный L40S и vGPU на 16 ГБ по производительности (llama.cpp, ComfyUI)

Сегодня в интернете какой только нет информации об искусственном интеллекте или его применении в разных сферах. Можно сказать, что он уже плотно вошел…

gpu vgpu llm llama.cpp нейросети comfyui vds производительность тестирование firstvds

64 прямоугольника хватит всем

«Студент-программист реализовал на FPGA полноценную игровую приставку с нуля за полтора месяца, не имея опыта цифрового проектирования». Для меня само…

fpga игровая консоль плис Брус-16 микроархитектура аппаратная реализация cpu gpu verilog tang nano 9k

Из чего состоит GPU-кластер: обзор серверов с L40S, A16 и AMD EPYC на платформе mClouds

Привет, Хабр! Мы облачный провайдер mClouds, и у нас работает GPU-платформа с видеокартами NVIDIA L40S , A16 и другими. Задействуется для задач AI-раз…

сервер цод nvidia gpu видеокарты dell amd epyc облачный сервер виртуализация работа с данными

[Перевод] Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

С ростом сложности рабочих нагрузок инференса больших языковых моделей (LLM) единый монолитный процесс обслуживания упирается в свои пределы. У префил…

vk cloud llm kubernetes inference gpu nvidia дезагрегированный инференс оркестрация автомасштабирование планирование подов

[Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 3. Траснформеры

Это продолжение цикла статей о масштабировании тренировки и инференса LLM. Предыдущая статья А теперь перейдем к чему-то более практическому, а именно…

ai ml gpu gpu вычисления трансформеры анализ и проектирование систем

DRAйверы для GPU: как Kubernetes научился выделять устройства через стандартный API

Device Plugin в Kubernetes сводит GPU к счётчику на узле: планировщик видит только количество устройств, но не их профиль, объём памяти или режим шари…

gpu kubernetes deckhouse kubernetes platform ai ml dra machine learning

20 лет видеокарт в цифрах: как росли FLOPS и TDP и кто вёл в дуэли NVIDIA vs AMD (+ открытый датасет на 13 500 GPU)

Мы свели в одну базу характеристики 13 566 видеокарт — от GeForce 256 (1999) до Blackwell и MI355X (2025) — и посмотрели, как за 20 лет менялась индус…

gpu nvidia amd performance

[Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 2. Шардинг

Это продолжение цикла статей о масштабировании тренировки и инференса LLM. Предыдущая глава находится по этой ссылке . Итак, с основами разобрались, д…

ai ml gpu gpu вычисления анализ и проектирование систем

Компьютерное зрение: что получается, когда у вас не идеальная лаборатория, а дождь, снег и подвижный манипулятор

В проектах с компьютерным зрением есть неприятная правда: почти все выглядит убедительно, пока не сталкивается с реальной площадкой. На слайдах обычно…

искусственный интеллект компьютерное зрение gpu облачные вычисления инфраструктура бизнеса

Как развернуть Mistral 7B на GPU-сервере через vLLM

Если бюджет и ресурсы ограничены, а развернуть self-hosted LLM нужно, присмотритесь к такой связке: Mistral-7B-Instruct-v0.3 + виртуальная машина с RT…

ai mistral 7b vllm инференс llm gpu облачный сервер api nvidia rtx selectel

Великий парадокс VRAM: почему мы платим миллионы за память, чтобы делать всё, лишь бы ей не пользоваться

Главный страх любого инженера ошибка  CUDA Out of Memory . Мы выстраиваемся в очереди за H200 на 140 ГБ. Но как только мы спускаемся с уровня Pyt…

нейронные сети gpu nvidia vram трансформеры

Тестируем NVIDIA HGX B300 — инференс-сервер с 8 GPU и 2,3 ТБ VRAM на DeepSeek, Qwen и MiniMax

Итак, вы внедрили ИИ в свой сервис и решили ехать в продакшен, где у вас много пользователей. Закономерно возникает вопрос — а на чем запустить инфере…

selectel инференс llm gpu nvidia dgx hgx b300

Препарируем графическую подсистему Windows. Протокол SPICE в современном графическом стеке, часть 2

Мы продолжаем увлекательное путешествие по миру удалённого доступа . В предыдущей части заглядывали под капот протокола доставки рабочего стола SPICE …

spice windows winapi qxl directx gpu x11

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 2 — тестирование в бенчмарках и играх

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 2 — тестирование в бенчмарках и играх Читать далее

nvidia tesla v100 nvidia tesla nvidia gpu gpu-ускорители видеокарты пк игры железо и технологии железо для игр железо для нейросетей

SpaceX собирается выпускать собственные GPU

Нет, не для того, чтобы вытеснить с рынка NVIDIA, хотя в перспективе и такое возможно. Как бы то ни было, компания SpaceX неожиданно раскрыла планы по…

selectel spacex gpu nvidia

Мы можем решать задачи компьютерного зрения без видеокарт. И вам советуем

Когда-нибудь спрашивали себя, какие технологии должны быть в башке терминатора из фильмов Джеймса Кэмерона, чтобы он (терминатор) мог обрабатывать дан…

компьютерное зрение tape индексирование данных индексирование видео энергоэффективность gpu алгоритмы обработки видео алгоритмы обработки изображений