RU

Железный дайджест за май: тесты B300, GPU от Alibaba и PCIe 8.0

Изучаем самые интересные новинки серверного железа за май, делимся техническими деталями и оцениваем перспективы свежих решений. В фокусе внимания — р…

selectelit-компанииit-инфраструктуражелезо и технологиинакопителисерверыgpu
Habr
RU

Три фикса, четыре ошибки, один файл

# Как мы четыре раза неправильно диагностировали зависание на джобе 281 339 Несколько месяцев назад я писал, [как мы четыре раза неправильно чинили ме…

rustwgpugpuinstanced renderingоптимизация производительностирендерингcomputer graphicsedavulkan api
Habr
RU

Cколько железа нужно ИИ-агенту? Как мы считали ресурсы для on-premise LLM и почему калькуляторы ошиблись в 5 раз

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Один из самых частых вопросов от бизнеса: «Сколько и какого железа нужно, чтобы разверну…

llmaigpuon-premiseagentperformancetpsttfttokens
Habr
RU

Как мы четыре раза неправильно чинили мерцание при рендеринге 4,4 миллиона полигонов на wgpu

Уже год мы небольшой командой пишем на Rust + wgpu редактор топологий интегральных схем — что-то вроде KLayout, только с прицелом на российский рынок.…

rustwgpugpuinstanced renderingоптимизация производительностирендерингcomputer graphicsedavulkan api
Habr
RU

Тестируем выделенный L40S и vGPU на 16 ГБ по производительности (llama.cpp, ComfyUI)

Сегодня в интернете какой только нет информации об искусственном интеллекте или его применении в разных сферах. Можно сказать, что он уже плотно вошел…

gpuvgpullmllama.cppнейросетиcomfyuivdsпроизводительностьтестированиеfirstvds
Habr