AI & ML — Tech News

EN

Blackwell MLPerf Dominance, Intel Nova Lake Compute Runtime, & Weston 16 Vulkan HDR

Blackwell MLPerf Dominance, Intel Nova Lake Compute Runtime, & Weston 16 Vulkan HDR Today's Highlights NVIDIA's Blackwell architecture showcased u…

gpu nvidia hardware

EN

CUDA for AMD Lemonade, Intel Arc Pro Linux Gains, XPU Manager 2.0

CUDA for AMD Lemonade, Intel Arc Pro Linux Gains, XPU Manager 2.0 Today's Highlights Today's top GPU news highlights include AMD's Lemonade SDK gainin…

gpu nvidia hardware

EN

G4 Fractional VMs are now available on Google Cloud!

In 2025 Google Cloud added G4 , powered by NVIDIA's RTX PRO 6000 Blackwell Server Edition GPUs to their offering, allowing them to offer hardware not …

gpu googlecloud nvidia infrastructure

EN

Vortex 3.0 RISC-V GPGPU, Pragtical SDL GPU Backend, NVIDIA RTX Spark Launch

Vortex 3.0 RISC-V GPGPU, Pragtical SDL GPU Backend, NVIDIA RTX Spark Launch Today's Highlights Today's top stories highlight significant advancements …

gpu nvidia hardware

EN

Linux 7.1 Boosts Intel Arc, Flatpak Integrates ROCm, Vintage AMD Driver Refined

Linux 7.1 Boosts Intel Arc, Flatpak Integrates ROCm, Vintage AMD Driver Refined Today's Highlights Recent developments enhance GPU performance and acc…

gpu nvidia hardware

EN

NVIDIA RTX Spark: What the Backlash Gets Wrong About AI on Your Desktop [2026]

NVIDIA RTX Spark launched on June 1, 2026, and within 72 hours the internet had already decided it was either the death of Apple Silicon or the next W…

nvidia rtxspark localai ondeviceai

RU

NVIDIA выбрала Unitree: разбор H2 Plus и платформы Isaac GR00T

1 июня 2026 года на Computex в Тайпее Дженсен Хуанг объявил NVIDIA Isaac GR00T Reference Humanoid Robot. На сцене он сказал буквально: «Шесть футов, 1…

nvidia unitree isaac gr00t робототехника гуманоидные роботы physical ai

RU

Из чего состоит GPU-кластер: обзор серверов с L40S, A16 и AMD EPYC на платформе mClouds

Привет, Хабр! Мы облачный провайдер mClouds, и у нас работает GPU-платформа с видеокартами NVIDIA L40S , A16 и другими. Задействуется для задач AI-раз…

сервер цод nvidia gpu видеокарты dell amd epyc облачный сервер виртуализация работа с данными

EN

Nvidia chases $200B CPU market with AI agent PCs from Microsoft, Dell, and HP

If Nvidia has cracked a way to bring AI agents easily, safely and usefully to the masses, it could — and should — be big.

AI Hardware TC AI PC cpus Microsoft nvidia

EN

Notes on Serving LLMs with TensorRT-LLM and Triton

Notes on Serving LLMs with TensorRT-LLM and Triton 2026-05-31 · LLM serving / NVIDIA stack These are working notes on taking an open-weights LLM from …

llm nvidia machinelearning performance

EN

AMD Linux 7.2 Graphics & SteamOS VRR Drivers, NVIDIA Vera CPU Benchmarks

AMD Linux 7.2 Graphics & SteamOS VRR Drivers, NVIDIA Vera CPU Benchmarks Today's Highlights This week's top stories feature significant driver upd…

gpu nvidia hardware

RU

Как я собрал LLM-печку на 4 GPU, и на что она способна

Всем привет, недавно я собрал и сейчас активно использую ПК для локального запуска хоть сколько-то серьезных LLM, и захотелось поделиться этим опытом …

железо llm opencode агент сборка nvidia multi-gpu workstation homelab homeserver ai

EN

After Nvidia’s $20B not-acqui-hire, AI chip startup Groq reportedly raising $650M

Chipmaker Groq is looking to raise $650 million in internal funding as it pivots from hardware to focus more on AI inference, the process of refining …

AI Startups Venture AI chips groq In Brief nvidia

EN

After Nvidia’s $20B not-aqui-hire, AI chip startup Groq reportedly raising $650M

Chipmaker Groq is looking to raise $650 million in internal funding as it pivots from hardware to focus more on AI inference, the process of refining …

AI Startups Venture nvidia

EN

CUDA 13.3 Lands, AI Writes Blackwell Kernels, & FP4 VRAM Optimization for LLMs

CUDA 13.3 Lands, AI Writes Blackwell Kernels, & FP4 VRAM Optimization for LLMs Today's Highlights NVIDIA releases CUDA Toolkit 13.3, bringing new …

gpu nvidia hardware

RU

[Перевод] Дезагрегированный инференс LLM в Kubernetes: префилл, декодирование и планирование подов

С ростом сложности рабочих нагрузок инференса больших языковых моделей (LLM) единый монолитный процесс обслуживания упирается в свои пределы. У префил…

vk cloud llm kubernetes inference gpu nvidia дезагрегированный инференс оркестрация автомасштабирование планирование подов

RU

Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест

Пока инфо-бизнесмены продают очередные курсы по промпт-инжинирингу, в индустрии пересобирают саму архитектуру ИИ-систем. Главные вызовы сегодня л…

selectel LLM ai ml искусственный интеллект дайджест железо и софт nvidia amd sambanova

EN

FlashAttention CUDA Kernel, Strix Halo MOE Boost, & NVIDIA DLSS 4.5 Driver Update

FlashAttention CUDA Kernel, Strix Halo MOE Boost, & NVIDIA DLSS 4.5 Driver Update Today's Highlights This week, discover a deep dive into FlashAtt…

gpu nvidia hardware

EN

Tesla P40 in a Homelab: 24GB of Inference on a Budget

The Tesla P40 is a seductive piece of hardware: 24GB of VRAM for a fraction of the cost of a modern RTX card. But after three weeks of fighting with i…

teslap40 nvidia proxmox ollama

RU

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 - Запуск локальных моделей ИИ Читать далее

nvidia nvidia tesla v100 видеокарты для нейросетей видеокарты нейросети llm-модели ии ии модели искуственный интеллект

EN

RTX 5080 Undervolt Benchmarks, CGO-Free CUDA API Binding, & AMD GPU Compatibility Fix

RTX 5080 Undervolt Benchmarks, CGO-Free CUDA API Binding, & AMD GPU Compatibility Fix Today's Highlights Today's top GPU news features detailed un…

gpu nvidia hardware

EN

Diffusion Language Models: How NVIDIA Nemotron-Labs Diffusion Shatters the Autoregressive Speed Ceiling

Meta Description: Diffusion language models (DLMs) are rewriting LLM inference. Dive deep into NVIDIA's Nemotron-Labs Diffusion — how block-wise atten…

ai llm nvidia machinelearning

EN

From Manual RAG to Real Retrieval — Embedding-Based RAG with NVIDIA NIM

In Part 1 , we built a USC campus assistant by pasting a five-line knowledge base directly into the prompt. That works when "the data" fits in your he…

nvidia ai python tutorial

EN

RTX 5090 Cooling, BeeLlama VRAM Opts, Resizable BAR Performance Gains

RTX 5090 Cooling, BeeLlama VRAM Opts, Resizable BAR Performance Gains Today's Highlights NVIDIA's upcoming RTX 5090 cooling solutions are detailed, wh…

gpu nvidia hardware

EN

Jensen Huang says he’s found a ‘brand new’ $200B market for Nvidia

The next big thing for Nvidia will be CPUs for AI agents, $200 billion worth, CEO Jensen Huang predicts.

AI Enterprise TC cpus nvidia

EN

Nvidia posts another record quarter, reveals $43 billion of holdings in startups

Nvidia announced another record revenue figure after market close on Wednesday, but forecasted that revenue growth would slow in the following quarter…

AI earnings nvidia

EN

Who Wins the Future: Chips vs Frontier LLMs (Monolith 2026)

The intelligence race has two fronts: silicon and software. Understanding which one is actually the bottleneck might be the most important question in…

ai cerebras nvidia llm

EN

Intel Xe3P Leaks 160GB LPDDR5X; FlashAttention-2 in CuTe & Custom CUDA GPT-2 Engine

Intel Xe3P Leaks 160GB LPDDR5X; FlashAttention-2 in CuTe & Custom CUDA GPT-2 Engine Today's Highlights Intel's Xe3P "Crescent Island" GPU leaks re…

gpu nvidia hardware

EN

GPU Bottleneck Analyzer, NVIDIA Rubin VRAM Demands, and Qwen VRAM Optimization

GPU Bottleneck Analyzer, NVIDIA Rubin VRAM Demands, and Qwen VRAM Optimization Today's Highlights This week's top GPU news features a new open-source …

gpu nvidia hardware

EN

Im a Nvidia Developer Champion!

I’m excited to share that I’ve been selected as an NVIDIA Developer Champion. Over the past few years, a large part of my work has revolved around dev…

nvidia nvidiadeveloper developers developer