AI & ML — Tech News

RU

Обзор GPU-облаков в России для обычного пользователя в 2026

Сейчас я учусь на 2 курсе магистратуры МИФИ по ML ( это моё второе высшее образование, по 1 специальности я психолог и TechHR с опытом 17+ лет), и пиш…

GPU genai ml data engineering 3D Avatars LLM

RU

Кто ворует ваш GPU: атаки на открытые LLM-эндпоинты (Ollama, llama.cpp) — и при чём тут кража облачных ключей

Коротко тезис: открытый Ollama — это бесплатный GPU для атакующего , и охота за таким compute давно поставлена на поток. Но за май наша сеть ханипотов…

LLM Ollama llama.cpp honeypot SSRF IMDS информационная безопасность GPU n8n

EN

Presentation: Realtime and Batch Processing of GPU Workloads

Joseph Stein discusses engineering an enterprise AI-as-a-Service platform within a private cloud data center. He explains how to maximize underutilize…

Case Study GPU Scalability Cloud QCon San Francisco 2025 Transcripts DevOps presentation

RU

Подборка облачных GPU для ML 2026

Разбираем облачные сервисы с GPU на 2026 год. Сравнение инфраструктуры, доступные видеокарты (от T4 до H200) и реальные цены на инстансы для ML и инфе…

DevOps Облачные технологии GPU Инфраструктура Железо Статьи

RU

Архитектура AI-сервисов: почему монолит убивает latency и GPU

Ваш AI‑чат или автокомплит тормозит при 50 запросах в секунду? Монолит убивает GPU и латенси? В этом туториале — реальная арх…

AI-сервисы LLM инференс high-load latency GPU vLLM SGLang continuous batching admission control

RU

Калькулятор VRAM для локальных LLM: Какие модели ИИ запустятся у вас на компьютере?

Когда я начал ковыряться с локальными LLM, главная боль была не в установке моделей, а в понимании, что вообще влезет в моё железо. Документация Huggi…

LLM VRAM llama.cpp локальные модели квантование KV cache GQA бенчмарк GPU

EN

The newest AI boom pitch: Host a mini data center at your home

The plan aims to speed up AI compute deployment while compensating residents.

AI ai data centers AI GPU data centers GPU NVIDIA

RU

От GPU к платформе: как Selectel строит AI-инфраструктуру для бизнеса

Selectel анонсировал новый AI-сервер и публичный каталог LLM на конференции «MLечный путь». Разбираемся, как сбалансированная инфраструктура и партнер…

Конференции Искусственный интеллект DevOps Облачные технологии Аналитика GPU Статьи

RU

Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN5…

Intel SambaNova Nvidia Xeon 6 RDU SN50 GPU LLM инференс ИИ-инфраструктура

EN

Google New TPU Generation is Specifically Designed for Agents and SOTA Model Training

Google has unvelied a new generation of Tensor Processing Units (TPUs), featuring two specialized chips designed to accelerate model training and agen…

Agents GPU Large language models Google AI, ML & Data Engineering Development news

RU

Мы уткнулись в потолок. Почему видеокарты перестали быстро расти — и что с этим делать

H100 стоит $30 000 и потребляет 700 Вт. RTX 5090 — $2 000 (де-факто больше) и 575 Вт. Прирост производительности между поколениями сжался с 80% до 15–…

GPU NVIDIA закон Мура HBM AI инфраструктура чиплеты архитектура GPU LLM H100 Blackwell

RU

Токенная разработка: почему я плачу $200 в месяц, а не $800 за устаревшее железо

$800 на видеокарту которая устареет через год или $200/мес с доступом к frontier-моделям? Вот мои цифры Читать далее

LLM API токены GPU локальные модели Ollama tokenomics AI разработка стоимость разработки

EN

Cloudflare Builds High-Performance Infrastructure for Running LLMs

Cloudflare has recently announced new infrastructure designed to run large AI language models across its global network. As these models rely on costl…

Optimization Big Data Infrastructure AI Architecture Cloudflare Large language models GPU Development AI, ML & Data Engineering news

RU

Сравнение гибридных языковых моделей класса 9B для промышленного инференса

В материале сравниваются три открытые гибридные модели класса 9B (NVIDIA Nemotron‑Nano‑9B‑v2, Bamba‑9B‑v2, Qwen3.5‑9B) с референсной плотной Llama 3.1…

Производительность Работа Боты IBM NVIDIA Маркетинг QA Аналитика аналитик GPU Статьи