Tech News — Latest News

All topics - игры AI Gear News Tech agents ai api architecture automation beginners career claude devchallenge devops javascript llm machinelearning mcp opensource performance productivity programming python react security showdev tutorial typescript webdev

All EN RU

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Всем привет! Продолжаю тему локальных LLM. В предыдущей статье  мы сравнивали железо для инференса — Nvidia DGX Spark, Mac Studio M3 Ultra и Stri…

claude-code strix halo ии-агенты программирование antropic qwen3.6 локальный ии llama.cpp vibecoding

Capacitor: от веба к мобильным приложениям. Часть 4. Интегрируем локальный LLM в проект

В этой уже 5 по счету статье мы поговорим про актуальность локального AI в мобильных приложениях а также займемся интеграцией плагина для локальных LL…

capacitor мобильные приложения гибридные приложения typescript javascript ios android ai llm локальный ии

DGX Spark на 256K контексте: тестирую конфигурации vLLM, реальные замеры и почему NVFP4 в mainline сломан

NVIDIA продаёт спарку с лозунгом «один петафлоп на FP4». Я купил коробку, поставил vLLM, запустил инференс и получил 40 токенов в …

vllm dgx spark gb10 blackwell nvfp4 llm инференс локальный ии

Кириллица в LLM: почему русский язык в нейросетях стоит дороже и работает медленнее

Когда вы пишете запрос в ChatGPT или другую нейросеть, она не работает с буквами или словами — она режет ваш текст на&nb…

llm токенизация нейросети локальный ии self-hosted кириллица qwen gigachat llama yandexgpt