AI & ML — Tech News

All EN RU

Что такое контекстное окно и почему модели забывают

Ты час разговариваешь с ChatGPT. Даёшь контекст, объясняешь задачу, уточняешь детали. А потом модель вдруг начинает противоречить тому, что говорила р…

контекстное окно LLM токены память ИИ ChatGPT языковые модели lost in the middle RAG GPT контекст

П維чему нейро考ети дел思ют так

Если вы хоть раз тестировали локальную модель (да и нелокальную тоже) и замечали, как она посреди нормального текста вдруг выдает иероглиф, то заголов…

нейросети машинное обучение эмбеддинги grokking гроккинг llm векторное пространство mechanistic interpretability токены selectel

Свой биллинг для ИИ-агента: микрокредиты и контроль расходов

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Сегодня разбираем, как написать биллинг для продакшн ИИ-агента. Когда ваш ИИ-бот начинае…

LLM-агенты биллинг LangChain ContextVar ии-агенты токены трейсинг

[Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать

FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы…

MCP FastMCP ИИ-агенты LLM Python API безопасность обработка ошибок токены проектирование инструментов

Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах

32 tools в промпте - дешевле, чем 7. Да, да - если вы строите агентов, это не опечатка. Это следствие того, как работает prefix cache в агентском цикл…

llm-агент prefix caching токены ai-агенты ai prompt caching prompt-engineering context-engineering

TokenToad: как я сделал Chrome-расширение, чтобы перестать удивляться счетам за AI

Расходы на AI API копятся незаметно: сессия Claude Code тут, batch к GPT-5 там — и к концу месяца биллинг удивляет. Собрал бесплатное Chrome-расширени…

chrome extension ai api openai anthropic claude расходы api токены биллинг preact vite

Токенная разработка: почему я плачу $200 в месяц, а не $800 за устаревшее железо

$800 на видеокарту которая устареет через год или $200/мес с доступом к frontier-моделям? Вот мои цифры Читать далее

LLM API токены GPU локальные модели Ollama tokenomics AI разработка стоимость разработки