AI & ML — Tech News

All EN RU

Cколько железа нужно ИИ-агенту? Как мы считали ресурсы для on-premise LLM и почему калькуляторы ошиблись в 5 раз

На связи Сергей Смирнов, AI-инженер и основатель LLMStart.ru. Один из самых частых вопросов от бизнеса: «Сколько и какого железа нужно, чтобы разверну…

llm ai gpu on-premise agent performance tps ttft tokens

Токен-оптимизация агентов: на что уходит контекстное окно MCP

Чем больше задач берёт на себя агент, тем чаще он упирается не в качество модели, а в контекстное окно: туда нужно уместить инструкции, историю диалог…

mcp claude anthropic llm ai-агенты opensource context-engineering ai claude-code tokens

Amazon employees are "tokenmaxxing" due to pressure to use AI tools

Workers are using an internal AI tool to automate non-essential tasks.

AI Amazon syndication tokens

Part 8 — Token-by-Token: Why AI Generates Text One Word at a Time (And Why It Costs 4x More)

THE HIDDEN TAX OF AI Output Is King INPUT COST $2.50 Per 1M Tokens (GPT-4o) 4x MORE OUTPUT COST $10.00 Per 1M Tokens (GPT-4o) The reason? The AI write…

tokens llm costoptimization aifundamentals