RU

Zero Trust для AI-агентов: как безопасно давать LLM доступ к инструментам, данным и действиям

AI-агенты уже вышли за пределы чат-ботов. Они читают документы, вызывают API, анализируют логи, создают тикеты, готовят правки в коде и выполняют мног…

aillmai agentanthropicopenaiclaudecodexzero trustprompt injection
Habr
RU

Бомба замедленного действия взорвалась: эпоха ИИ «бери сколько унесёшь» закончилась

На прошлой неделе на State of Brand вышел материал по следам статьи, опубликованной всего несколькими днями ранее. Тогда авторы утверждали: любая ИИ-п…

искусственный интеллектapicloudopenaianthropiccopilotинформационная безопасностьии-агентыии-модельуправление
Habr
RU

AI обнулил benchmark и пытался шантажировать инженера. И почему это решаемо

Топовые AI-модели с 95% на SWE-bench показывают 0% и 3% на ProgramBench бенчмарке, где задачи специально не пересекаются с обучающей выборкой. Не «упа…

AI-агентыllmanthropicClaudeProgramBenchAgentic misalignmentБенчмарки LLMAI в productionБезопасность AIReliability
Habr
RU

Маркетинговый сайт без дизайнера: 5 практик с Open Design и Claude Code

Я попробовал собрать маркетинговый сайт через Claude Design - и быстро упёрся в лимиты токенов и непрозрачность облачного тула. Перешёл на Open Design…

claude codeclaudeanthropicopen designai-агентыдизайн-системаdesign-as-codenext.jstailwind cssмаркетинговый сайт
Habr
RU

TokenToad: как я сделал Chrome-расширение, чтобы перестать удивляться счетам за AI

Расходы на AI API копятся незаметно: сессия Claude Code тут, batch к GPT-5 там — и к концу месяца биллинг удивляет. Собрал бесплатное Chrome-расширени…

chrome extensionai apiopenaianthropicclaudeрасходы apiтокеныбиллингpreactvite
Habr
RU

Claude вспомнил то, чего я ему не говорил. Полез разбираться. У него пять механизмов памяти

Открыл новую сессию Claude Code и спросил про клиента, которого не упоминал в этой сессии. Получил ответ с именем сервера, сроками и папкой задач, зна…

claude codeanthropicai-агентыllmclaude.md
Habr