RU

Работает ли Caveman? Тестируем модный скилл для экономии токенов

Недавно копайлот перешёл на новую тарификацию, из-за которой я упёрся в месячные лимиты буквально за первую рабочую неделю. В рабочих чатиках все стал…

cavemanэкономия токеновLLMClaudeAI-агентыGitHub starsнакрутка звёздCopilotбенчмаркскам
Habr
RU

Гайды Anthropic для Fable 5 и Opus 4.8 советуют противоположное, у OpenAI — третий путь. Что менять в промптах

Когда вышел Claude Fable 5, я его подключил — и он мне не понравился. Модель объективно сильнее Opus 4.8, а работать с ней было хуже: в одном ране аге…

prompt engineeringClaudeGPTLLMAnthropicOpenAIAI-агенты
Habr
RU

Agent Team в Claude Code: когда одного агента в терминале уже не хватает

Claude Code умеет запускать не одного агента, а целую команду: одна сессия становится координатором (team lead), остальные — независимые тиммейты со с…

Claude CodeAgent TeamAI-агентысубагентыLLMAnthropicавтоматизация разработки
Habr
RU

[Перевод] Каково это — работать с Fable 5 (Mythos)

У меня был ранний доступ к первой публично доступной модели класса Mythos — Claude 5 Fable. Большинство обсуждений вокруг Mythos сосредоточено на кибе…

Claude MythosClaude Fableбольшие языковые моделиAI-агентымультиагентные системыавтономные AIClaude Codeстоимость inferenceбудущее разработкичеловек в контуре
Habr
RU

Сотня параллельных субагентов бесполезна, если они врут. Главная цифра Opus 4.8 — не бенчмарк, а честность

28 мая Anthropic выпустила Opus 4.8 — через 41 день после 4.7, каденс релизов сжался с трёх месяцев до шести недель. Цена та же, $5/$25 за миллион ток…

Claudeclaude codeOpus 4.8AI-агентыоркестрация-агентовLLMAnthropicDynamic Workflows
Habr
RU

AI обнулил benchmark и пытался шантажировать инженера. И почему это решаемо

Топовые AI-модели с 95% на SWE-bench показывают 0% и 3% на ProgramBench бенчмарке, где задачи специально не пересекаются с обучающей выборкой. Не «упа…

AI-агентыllmanthropicClaudeProgramBenchAgentic misalignmentБенчмарки LLMAI в productionБезопасность AIReliability
Habr
RU

AGENTS.md создавали, чтобы помогать агентам. Я использую его, чтобы их вычислять

Вместе с растущей AI-индустрией приходят и её побочки. Я мейнтейнер библиотеки react-native-tdlib и довольно быстро заметил: все больше PR выглядят ка…

AGENTS.mdAI-агентыopen sourcepull requestспамReact NativeGitHub Actionscode reviewмейнтейнерClaude Code
Habr
RU

Дирижёр вместо конвейера: как AI ломает классический pipeline разработки

Мы все привыкли строить производство софта как конвейер. Продакт берёт идею, отдаёт аналитику. Аналитик пишет требования, отдаёт разработчику. Разрабо…

AIGenAIAI TransformationCTOAI-агентыAI NativeконвейердирижёрразработкаAI-native
Habr
RU

Обновление Claude Code Agent view: теперь одно окно для управления десятком параллельных AI-сессий

11 мая Anthropic выкатили в Claude Code новую фичу — agent view. Это менеджер сессий: один экран, в котором видны все запущенные параллельно сессии Cl…

Claude CodeAnthropicAI-агентыterminaltmuxproductivityразработка
Habr
RU

1 миллион токенов в Opus 4.7 — маркетинг. Реально полезных — 300 тысяч. И сами Anthropic это подтверждают

В начале мая Кангвук Ли (CAIO Krafton) опубликовал в X разбор: двумя API-вызовами и 35 1M токенов контекста в Claude Opus 4.7 — это «доступно», а не «…

LLMCodexClaude CodeOpus 4.7GPT-5.1-Codex-Maxcontext-compactionprompt-injectionAI-агенты
Habr
RU

OpenAI представила Daybreak: связка GPT-5.5 и Codex для поиска уязвимостей и автоматического патчинга

OpenAI анонсировала Daybreak — связку GPT-5.5 и Codex для defense-команд: автоматический поиск уязвимостей, валидация в sandbox и one-click патчи чере…

OpenAIDaybreakGPT-5.5Codexкибербезопасностьпоиск уязвимостейAI-агенты
Habr
RU

Как я перестал бояться и полюбил MCP или Зачем я написал 4 MCP‑сервера и протокол для их связи

Привет! Вы знаете как это бывает — начинаешь делать одну штуку, а потом просыпаешься через неделю и понимаешь, что написал че…

MCPModel Context ProtocolTRAILClaudeAI-агентыавтоматизацияоркестрациянейросетиplaywrightJSONL
Habr
RU

SocratiCode: разбираю MCP-сервер, который даёт ИИ-агенту понимание кодовой базы

Если ваш ИИ-агент при каждом вопросе начинает grep-ом по всему проекту — у меня есть для вас одна штука. SocratiCode — это MCP-сервер, который индекси…

MCPClaude Codeвекторный поискQdrantOllamacodebase intelligenceAI-агентыRAG
Habr
RU

[Перевод] 10 уроков агентного кодинга. Что делать в эпоху дешёвого кода?

Передовые модели сейчас действительно хорошо пишут код — лучше, чем справляются с большинством других задач. Работа с агентами ощущается как…

агентный кодингClaude CodeAI-агентыspec-driven developmentend-to-end тестывайбкодингавтоматизация разработкидокументация кодапромпт-инжинирингкибербезопасность