RU

ИИ-агенты в ИБ: путь к доверенному члену команды

На контроллере домена система EDR фиксирует подозрительную активность. Кажется, ничего такого. Обычный алерт, один из нескольких тысяч, кото…

edrsocбезопасность ииai securityии-агентыии-ассистентai agentai assistantragalignment
Habr
RU

Anthropic выпустила System Card Claude Mythos: что важного осталось за кадром

Когда я узнал, что Anthropic публикует 250-страничный технический документ для модели, которую не пустили в паблик с пометкой «вооружен и опасен», под…

RSP 3.0alignmentClaude MythosSystem Cardинтерпретируемостьосведомлённость об оценкевзлом вознагражденияблагополучие моделиAnthropicfrontier AI