RU

Как один баг чуть не убил марсоход за $400 млн, и почему везде важна конфигурация

3 января 2004 года марсоход «Спирит» коснулся поверхности Марса в кратере Гусева. Двадцать один день спустя он перестал отвечать на команды, ушёл в бу…

NASA JPLбутлупфайловая система флеш памятипереполнение памятиMars Exploration Rover Spiritконфигурационные ошибки системмарсоходбагVxWorksruvds_статьи
Habr
RU

Смогут ли LLM выжить во время катастрофы? Gemini, ChatGPT и другие играют в «Бункер» (анализ поведения)

Тестирование современных LLM моделей проводится с помощью стандартных бенчмарков, которые оценивают математические способности, программирование, пони…

искусственный интеллектнаучпопllmязыковые моделиgeminichatgptсравнение моделейтеория игрбольшие языковые моделиruvds_статьи
Habr
RU

Бенчмарки AGI никогда не будут объективными

Тест Тьюринга явно устарел, сейчас пытаются придумать новые тесты на сильный ИИ . Но как оценить интеллект модели, если учёные сильно расходятся в оце…

интеллектсильный ИИAGIличностьСверхинтеллектсамосознаниекогнитивная наукаGeneral-BenchARC-AGIruvds_статьи
Habr
RU

Гонка ИИ-вооружений — как LLM вносят уязвимости в код и как другие LLM их находят

Ваш ИИ-агент только что выдал строчку. И она выглядит… подозрительно? Указатель без проверки на  NULL , сериализация через  pickle  без…

уязвимостиискуственный интеллектвайб-кодингcopilotclaudeclaude codellmошибки программистовбагиruvds_статьи