RU

ChatGPT не промахнулся ни в одном из пяти медицинских кейсов. И всё равно проиграл. Разбираем, почему

В эксперимент мы шли с уверенностью, что ChatGPT хотя бы раз из пяти промахнётся с главным диагнозом. Не промахнулся. Пять из пяти: метаболический син…

ChatGPTGPT-5LLMмедицинаклинические решенияэкспериментрасшифровка анализовbenchmarkOCRрусскоязычные LLM
Habr
RU

AI-Driven подход «Harness Engineering»: наступившее будущее или лишь метод с ограничениями?

Вдохновился идеей OpenAI Harness Engineering и проверил на большом легаси проекте: можно ли отдать агенту всю реализацию, а человеку - постановку, тес…

агентная разработкаИИ в разработкелегасирефакторингтестированиеE2Eэксперименткод-ревьюмикросервисы.агенты ии