Tech News
All News AI & ML Architecture DevOps Open Source Programming Team Management Testing & QA Web

Latest News

⚑ Report a Problem

Tech news from the best sources

All topics - Искусственный интеллект, машинное обучение, нейросети - Новости сети - автомобили, мотоциклы, транспортные средства - вирусы, трояны, уязвимости в ПО, вопросы безопасности - игры - космос - мобильные телефоны, смартфоны, сотовая связь, коммуникаторы, КПК - процессоры - финансовые новости и аналитика AI LLM ai ai-агенты frontpage llm postgresql python selectel Новости Статьи автоматизация ии ии-агенты информационная безопасность искусственный интеллект нейросети программирование разработка управление командой управление проектами
All EN RU
RU

Новый бенчмарк по кодингу для LLM ProgramBench: 9 топ моделей, 200 задач, 248 тысяч тестов. Полностью решённых — ноль

200 задач. 248 тысяч тестов. Девять моделей, среди них всё свежее: Opus 4.7, GPT 5.4, Gemini 3.1 Pro, Sonnet 4.6. На SWE-bench те же модели берут 70 %…

ProgramBenchбенчмаркLLMкодинг-агентыSWE-benchvibe-codingopus 4.7GPT-5.4
Habr May 15, 2026, 11:19 UTC

© Tech News — Headline Aggregator

Sitemap Legal Notice Privacy Terms Copyright / Removal DSA Contact

Leaving the site

You are about to open an external website:

Continue →