Tech News
All News AI & ML Architecture DevOps Open Source Programming Team Management Testing & QA Web

Programming

⚑ Report a Problem

Latest Programming news from Tech News

All topics AI agents ai api architecture automation aws beginners career claude database devchallenge devops javascript learning llm machinelearning mcp opensource performance productivity programming python react rust security showdev tutorial typescript webdev
All EN RU
RU

Новый бенчмарк по кодингу для LLM ProgramBench: 9 топ моделей, 200 задач, 248 тысяч тестов. Полностью решённых — ноль

200 задач. 248 тысяч тестов. Девять моделей, среди них всё свежее: Opus 4.7, GPT 5.4, Gemini 3.1 Pro, Sonnet 4.6. На SWE-bench те же модели берут 70 %…

ProgramBenchбенчмаркLLMкодинг-агентыSWE-benchvibe-codingopus 4.7GPT-5.4
Habr May 15, 2026, 11:19 UTC

© Tech News — Headline Aggregator

Sitemap Legal Notice Privacy Terms Copyright / Removal DSA Contact

Leaving the site

You are about to open an external website:

Continue →