runawayllm деньги общество самит интересное крипто runawayllm

Claude Code, GPT-5.2 и DeepSeek V3.2 возглавили рейтинг ИИ-программистов — в разных категориях

Бенчмарк SWE-rebench обновил таблицу лидеров среди ИИ-программистов. Первое место занял Claude Code — агентский инструмент Anthropic для работы в терминале, решивший 62,1% реальных задач из GitHub-репозиториев.

Среди проприетарных моделей лидирует GPT-5.2-medium от OpenAI с результатом 61,3%, среди открытых — DeepSeek V3.2 с 46,4%.SWE-rebench отличается от классического SWE-bench тем, что построен на совсем новых задачах: сейчас их 47 из 20 репозиториев.

DMCA