Claude Code runawayllm история самит стартап Claude Code runawayllm

Fable 5 стала первой в бенчмарке по кодингу DeepSWE. Всего на 3% лучше GPT-5.5 за вдвое большую цену

Модель Claude Fable 5 от Anthropic возглавила обновленный лидерборд DeepSWE — бенчмарка по кодингу от стартапа Datacurve. На самых сложных, "длинных" инженерных задачах она набрала 70% pass@1 и формально стала первой.

Вот только идущую следом GPT-5.5 от OpenAI (67%) она обошла всего на три пункта — и при этом обходится почти вдвое дороже за задачу.DeepSWE интересен тем, что его специально сделали "ненакручиваемым".

DMCA