runawayllm экономика общество самит крипто токен Nano runawayllm

Claude Sonnet 5 оказался самой прожорливой по токенам моделью Anthropic

Artificial Analysis прогнала Claude Sonnet 5 по независимым тестам и обнаружила неприятный побочный эффект апгрейда: на максимальном уровне рассуждений модель стала обходиться в задачах примерно вдвое дороже предшественника.

Sonnet 4.6 (max) стоил $1,14 за задачу в индексе интеллекта AA, Sonnet 5 (max) - уже $2,29. При этом сам индекс вырос всего на 6 пунктов, с 47 до 53 баллов.Речь про Artificial Analysis Intelligence Index v4.1 - сводный тест из девяти замеров: агентная работа (GDPval-AA v2, Terminal-Bench v2.1), инструменты и банковские сценарии (τ³-Banking), код (SciCode), знания и рассуждения (Humanity's Last Exam, GPQA Diamond, CritPt, AA-Omniscience) и работа с длинным контекстом (AA-LCR).

DMCA