runawayllm люди общество бюджет стартап крипто runawayllm

Claude Opus 4.6 обошел человека в «тесте на AGI». Но это только начало

Новая модель Anthropic набрала 68,8% на бенчмарке ARC-AGI-2 — тесте абстрактного мышления, где год назад все ИИ-модели показывали ноль, а средний результат панели из 400 живых людей составляет 60%.

Стоимость — $3,64 за задачу. Результаты подтверждены командой ARC Prize на полуприватном наборе задач. ARC-AGI-2 — бенчмарк Франсуа Шолле, создателя Keras, запущенный в марте 2025 года.

DMCA