runawayllm происшествия самит gemini runawayllm

Claude Mythos написал 18 рабочих эксплойтов для Chrome. Остальные ИИ — ноль

Исследователи из Карнеги-Меллон под руководством Дэвида Брамли выпустили ExploitBench — бенчмарк из 41 уязвимости в движке V8, который работает внутри Chrome, Edge и Node.js.

На нем прогнали девять фронтир-моделей. Закрытая модель Anthropic — Claude Mythos Preview — довела до рабочего эксплойта 18 из 41 бага.

DMCA