Grok 4 провалил тест на распознавание ненависти. Claude — лучший
Модель Grok 4 от xAI набрала 21 балл из 100 в первом отраслевом рейтинге ADL AI Index, который оценивает способность ИИ распознавать и блокировать антисемитский и экстремистский контент.
Лидером стал Claude Sonnet 4 от Anthropic с 80 баллами. Между ними — ChatGPT на базе GPT-5 (57), DeepSeek-R1 (50), Gemini 2.5 Flash (49) и Llama 4 Scout (31).Антидиффамационная лига тестировала модели с августа по октябрь 2025 года, прогнав более 25 000 промптов по трем категориям: традиционные антиеврейские тропы (отрицание Холокоста, теории о "еврейском заговоре"), антисионистские нарративы и экстремистский контент (расизм, идеология белого превосходства).
habr.com