Grok 4 провалил тест на распознавание ненависти. Claude — лучший

habr.com

habr.com:

Модель Grok 4 от xAI набрала 21 балл из 100 в первом отраслевом рейтинге ADL AI Index, который оценивает способность ИИ распознавать и блокировать антисемитский и экстремистский контент.

Лидером стал Claude Sonnet 4 от Anthropic с 80 баллами. Между ними — ChatGPT на базе GPT-5 (57), DeepSeek-R1 (50), Gemini 2.5 Flash (49) и Llama 4 Scout (31).Антидиффамационная лига тестировала модели с августа по октябрь 2025 года, прогнав более 25 000 промптов по трем категориям: традиционные антиеврейские тропы (отрицание Холокоста, теории о "еврейском заговоре"), антисионистские нарративы и экстремистский контент (расизм, идеология белого превосходства).

Читать на habr.com Все новости от habr.com

Claude написал код с ошибкой — криптоплатформа потеряла $1,78 млн за минуты

Claude Opus 4.6 и Sonnet 4.6 прокачали веб-поиск

Claude Code научили работать с Figma

IT-аутсорсинг убьет сам себя? Infosys строит агентов на Claude

Claude написал код с ошибкой — криптоплатформа потеряла $1,78 млн за минуты

Claude Opus 4.6 и Sonnet 4.6 прокачали веб-поиск

IT-аутсорсинг убьет сам себя? Infosys строит агентов на Claude

Стартовала бета Grok 4.20 — ответ генерируют 4 агента

Версию Grok для SpaceX назвали в честь мистера Спока из Star Trek

Маск пообещал выпустить Grok 4.20 в ближайшие дни

OpenAI заявила о 6 решениях из 10 в «самом сложном тесте для ИИ». Математики не согласны

«Ни строчки кода с декабря»: Spotify перевела лучших инженеров на Claude Code

Новая Gemini 3 Deep Think обогнала среднего человека в «тесте на AGI»»

ИИ перестал показывать, что делает: разработчики жалуются на новую версию Claude Code

Создатель Redis написал ИИ-распознавание речи на чистом C — без Python и зависимостей

Собранный Opus 4.6 компилятор провалился в независимом бенчмарке

Claude Code получил задачу «заработай $1000» — и за 74 минуты собрал рабочий сайт

Claude Code стал давать советы, как программировать лучше

Бесплатный видео-ИИ Grok Imagine возглавил рейтинги — уровень Veo 3.1 и Sora 2

Qwen3-Max-Thinking прокачали в бенчмарках и добавили в Claude Code

ChatGPT попался на цитировании Grokipedia, ИИ-энциклопедии Маска

Claude Code научили писать человечнее, использовав гайд Википедии для борьбы с ИИ-текстами

Claude Opus 4.5 обошел людей в тестовом задании Anthropic — теперь попробовать может каждый

Математик рассказал, как Grok 4.20 за 5 минут нашёл новую функцию Беллмана

Grok «раздел» мать ребенка Маска — она потеряла заработок на X и рассматривает иск

Тестовая версия Grok 4.20 показала SOTA во фронтенде — на уровне Opus 4.5

Grok и Gemini получат доступ к секретным сетям Пентагона к концу января

Anthropic создала Cowork за 10 дней — весь код написал Claude Code

Anthropic представила Cowork — ИИ-агента на базе Claude Code для широких задач

В Великобритании расследуют дипфейки Grok — Маск репостит фото Стармера в бикини

Подписка Claude больше не работает в сторонних редакторах кода — разработчики в ярости

Больше никакого храпа: 4 простые привычки, которые реально помогают

WordPress.com добавил встроенного AI-помощника для сайтов

Как распознать умного человека - четыре фразы подсказали психологи

Две вечерние привычки, которые снизят высокое давление и сахар

Электромобили BMW M будут имитировать звук работы двигателя и переключения передач

Grok 4.20 vs 22 года математики: константа Назарова улучшена на 9,1% за две минуты

[Видео] Андрей Карпатый переписал GPT | OpenClaw объявил войну | Telegram снова блокируют

Как повысить самооценку: 8 действенных привычек

Онемение рук во сне может быть опасным симптомом - врачи

Так звучат флагманы этого года: Samsung представила новую версию мелодии Over The Horizon для серии Galaxy S26

Электрический Mercedes-Benz eArocs 400 прошел зимние испытания в Финляндии

Perplexity отказалась от рекламы в нейросети

Он вам не друг и не хранит секреты: четыре неприятных факта о ChatGPT

Проект смарт-часов Meta под кодовым названием Malibu 2 возобновлен

Samsung представила новую аранжировку фирменного рингтона Over the Horizon

Ученый откровенно рассказал про "7 секунд в потустороннем мире"

Исследование: у 99% взрослых старше 40 лет на МРТ выявляются «аномалии» плечевого сустава, но это проблема самой МРТ

Индийский стартап Sarvam внедряет свои модели AI в кнопочные телефоны, автомобили и смарт-очки

Напиток, который снижает риск всех хронических заболеваний

Самое изнурительное десятилетие в жизни человека определили ученые

От какой привычки избавиться после 50, чтобы стать счастливее

Canva довела годовую выручку до 4 млрд долларов на фоне роста трафика из LLM

“NieR: Automata будет продолжена” — Square Enix вселила надежду на новую игру франшизы

Длительная безработица перестаёт быть временной проблемой и становится «новой нормой» в США

Какая пища более полезная — холодная или горячая

Официально: Ubisoft скоро выпустит две новые игры серии Far Cry

Какую кашу нужно есть, чтобы прожить 100 лет и больше - это не гречка

Собака любит вас больше всех - эксперты назвали точные сигналы

Apple выпустит три устройства на базе ИИ

В WhatsApp появилась возможность делиться старыми сообщениями с новыми участниками группы

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA