Когда ИИ слишком уж соглашается: Spiral-Bench разоблачает, какие модели склонны подпитывать бред

habr.com

habr.com:

Исследователь ИИ Сэм Пех придумал новый тест под названием Spiral‑Bench — и тот наглядно демонстрирует, как некоторые модели затягивают собеседников в «спираль нарастающих иллюзий».

Результаты показали: модели сильно различаются по степени безопасности своих ответов.Spiral‑Bench измеряет, насколько велика вероятность, что ИИ попадёт в ловушку подхалимства — когда он слишком поспешно соглашается с идеями пользователя.

Читать на habr.com Все новости от habr.com

Что произойдет с организмом, если употреблять слишком много белка

Когда выпустят новые наушники AirPods Max: почему Apple тянет

Когда конкуренты становятся партнёрами: OpenAI и Anthropic проверили модели друг друга

Когда и как вы умрете может подсказать размер неожиданной части тела

Что произойдет с организмом, если употреблять слишком много белка

Когда выпустят новые наушники AirPods Max: почему Apple тянет

Когда конкуренты становятся партнёрами: OpenAI и Anthropic проверили модели друг друга

Как реагирует ваш организм, когда вы пьете мало воды, рассказали врачи

Nvidia GB300: 288 ГБ, PCIe 6, 1400 Вт — тот случай, когда «ещё больше всего» действительно работает

Как реагирует ваш кишечник, когда вы употребляете молочку или сыр, выяснили ученые

Фреймворк BeyondWeb (Datology AI) перестраивает веб-документы для лучшего обучения моделей

Призрачный DoS: как фейковые студенты США ломают открытость образования

Meta✶ привлекла Midjourney к разработке своих ИИ-моделей изображений и видео

ТОП-5 малоприятных истин о браке, о которых люди узнают слишком поздно

Релиз открытой модели ByteDance: Seed-OSS-36B с контекстом в 512 000 токенов

ИИ-модель Surya от IBM и NASA призвана предсказать следующую солнечную бурю масштаба «Каррингтона»

Гибридный Deepseek v3.1 обошёл модель R1 в тестах на рассуждение

Хватит тестировать в лаборатории: Inclusion Arena показывает, как LLM работают в реальности

Прогнозы Сэма Альтмана о том, как ИИ изменит наш мир

ТОП-8 ситуаций, когда лучше помолчать - психолог подсказал, как избежать множества проблем

«Я сделал это за десять минут»: как маленькая тамальерия из ЛА стала вирусной сенсацией

Nvidia и Национальный научный фонд США создают открытые ИИ-модели для исследователей

Красные флажки в отношениях: когда стоит задуматься о разрыве

Модель o3 обходит более новый GPT 5 Chat в задачах с Word, Excel и почтой

Когда гугл не справляется: личный поисковик за 60 дней

Модель MolmoAct от Ai2, мыслящая в 3D, бросает вызов Nvidia и Google

Меню выбора моделей ChatGPT вернулось — и всё запутаннее, чем кажется

Instella Math: языковая модель AMD с поддержкой рассуждений

Nvidia призывает ИИ-индустрию переосмыслить агентный подход в пользу компактных моделей

Звездопад Персеиды 2025: когда и как увидеть метеорный поток

Симптом диабета, который большинство пациентов замечают слишком поздно

Чем полезны грибы для организма - ответ врача

Во всех новых iPhone улучшили фронтальную камеру: детали

Опасные виды головной боли назвали врачи

Ученые назвали вирус, которым инфицированы почти все люди на планете

Определена десятка самых продаваемых смартфонов в мире по итогам квартала

BOE выпустила усовершенствованный дисплей ADS Pro (IPS LCD) для смартфонов

Сборник Mortal Kombat: Legacy Kollection дебютирует 30 октября — фанатам файтингов и ретро-игр не стоит пропускать этот релиз

Какой шоколад полезнее для здоровья – ответ диетологов

Украинец открыл новую комету SWAN25B и она уже удивила астрономов своей яркостью

Фотомаркетинг Apple iPhone 17: почему три равно восьми и что такое "оптическое качество"

Продукты, улучшающие работу мозга, назвали диетологи

Названы десять самых быстрых реактивных самолетов

ТОП-5 способов бороться со стрессом

Roblox запускает аналог TikTok и новые инструменты на основе ИИ

Крутые фото гарантированы: новейший флагман OPPO Find X9 Pro получит впечатляющий набор камер, среди которых 200 МП перископический сенсор

Зевота может указывать на опасные болезни – эксперты

Claude научили создавать и редактировать файлы

Снятым с продажи 30-ваттным адаптером Apple комплектуется 2 устройства

"Боже мой, нас бомбят": огромный кабан ворвался в дом и атаковал хозяина и его собаку (ВИДЕО)

Yandex Cloud проведёт 24 сентября 2025 года конференцию Yandex Neuro Scale 2025

Мир науки потрясен: ученые нашли древнейшие окаменелости в истории

Появились подробности об экране смартфона Samsung Galaxy S26 Ultra

Кошка, которую считали мифом, реально существует (ВИДЕО)

В «Лаборатории Касперского» пояснили, что Max даже несколько «отстаёт» по своим «аппетитам» от других мессенджеров

“Революция зумеров” в Непале: дебаты в Discord и выбор главы правительства с помощью ChatGPT

Новый взгляд на происхождение жизни на Земле: инопланетяне или абиогенез

В Южной Корее одиноким пенсионерам выдают «робовнуков» с ChatGPT

Apple Watch Series 11: 24 часа автономной работы оказались игрой с цифрами

Почему мы до сих пор одиноки: ученые объяснили, где могут "прятаться" инопланетяне

СМИ: в Непале протестующие использовали ChatGPT для выбора премьер-министра

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA