Исследования показывают, что ИИ-модели по-прежнему слишком часто испытывают галлюцинации
Новое исследование, проведенное учеными из Швейцарии и Германии, показывает, что даже лучшие модели, такие как Claude Opus 4.5, с включенным веб-поиском все равно выдают неверную информацию почти в трети случаев.Генеральный директор Nvidia Йенсен Хуанг утверждает, что у моделей больше нет галлюцинаций, но наука с этим не согласна.
Исследователи из швейцарского EPFL, Тюбингенского института ELLIS и Института интеллектуальных систем имени Макса Планка разработали «Halluhard» - бенчмарк, измеряющий галлюцинации в реалистичных многоходовых диалогах.
habr.com