OpenAI сократила галлюцинации в GPT-5.2 на 30–50% — при условии, что включен поиск
В анонсе GPT-5.2 разработчики рассказали, как улучшилась ситуация с галлюцинациями новинки. Компания тестировала модель на запросах, похожих на реальные диалоги в ChatGPT, а ответы проверяла отдельная модель-оценщик с доступом в интернет.
Считали две метрики: долю ошибочных фактов среди всех утверждений (их может быть несколько в ответе) и долю ответов, где есть хотя бы одна серьезная фактическая ошибка.
habr.com