runawayllm общество runawayllm

OpenAI сократила галлюцинации в GPT-5.2 на 30–50% — при условии, что включен поиск

В анонсе GPT-5.2 разработчики рассказали, как улучшилась ситуация с галлюцинациями новинки. Компания тестировала модель на запросах, похожих на реальные диалоги в ChatGPT, а ответы проверяла отдельная модель-оценщик с доступом в интернет.

Считали две метрики: долю ошибочных фактов среди всех утверждений (их может быть несколько в ответе) и долю ответов, где есть хотя бы одна серьезная фактическая ошибка.

DMCA