OpenAI проверяет убедительность рассуждений o3-mini в сабреддите
OpenAI использовала сабреддит r/ChangeMyView для создания теста, который позволяет измерять убедительность ответов моделей рассуждений ИИ.
Компания раскрыла эту информацию вместе с выпуском модели o3-mini.Сабреддит r/ChangeMyView насчитывает несколько миллионов пользователей.
habr.com