runawayllm бизнес происшествия самит школы доллар дети и родители gemini runawayllm

«Кнут и пряник» для ИИ не работает: исследование рушит миф о «трюках» в промптах

Специалисты из Пенсильванского университета и Уортонской школы бизнеса опубликовали исследование, показывающее, что шантаж, задабривание и другие попытки манипулировать в промптах никак не повышают результативность современных ИИ.

Исследование провели на моделях Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini и GPT o4-mini. Всем ИИ задавали два набора вопросов: GPQA (PhD-уровень естественных наук) и MMLU-Pro (инженерные дисциплины), при этом каждый вопрос задавался 25 раз при температуре 1.0 — это делалось, чтобы избежать случайных колебаний ответов.В промптах были использованы девять "трюков", которые можно поделить на четыре группы.

DMCA