«Кнут и пряник» для ИИ не работает: исследование рушит миф о «трюках» в промптах

habr.com

habr.com:

Специалисты из Пенсильванского университета и Уортонской школы бизнеса опубликовали исследование, показывающее, что шантаж, задабривание и другие попытки манипулировать в промптах никак не повышают результативность современных ИИ.

Исследование провели на моделях Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini и GPT o4-mini. Всем ИИ задавали два набора вопросов: GPQA (PhD-уровень естественных наук) и MMLU-Pro (инженерные дисциплины), при этом каждый вопрос задавался 25 раз при температуре 1.0 — это делалось, чтобы избежать случайных колебаний ответов.В промптах были использованы девять "трюков", которые можно поделить на четыре группы.

Читать на habr.com Все новости от habr.com

Тайконавты начали использовать чат-бот Wukong AI для работы и отдыха на борту китайской орбитальной станции «Тяньгун»

xAI опубликовала открытые веса Grok 2. Для запуска требуется 8 GPU

GPT-4 предложила новые варианты белков для борьбы со старением

Command A Reasoning: нейросеть Cohere для масштабных исследований и анализа данных

Тайконавты начали использовать чат-бот Wukong AI для работы и отдыха на борту китайской орбитальной станции «Тяньгун»

xAI опубликовала открытые веса Grok 2. Для запуска требуется 8 GPU

GPT-4 предложила новые варианты белков для борьбы со старением

Command A Reasoning: нейросеть Cohere для масштабных исследований и анализа данных

Кнуты и пряники женского бизнеса: как перестать бичевать себя и начать зарабатывать | ФОКУС ВНИМАНИЯ

Исследование: 90% устройств для очистки воздуха не тестировали на людях

На презентации Google Pixel 10 показали новые ИИ-функции для Android и iOS

Apple готовит новый чехол TechWoven для iPhone 17 Pro и новый аксессуар для iPhone 17 Pro

CryEngine и легендарный Far Cry: тропический рай для геймера и ад для ПК

Демис Хассабис считает игры одним из лучших тестов для ИИ

Почему синие киты перестали петь у берегов Калифорнии: новое исследование развенчало миф

Энтузиасты нашли лучшую версию GPT-5. Для этого пришлось идти на обман

Сооснователь Story Protocol прекратил полную занятость для работы над ИИ-проектом

Для Linux вышел патч для поддержки Logitech G13, спустя 17 лет после выпуска игровой клавиатуры для левой руки

В ИИ-агент для программирования Jules добавили модуль-критик

Идеально для небольших помещений: Xiaomi выпустила компактную стиральную машину с загрузкой до 1 кг белья для стирки и до 0,5 кг для сушки

Работу модуля OpenAI для борьбы с «галлюцинациями» описали в деталях

Сотрудники OpenAI использовали ИИ Claude для программирования. В Anthropic уже закрыли доступ

GPT-5 получит модуль для борьбы с «галлюцинациями» — The Information

Исследование Wharton показало, что «глупые» ИИ-боты вступают в сговор для манипулирования рынками

В ChatGPT добавили функцию для обучения и «решения домашки»

СМИ: Минцифры выбрало «ВК Цифровые технологии» для поддержки сервисов для госслужащих и платформы для их коммуникаций

Oracle предоставит OpenAI 2 миллиона чипов для тренировки новых ChatGPT

TabM — новая нейросетевая архитектура для работы с табличными данными от исследователей Яндекса

«Разворот на 180 градусов». Рада отменила независимость НАБУ и САП. Что это значит для работы антикоррупционных органов и отношений с партнерами

Запущен агентский режим для ChatGPT – в нем ИИ сам выполняет сложные задачи

ChatGPT начал влиять на человеческую речь — исследование

Больше не эксклюзив: Google сделала видеоредактор Vids доступным всем пользователям

Творческие команды КРОК разработали собственные проекты на BE/TA CAMP

Сервис для ведения блогов Typepad завершает работу спустя 22 года

В мессенджере Max появились видеокружки

На популярном курорте началась "война" с туристами

Как освободить память на Android: места в смартфоне, которые нужно регулярно чистить

За год в Crusader Kings 3 прошло 3,4 млн похорон и создано 30 млн собственных персонажей: в честь 5-летия популярной стратегии Paradox опубликовала интересную статистику

Как Илон Маск переделывает Grok по своему образу и подобию

Семь овощей, которые способны замедлить старение организма

К Земле приближается астероид — за ним можно будет наблюдать в прямой трансляции

HMD готовит бюджетный смартфон с хорошим экраном Pulse 2 Pro

Бюджетная модель серии Pixel 10 скоро появится в продаже: инсайдер раскрыл некоторые характеристики нового смартфона Google

Ученые создали перекати-поле для Луны: робот пройдет там, где застрянут другие

К нам приближается астероид размером с авиалайнер: это можно увидеть в прямом эфире (видео)

На четверть увеличили выручку в первом полугодии

Некоторые диалоги с ChatGPT могут быть переданы в полицию — OpenAI

Как повлияют новые требования Google на российских разработчиков — экспертное мнение

Microsoft обещает улучшить качество звука по Bluetooth в Windows 11

Лингвисты НИУ ВШЭ — Санкт-Петербург создали уникальный «эмоциональный словарь» для обучения ИИ

Threads тестирует способ делиться длинными текстами на платформе

Samsung Galaxy Tab A11 4G протестирован в Geekbench

Helldivers 2 получила крупное обновление Into The Unjust — игрокам предлагают отправиться на родные планеты Терминидов

Продукт для гипертоников, который поможет снизить давление

Дія первой в мире ввела искусственный интеллект в сфере предоставления государственных услуг - как это работает

Инсайдер: новая консоль Xbox будет в два раза дороже PlayStation 6 — и все из-за Steam и других сторонних магазинов

Исследование: большинство опенсорсных проектов держатся на одном разработчике

Японский город предлагает ограничить использование смартфонов двумя часами в день

Маск судится с Apple и OpenAI, прорыв в мобильной съемке и новые игровые патенты: дайджест новостей

«Умный город» в 2024 году закрыл более 15 тысяч проблемных обращений

Nvidia и Carbon Robotics показали роботрактор для уничтожения сорняков

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA