Как GPT-5.5 стала одержима гоблинами. OpenAI разобрала собственную ошибку в RL

habr.com

habr.com:

OpenAI опубликовала технический разбор необычного бага: флагманская GPT-5.5 в кодинг-агенте Codex стала странно часто вставлять в ответы гоблинов, гремлинов, троллей, енотов и голубей — и компании пришлось дважды вписать в системный промпт прямой запрет на эти слова.

Самая показательная цифра из расследования: пользовательская "личность" Nerdy давала всего 2,5% ответов ChatGPT, но на нее приходилось 66,7% всех упоминаний "goblin".История всплыла, когда исследователи нашли в открытом репозитории Codex CLI строку: "Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях и других животных или существах, если это абсолютно и однозначно не относится к запросу пользователя".

Читать на habr.com Все новости от habr.com

Вредоносный коммит подписали «от имени Claude»: жертвой стала OpenAI

OpenAI объединяет ChatGPT, Codex и API

Показания Сэма Альтмана в суде «Маск против OpenAI»: что рассказал глава OpenAI

OpenAI против Apple: AI-гигант недоволен интеграцией ChatGPT в iOS и Siri и обвиняет партнера в недобросовестном сотрудничестве

Вредоносный коммит подписали «от имени Claude»: жертвой стала OpenAI

OpenAI объединяет ChatGPT, Codex и API

OpenAI против Apple: AI-гигант недоволен интеграцией ChatGPT в iOS и Siri и обвиняет партнера в недобросовестном сотрудничестве

Андрей Карпати: главная проблема LLM — в том, как они отвечают

OpenAI представила первую голосовую модель с интеллектом GPT-5

От 96% до нуля: как Anthropic отучила Claude от шантажа

Идеальный полигон для ИИ: Google DeepMind стала совладельцем разработчиков EVE Online

o1 рассуждает, Claude пишет код: как ИИ-агенты сами ищут биомаркеры рака

В Anthropic рассказали, как защититься от саботажа ИИ

В Anthropic рассказали, как отучили Opus 4.7 подхалимничать

Внутренний CLAUDE.md Apple утек в сеть: видно, как компания использует ИИ в поддержке

Сэм Альтман идет ва-банк: каким будет первый ИИ-смартфон OpenAI

Всего 20 минут и $12: как исследователь отравил передовые LLM несуществующими данными

«Мы не хотим сценарий Терминатора»: Маск дал показания против OpenAI

И это ваш AGI? DeepSeek V4 допустил мрачную ошибку в задаче про апельсины и нож

OpenAI выпустила гайд по GPT-5.5 и предупредила: старые промпты могут мешать

Госдеп США против DeepSeek: как дистилляция ИИ стала дипломатическим оружием

OpenAI изменила условия партнерства с Microsoft: что предусматривает обновленное соглашение

Claude Mythos в день анонса: как Discord-группа обошла белый список Anthropic

Google собрал «ударную группу» против Claude — через пять месяцев после Code Red у OpenAI

Как менеджер Grafana за вечер собрал ИИ, который сам разбирает ночные сбои — и обучается после каждого

+185% за 13 часов: как Kimi K2.6 переписала 8-летний движок

Альтман покинет OpenAI перед IPO? Его сделки слишком часто обогащают не OpenAI, а его самого

Anthropic не стала чинить дыру в протоколе MCP — и это на фоне хвастовства, как Claude находит тысячи уязвимостей

"Легенда": как лидеры реагируют на отставку Тима Кука из Apple

GPT-5.4-Cyber умеет разбирать бинарники: OpenAI выпустила модель для тестирования киберугроз

Инвесторы усомнились в оценке OpenAI в $852 млрд — что стало причиной?

ИИ-плагин Solar appScreener – технология года по мнению экспертов премии «AI-Олимп»

МУЛЬТИФАКТОР представил обновлённую версию сервиса мониторинга веб-ресурсов MULTISTATUS

Защиту ИИ-агентов от prompt injection выбирают по красивым цифрам. Почему в реальности эти цифры врут?

Samsung изучает жидкостное охлаждение для смартфонов Galaxy: перегрев остается одной из главных проблем

MSI представила первый в мире монитор с тремя режимами работы: до 680 Гц в Full HD

Секрет прохлады: как спастись от летней жары без кондиционера

Какая популярная привычка во время сна незаметно повреждает слух

Google представила Coralboard — одноплатник для разработки Edge AI и встраиваемых приложений на базе нейросетей

InfoWatch Traffic Monitor интегрирован с InfoDiode

С 1 июня годовая подписка на «Хакер» подорожает

"Итальянский эликсир долголетия" - эксперты раскрыли рецепт

Meta усиливает защиту пользователей перед ЧМ-2026: борьба с мошенниками и токсичным контентом

Ночные перекусы могут вредить психике, предупредили ученые

Еще одна флагманская портативка на Intel Arc G3 Extreme — MSI анонсировала Claw 8 EX AI Plus с 32 Гб оперативной памяти

Половина от запланированных к постройке в США ЦОД могут пострадать от разрушительных стихийных бедствий

Новые возможности Flutter 3.35.7 для ОС Аврора

Критический успех

Acer представила сразу две пары умных очков — с AR-дисплеем и встроенным ИИ Gemini

Душ дважды в день может быть полезным, но есть исключения

ТОП-6 ягод и фруктов, которые эффективно восстанавливают печень

Четыре способа, которые помогут продлить жизнь, назвали ученые

Почему ходить босиком опасно даже дома

Будем знакомы: Юлия Соколова, метафизик, автор книги «Метафизика реальности» - Журнал "ФОКУС ВНИМАНИЯ"

СМИ: Bungie предлагала варианты спасения Destiny 2, но Sony оказалась неумолимой

«Яндекс» расширил сотрудничество с глухими и слабослышащими курьерами

Глава «ЭР-Телеком Холдинга» к 25-летию компании рассказал о тенденциях и проблемах в телекоммуникационной отрасли

Отодвиньте немедленно – как обычная техника "убивает" ваш Wi-Fi

Samsung рискует упустить рынок умных колец: Oura уже ушла далеко вперед

Во сколько нужно ужинать, чтобы не набрать лишний вес

Единственное правильное время для взвешивания назвали диетологи

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA