OpenAI представила технику Confessions которая учит модели честно сообщать о собственных ошибках

habr.com

habr.com:

OpenAI опубликовала исследование о новой технике Confessions. Это метод обучения, который направлен на обнаружение случаев, когда языковые модели скрывают свои ошибки, нарушают инструкции или используют механизм наград в обход реального качества ответа.

Исследователи объясняют, что современные модели могут стремиться получить высокую оценку за счёт уверенных, но неточных утверждений.

Читать на habr.com Все новости от habr.com

Atlas от OpenAI получает мультипрофили и обновления для рабочих пространств

OpenAI представляет GPT-5.2-Codex — продвинутый инструмент для программной инженерии

Ошибка с откатом GPT-5 Router показала, почему ИИ нужно учиться избавляться от старых привычек

Black Forest Labs представила FLUX.2 max, флагман для кинематографической генерации изображений

Atlas от OpenAI получает мультипрофили и обновления для рабочих пространств

OpenAI представляет GPT-5.2-Codex — продвинутый инструмент для программной инженерии

Ошибка с откатом GPT-5 Router показала, почему ИИ нужно учиться избавляться от старых привычек

Black Forest Labs представила FLUX.2 max, флагман для кинематографической генерации изображений

Google запустил своего самого продвинутого ИИ-агента в день выхода GPT-5.2 от OpenAI

OpenAI представила GPT‑5.2 — новую версию ведущей языковой модели с улучшенной логикой и скоростью

Новый бенчмарк показывает, что даже лучшие ИИ‑модели плохо справляются с правдой

Disney разрешил Sora генерировать видео с персонажами компании и инвестирует $1 млрд в OpenAI

Генеральные прокуроры США требуют от Microsoft, OpenAI и Google устранить «делюзионные» ответы ИИ

OpenAI забирает экс CEO Slack. Компания усиливает коммерческий блок и готовится к большому росту прибыли

OpenAI обязали передать NYT анонимизированные логи переписок пользователей

Perplexity представила BrowseSafe для защиты ИИ-браузеров от скрытых инструкций

Anthropic подписала $200 млн сделку с Snowflake — её ИИ‑модели станут доступны тысячам компаний

OpenAI и Google раскрыли, как ИИ меняет правила выхода на рынок

Prime Intellect представила INTELLECT-3: 106 миллиардов параметров и суперспособности в reasoning

Лаборатория Марка Цукерберга представила жёсткий бенчмарк для проверки LLM на выполнение сложных инструкций

Китайские открытые AI-модели впервые обошли по популярности американские

Хакеры получили доступ к данным пользователей API OpenAI после взлома Mixpanel

OpenAI запретили использовать слово «Cameo» в Sora. Как торговая марка остановила гиганта ИИ?

OpenAI готовит устройство, которое изменит наше представление о смартфонах и ИИ

ИИ без галлюцинаций: как Lean 4 заставляет модели доказывать правду

OpenAI объявила о закрытии API GPT-4o в феврале 2026

Tencent открыла модель, которая делает создание видео доступным каждому

Manus представила Browser Operator — ИИ-агенты, которые работают с браузером

OpenAI выпустила GPT-5.1-Codex-Max для тяжёлой разработки

NVIDIA представила открытые модели Apollo для научных расчетов и симуляций

IBM представила квантовые процессоры и перенос производства на 300-мм пластины

Три черты характера, от которых зависит продолжительность жизни

Прокачали GPU-платформу, развернули сеть 200 Gbit/s и другие итоги 2025 года от mClouds

В Китае замечен Робокоп: полиция тестирует гуманоидного-робота T-800 (да, это отсылка на Терминатора)

Asus не планирует выпускать новые смартфоны в этом году

Две обновленные The Legend of Zelda и Hades II возглавили топ-20 релизов 2025 года для Nintendo Switch 2 по версии Metacritic

Полиция США предъявила обвинение водительнице, которая, вероятно, сбила пешехода во время прямой трансляции на TikTok

Исследование: до 30% рекомендаций новых видео YouTube приходится на ИИ-«помои»

Стандарт CARF начал действовать в 48 странах с 1 января 2026 года

Motorola выпустит версию смартфона Razr, посвященную ЧМ-2026

Какой симптом на языке является признаком опасного обезвоживания

172 млн пользователей и 50 трлн токенов: Doubao стал крупнейшим ИИ-приложением Китая

Предметы на кухне, из-за которых вы едите больше, чем должны

Продукты, которые помогут восстановить печень после праздников

Ноутбук MacBook Air принял попадание артиллерийского осколка и продолжил работать

Супер-PAC Трампа MAGA Inc привлек $102 млн от представителей ИИ-сектора и криптоиндустрии за полгода

Создатель JavaScript раскритиковал веб-приложения вместо нативных в Windows 11

Как избежать замерзания замков: простой трюк

Астролог назвала жертв 2026: какие знаки Зодиака получат жесткий урок

Тревога сна - что мешает нам ночью заснуть и как это исправить

«Обзор ИИ» от Google ошибочно обвинил музыканта в преступлении

Утечка: HMD готовит к выпуску новую портативную Bluetooth‑колонку Boom E1 с 52 мм драйверами и аккумулятором на 800 мАч

Samsung представила портативный проектор Freestyle+

Трафик Cloudflare в России за полгода упал на 30%

Aave Labs рассматривает распределение внепротокольных доходов в пользу держателей токенов AAVE

MSI анонсировала два геймерских Tandem QD-OLED-монитора с пятислойными панелями и инновационной пленкой DarkArmor

Представлен Clicks Communicator — очередная реинкарнация BlackBerry с физической QWERTY‑клавиатурой и AMOLED-экраном

Представлены Fender Mix — первые беспроводные наушники легендарного бренда с модульной конструкцией и впечатляющей автономностью

Лайфхаки для потери веса, о которых мало кто знает

Ученые обнаружили растение, которое лечит артрит

Waymo снова приостановила работу роботакси в Сан-Франциско из-за угрозы наводнения

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA