ИИ не может контролировать свои мысли — и это хорошая новость: OpenAI протестировали 13 моделей

habr.com

habr.com:

OpenAI опубликовали исследование контролируемости цепочки рассуждений (chain of thought, CoT) у reasoning-моделей — и пришли к парадоксальному выводу: все 13 протестированных моделей плохо справляются с управлением собственными мыслями, даже когда знают, что за ними наблюдают.

Максимальный результат среди передовых моделей — 15,4%. По мнению исследователей, для безопасности ИИ это скорее хорошая новость.Для оценки в OpenAI создали открытый бенчмарк CoT-Control — более 13 000 задач на базе GPQA, MMLU-Pro, HLE, BFCL и SWE-Bench Verified.

Читать на habr.com Все новости от habr.com

Meta* выпустила ИИ-двойника человеческого мозга — он предсказывает реакции, а не мысли

ChatGPT для взрослых заморожен бессрочно — OpenAI теперь строит «суперприложение»

OpenAI закончила предобучение модели Spud. В компании появился отдел по запуску AGI

OpenAI закрывает Sora — приложение не прожило и полгода

Meta* выпустила ИИ-двойника человеческого мозга — он предсказывает реакции, а не мысли

ChatGPT для взрослых заморожен бессрочно — OpenAI теперь строит «суперприложение»

OpenAI закончила предобучение модели Spud. В компании появился отдел по запуску AGI

OpenAI закрывает Sora — приложение не прожило и полгода

OpenAI гарантировала инвесторам 17,5% дохода — все, чтобы обойти Anthropic

OpenAI создаст ИИ-ученого к 2028 году — на это брошены все исследовательские силы компании

Meta* отложила ИИ-модель Avocado: она проиграла Google и OpenAI на внутренних тестах

ИИ пишет код, но не может его поддерживать: представлен первый CI-бенчмарк для ИИ-агентов

OpenAI покупает Promptfoo: стартап, который ломает ИИ-приложения

GPT-5.4 протестировали на самых сложных интерфейсах в мире — модель справилась

Вышла GPT-5.4 — первая модель OpenAI, которая управляет компьютером

«Льстят Трампу как диктатору»: утекшее письмо главы Anthropic может добить переговоры с Пентагоном

Первая нативная песочница для ИИ-агентов на Windows: OpenAI выпустила Codex App

Сооснователь Google Brain: до AGI ещё десятки лет. Проблема — в обучении моделей

Сотрудники Google и OpenAI поддержали Anthropic в споре с Пентагоном

Anthropic сняла запрет на обучение опасных моделей на фоне давления Пентагона

Маск проиграл OpenAI в суде — но главное дело на $134,5 млрд еще впереди

ИИ-агент сотрудника OpenAI подарил попрошайке мемкоины на $40 тысяч

ИИ-бум может обернуться убытками для производителей памяти — глава SK Hynix

ChatGPT может получить подписку за $100

Первым ИИ-устройством OpenAI может стать колонка за $300 с камерой и заказом продуктов

Четыре инвестора, $100 млрд, ноль прибыли: OpenAI закрывает рекордный раунд

Суперинтеллект может появиться к концу 2028 года — Сэм Альтман

«Может, стоит остановиться»: репортаж изнутри Anthropic

IT-аутсорсинг умрет за 5 лет: прогноз инвестора OpenAI на саммите в Индии

Маск хочет строить фабрику DRAM, Sony может отложить PlayStation 6: дефицит памяти вышел из-под контроля

OpenAI наняла создателя OpenClaw — он будет строить следующее поколение ИИ-агентов

Лишь 15% американцев готовы работать под руководством ИИ — опрос

Aave запустила V4 в основной сети Ethereum

Bluesky делает ставку на ИИ и запускает инструмент для кастомных лент

Citizen отметила 50-летие первых в мире наручных аналоговых часов на солнечных батареях

TP-Link устранила несколько критических уязвимостей в роутерах Archer NX

СМИ: «В России могут запретить международные звонки для пенсионеров и получение кодов авторизации для детей»

Выпуск ОС MicroPythonOS 0.9.0 с GUI для микроконтроллеров типа ESP32 на базе инструментария MicroPython

В США владельцы используют ИИ для поиска пропавших питомцев

Claude от Anthropic взлетает среди платящих пользователей

Новый ИИ-ассистент Bluesky стал одним из наиболее заблокированных аккаунтов

Оценит треть человечества: Samsung выпустила Hearapy — приложение, которое избавит от укачивания

СМИ: Disney заинтересована в покупке Epic Games, но в медиахолдинге не все одобряют такую идею

Standard Chartered: скорость обращения стейблкоинов растет быстрее ожиданий

В Сенате заинтересовались уходом чиновницы SEC из-за повышенного внимания к Трампу

В Австрии планируют запретить социальные сети для детей младше 14 лет

В ЦЕРН для фильтрации массивов данных используют кастомные ИИ-модели, интегрированные прямо в чипы

Bluesky показала Attie — AI-приложение для создания собственных алгоритмов и лент

Формула идеального долголетия – открытие австралийских медиков

Mined in America: сенаторы предложили законопроект для развития майнинга в США

Украинцы выбрали название «Сяйво» для национальной большой языковой модели

SpaceX готовит Pad 2: водяная завеса для 33 «Рапторов» и амбиции на апрель

Samsung ожидает трехкратный рост выручки от высокоскоростной памяти

Квадро-модуль с двумя 200 Мп сенсорами: впечатляющий фотофлагман Oppo Find X9 Ultra будет представлен уже 21 апреля

Meta* в рамках KPI вынуждает сотрудников больше использовать ИИ

«Работа России» опубликовала рейтинги трудоустройства выпускников вузов и колледжей

Reuters: проиранские хакеры взломали личную электронную почту главы ФБР

Исследование Стэнфордского университета выявило опасности обращения к чат-ботам с ИИ за личными советами

Разработчик рассказал об опыте делегирования всех задач по коду ИИ

Microsoft отключила поддержку оповещений о конфиденциальных данных для конечных точек в Defender

Binance запустит рынки прогнозов в партнерстве с Predict.fun

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA