80% токенов впустую: DeepSeek и GPT-OSS попались на «театральном мышлении»

habr.com

habr.com:

Исследователи из Goodfire AI и Гарварда обнаружили, что reasoning-модели вроде DeepSeek-R1 (671B) и GPT-OSS (120B) часто занимаются "театральным рассуждением" — модель уже уверена в ответе на 90%, но продолжает генерировать цепочку рассуждений (chain-of-thought), как будто еще думает.

Простые зонды, обученные на внутренних активациях, считывают ответ модели задолго до того, как он появляется в тексте рассуждений.Авторы использовали три метода: attention-пробы на скрытых состояниях модели, принудительный обрыв рассуждения с требованием дать ответ и внешний CoT-монитор, читающий текст рассуждений.

Читать на habr.com Все новости от habr.com

Три задачи Эрдёша за раз: новая модель OpenAI обошла GPT-5.4 Pro в математике

Сооснователь GitLab рассказал, как использовал ChatGPT для борьбы с раком

ChatGPT может получить подписку за 100 долларов, а также Codex-only план

Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Новый бенчмарк стравил 15 моделей

Три задачи Эрдёша за раз: новая модель OpenAI обошла GPT-5.4 Pro в математике

Сооснователь GitLab рассказал, как использовал ChatGPT для борьбы с раком

ChatGPT может получить подписку за 100 долларов, а также Codex-only план

Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Новый бенчмарк стравил 15 моделей

Вышел бенчмарк ARC-AGI-3: люди набирают 100%, GPT-5.4 — 0,26%

DeepSeek строит конкурента Claude Code — компания набирает 17 агентных инженеров

$150 000 за месяц на Claude Code: новая гонка пожирателей токенов

Walmart сворачивает продажи в ChatGPT: конверсия втрое хуже сайта

113 000 ключей DeepSeek утекли на GitHub — и это лишь часть проблемы

ИИ обучили «научному вкусу»: модель на 30B обошла GPT-5.2 в оценке потенциала статей

Бойся, Anthropic: ChatGPT, Codex и Atlas объединят в один суперапп

GPT-5.2 не смогла сложить 5+7. Как эзотерические языки обнулили передовые модели

DeepSeek V4, возможно, уже тестируется на OpenRouter — у стелс-модели 1 трлн параметров и 1M контекстное окно

«Никто не знает, что делать»: создатель ChatGPT — о ближайших годах рынка труда

Тысячи токенов в секунду: Nvidia добавила чипы Groq в стойки Vera Rubin

Стартап Percepta встроил «компьютер» внутрь ИИ — он выдает 30 тыс. токенов в секунду

Себастьян Рашка запустил визуальный справочник архитектур LLM — от DeepSeek до GLM-5

Математик создал задачу, неподвластную ИИ. GPT-5.4 ее решила

Карпати написал ИИ-агента, который ускорил обучение GPT-2 на 11%

GPT-5.4 протестировали на самых сложных интерфейсах в мире — модель справилась

Вышла GPT-5.4 — первая модель OpenAI, которая управляет компьютером

Первые подробности GPT-5.4: 1М токенов контекста и экстремальный режим рассуждений

Вышла GPT-5.3 Instant: меньше отказов и морализаторства. Thinking и Pro — следом

«Встречные санкции»: DeepSeek закрыл Nvidia доступ к V4 и отдал приоритет Huawei

Блогпост про ИИ-апокалипсис обрушил индекс Dow на 800 пунктов

Claude распознает бред в 94% случаев. GPT-5.2 поддакивает пользователю

«Украли у воров»: Маск высмеял Anthropic за обвинения в адрес DeepSeek, Moonshot AI и MiniMax

8BitDo представила механическую клавиатуру Retro 68 AP50 в стиле компьютера Apple II и стоимостью $500

Какими болезнями чреват сон менее 5 часов - предупреждение врачей

Оценена ремонтопригодность смартфона Google Pixel 10a

Блогер запустил ПК без ОЗУ ради эксперимента

OpenAI купила TBPN — популярное техношоу о бизнесе и ИИ

Названа идеальная высота кровати - сон будет крепким и глубоким

Люди 1200 лет назад случайно создали остров – необычное открытие

Флагманов Samsung будет больше: в следующем году к линейки Galaxy S27 может добавиться Pro-модель

«Код Дурова»: пользователи из России теперь могут сменить регион App Store без отмены всех подписок

В российских кафе и ресторанах начнут внедрять ИИ-кассиров

В какой одежде нельзя ложиться спать, рассказали врачи

Как прожить 117 лет без рака и деменции – итоги исследования

В Швеции вернут книги в классы

VK назначила нового технического директора

Туристы нашли клад в горах – стоимость найденного поражает

McDonald’s представил аксессуар Archie для управления геймпадом за едой

VK ОРД станет платным с мая: тарифы, коины и особенности работы

Apple начала продавать восстановленные MacBook Pro M5

ТОП-5 вопросов, которые стоит задать человеку, чтобы узнать главное

Ученые назвали самое опасное время для ужина

Как древние люди употребляли алкалоиды 4000 лет назад – исследование

Samsung выпустит смартфон Galaxy S27 Pro с функциями уровня Ultra, но без S Pen

Андрей Карпати рассказал, как ИИ ведет за него вики на 400 000 слов

Google выпустила Gemma 4 с открытой лицензией Apache 2.0

ТОП-7 продуктов, которые сделают суп еще полезнее и сытнее

Главная ошибка со стиральными машинами – о каком режиме лучше забыть

Как не проиграть ИИ: 5 качеств, которые сделают вас незаменимым

Samsung снова почти на 30% подняла цены на память

Раскрыты ключевые спецификации смартфона Samsung Galaxy S26 FE

Магнитные бури в апреле: что готовит для нас Солнце в ближайшую неделю

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA