AI-модели, такие как Deepseek-R1 и OpenAI o1, страдают от «недомыслия»: как это можно исправить

habr.com

habr.com:

Китайские исследователи выяснили, почему AI-моделям часто не удаётся справиться со сложными задачами, требующими логического мышления: они склонны слишком быстро отказываться от многообещающих решений, что приводит к напрасной трате вычислительных мощностей и снижению точности.Исследователи из Tencent AI Lab, Университета Сучжоу и Шанхайского университета Цзяо Тун показывают, что модели-рассуждатели, такие как o1 от OpenAI, часто переключаются между различными подходами к решению задач, часто начиная с нуля, используя такие выражения, как «В качестве альтернативы…».

Такое поведение становится более заметным по мере усложнения задач, и модели используют больше вычислительных мощностей, когда приходят к неправильным ответам.Команда обнаружила, что 70% неверных ответов содержали по крайней мере одну верную логическую цепочку, которая не была полностью изучена.

Читать на habr.com Все новости от habr.com

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях

Microsoft и генеративный ИИ: как компания пытается сохранить интерес разработчиков и игроков

Логические модели OpenAI получили два полезных обновления

Искусственный интеллект учится понимать физику: как AI развивает интуитивные знания о мире

Как масштабирование во время тестирования раскрывает скрытые способности к рассуждению в небольших языковых моделях

Microsoft и генеративный ИИ: как компания пытается сохранить интерес разработчиков и игроков

Логические модели OpenAI получили два полезных обновления

Искусственный интеллект учится понимать физику: как AI развивает интуитивные знания о мире

OpenAI меняет стратегию в области разработки с открытым исходным кодом: что ждать дальше?

Угроза безопасности: как злоумышленники могут манипулировать AI-агентами

OpenAI пытается «не подвергать цензуре» ChatGPT

Расшифровка мозговой активности: как Meta* и учёные из Испании восстанавливают предложения по сигналам мозга

OpenAI отменяет выпуск своей AI-модели o3 в пользу «унифицированного» релиза нового поколения

OpenAI отвечает на вызовы конкурентов: что нового в последней модели рассуждений o3-mini?

OpenAI и концепция AGI: планы генерального директора Сэма Альтмана

OpenAI расширяет своё присутствие в Европе, предоставляя услуги хранения данных в ЕС

OpenAI укрепляет позиции на азиатском рынке: стратегические партнёрства с Kakao и SoftBank

SoftBank и OpenAI укрепляют партнёрство: миллиардные инвестиции и создание нового предприятия

Первые пользователи протестировали ChatGPT Operator от OpenAI на реальных задачах

Сэм Альтман: OpenAI оказался «не на той стороне истории» в отношении открытого исходного кода

Тест ChangeMyView: как OpenAI оценивает убедительность своих AI-моделей

«Неконтролируемая человеческая речь»: какие опасности таит в себе новый набор данных для AI?

США опередили Китай в разработке лучшего AI: новая модель из Сиэтла превосходит DeepSeek V3

Напряжённость в отношениях между OpenAI и Microsoft: что стоит за разрывом партнёрства

Билл Гейтс: «Это одна из самых важных книг об искусственном интеллекте, когда-либо написанных»

SwiftKV: как снизить затраты и ускорить логический вывод больших языковых моделей

Transformer² от Sakana AI — это новый подход, помогающий языковым моделям обучаться

Новый продукт от OpenAI: что известно об инструменте на основе AI, который может управлять компьютером

DeepSeek утверждает, что его модель рассуждений превосходит o1 от OpenAI по некоторым показателям

Новейший план Microsoft Copilot для бизнеса — это оплата по факту использования

Модель искусственного интеллекта OpenAI иногда «думает» на китайском, и никто не знает почему

В Сети торгуют призовыми местами на олимпиадах, чтобы пройти в университет без экзаменов

Google близка к запуску YouTube Premium Lite

Twitch ограничит хранилище стримеров 100 часами лучших моментов и загрузок

Исследование: тёмная тема не помогает сберечь заряд смартфона и ноутбука

Tesla потеряла двух ведущих дизайнеров - кто они и куда ушли?

Запас хода более 1 000 км: Mercedes-Benz начала испытания EQS с твердотельной батареей

Китайские ученые создали ИИ-анализ крови, который диагностирует болезни за 15 лет до появления симптомов

Apple представила первые публичные бета-версии iOS 18.4, iPadOS 18.4 и macOS Sequoia 15.4

Sony Honda Mobility открыла первый шоурум для AFEELA EV в Лос-Анджелесе — продажи стартуют в 2026 году

Игроки в Steam просят ввести фильтр, чтобы отсеять игры, созданные ИИ: пока такая функция есть только в SteamDB

Samsung может внедрить до 8 лет обновлений Android для своих смартфонов с чипами Snapdragon

Слухи: ААА-игра студии Skeleton Key, которой руководит бывший продюсер Dragon Age, отменена

MSI презентовала ноутбуки с видеокартами RTX 50: мощность, вдохновленная скандинавскими мифами

Samsung и POSTECH разработали металинзы для сверхлегких XR-гарнитур

Из спотовых биткоин- и Ethereum-ETF вывели почти $600 млн

IT-гиганты с белорусскими корнями снова ставят рекорды прибыли

«Самый умный ИИ в мире» теперь умеет говорить

Магнитная буря утихнет, но ненадолго. Сколько она будет держаться на Земле

OKX оплатит $505 млн для урегулирования претензий Минюста США

Как по состоянию кожи определить болезни печени, рассказал специалист

Продукты, которые большинство готовит неправильно, назвали эксперты

Nvidia запускает платформу искусственного интеллекта для обучения языку жестов

Походный смартфон Oukitel WP100 Titan способен работать шесть месяцев в режиме ожидания

Релиз открытого каталогизатора домашней библиотеки MyLibrary 3.2

Студия Schell Games анонсировала выход Among Us 3D для ПК

OpenAI обслуживает 400 млн пользователей каждую неделю

Артур Хейс допустил падение биткоина до $70 000 из-за продажи ETF

В Striking Distance Studios, которая создала The Callisto Protocol, произошла волна увольнений, которая затронула "большинство разработчиков"

33 Immortals выйдет в раннем доступе для Xbox Series и PC 18-го марта

Oppo Enco Air 4i дебютировали в Китае: 54 часа автономности за $14

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2025. Все права защищены.

DMCA