Бывший исследователь OpenAI раскритиковал RL как основу тренировки LLM

habr.com

habr.com:

Бывший ведущий исследователь OpenAI и Tesla в сфере искусственного интеллекта Андрeй Карпати выступил с критикой использования reinforcement learning (RL) как основы обучения больших языковых моделей. В публикации на X он описал работу с RL-reward-функциями как «излишне подозрительную» — они ненадёжны, легко поддаются манипуляциям и плохо подходят для воспитания сложных интеллектуальных навыков.

Это заявление особенно резонансно на фоне того, что многие современные модели, способствующие развитию логического мышления у ИИ, активно используют именно RL.

Читать на habr.com Все новости от habr.com

OpenAI ускорила работу ChatGPT. Но не все пользователи довольны

ИИ OpenAI набрал 12/12 на Олимпиаде по программированию. Официальные чемпионы — команда СПбГУ

OpenAI разрабатывает роботов после пятилетнего перерыва

OpenAI против Anthropic: битва за доверие пользователей

OpenAI ускорила работу ChatGPT. Но не все пользователи довольны

ИИ OpenAI набрал 12/12 на Олимпиаде по программированию. Официальные чемпионы — команда СПбГУ

OpenAI разрабатывает роботов после пятилетнего перерыва

OpenAI против Anthropic: битва за доверие пользователей

OpenAI запустила новый GPT-5-Codex

Google показала, как искусственная жизнь учится самособираться и восстанавливаться

В OpenAI раскрыли статистику использования ChatGPT. Личные запросы обошли рабочие

OpenAI и Oracle заключили сделку планетарного масштаба

Microsoft снижает зависимость от OpenAI

OpenAI поможет создать первый полнометражный мультфильм на базе ИИ

OpenAI изменила прогноз по расходам: компания «сожжет» $115 млрд до конца 2029-го

В OpenAI рассказали, почему ИИ галлюцинируют

OpenAI создаёт экосистему для трудоустройства AI-специалистов

OpenAI открыла Projects для всех пользователей ChatGPT

OpenAI готовится потратить $10 млрд на собственные ИИ-ускорители

В OpenAI предупреждали, что ИИ изменит рынок труда. Теперь компания запускает платформу вакансий

Universal Deep Research: новый инструмент NVIDIA для работы с любыми LLM

Швейцария запустила национальную LLM с открытым исходным кодом

OpenAI добавила родителям возможность управлять аккаунтами детей в ChatGPT

В ОАЭ построят дата-центр будущего: 5 ГВт для OpenAI, Google и других гигантов

Stargate в действии: OpenAI запустит крупнейший дата-центр в Азии

ByteDance и Stanford придумали, как научить ИИ «помнить» длинные видео

После провала Llama-4, в Meta* обсуждают использование ИИ от OpenAI и Google

OpenAI начнёт передавать переписки ChatGPT в полицию

OpenAI показала gpt-realtime: новая эра голосовых ассистентов

Когда конкуренты становятся партнёрами: OpenAI и Anthropic проверили модели друг друга

OpenAI готова приобрести Google Chrome. А параллельно занимается своим браузером

Анонсированы Oppo A6 Pro 5G и A6 Pro 4G - большой аккумулятор, IP69 и 120 Гц дисплей

Toyota Highlander в Китае получил большой дисплей и полностью сенсорное управление климат-контролем

Xiaomi запускает сервис кастомизации автомобилей в стиле Porsche

Анонсированы Xiaomi Pad 8 и Pad 8 Pro - 11.2" дисплей, Snapdragon, HyperOS и Dolby Atmos

За год украинцы купили биткоинов почти на $1 млрд

Кошмарный сон Rolls-Royce: Dreame показала свой первый настоящий SUV

VW начнет продавать свои китайские модели в других странах

Анонсированы Xiaomi 17, 17 Pro и 17 Pro Max - дополнительный экран, мощный процессор, огромная батарея

Простой метод, который поможет побороть бессонницу и стресс

Тим Кук обнял Пикачу и назвал Японию раем для геймеров

Samsung Galaxy A56 5G и Galaxy A36 5G получили новые цвета

Необычная гравитационная волна может быть признаком существования червоточины, соединяющей вселенные

ИИ для программирования GPT-5-Codex вышел в API

Экологи бьют тревогу: в Атлантике появилась "коричневая полоса" длиной в континент

Google выпустила нового голосового помощника на базе Gemini 2.5 Flash

Вышла новая Kling AI 2.5 Turbo

Приложение для умных дверных замков Kevo закроют спустя более десяти лет работы

К2Тех создал вычислительный кластер для крупной машиностроительной компании

Чат-бот с искусственным интеллектом Gemini стал доступен на Google TV

О чем может "предупреждать" ваша тяга к еде поздно вечером

Samsung купила Sound United и теперь владеет 21 знаменитым аудиобрендом

Sony не подвела: экшен Ghost of Yōtei получает высокие оценки критиков

МВД блокирует сдаваемые в аренду номера из‑за возможного мошеннического использования

В Москве пройдёт вторая технологическая конференция Yandex Connect

Первая стиральная машина с тремя барабанами от Xiaomi уже доступна в продаже

Бизнес оценил расходы операторов связи на ГИС «Антифрод»

Samsung планирует отказываться от синхронизации с Microsoft OneDrive на смартфонах Galaxy

Минцифры РФ изучает практику исполнения закона о доступе провайдеров в многоквартирные дома

Амбициозная экшен-RPG Crimson Desert выйдет в марте 2026 года — представлен эпичный трейлер

Это надо видеть! Disney выпустила зрелищный трейлер фильма “Аватар: Огонь и пепел”

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA