OpenAI сократила галлюцинации в GPT-5.2 на 30–50% — при условии, что включен поиск

habr.com

habr.com:

В анонсе GPT-5.2 разработчики рассказали, как улучшилась ситуация с галлюцинациями новинки. Компания тестировала модель на запросах, похожих на реальные диалоги в ChatGPT, а ответы проверяла отдельная модель-оценщик с доступом в интернет.

Считали две метрики: долю ошибочных фактов среди всех утверждений (их может быть несколько в ответе) и долю ответов, где есть хотя бы одна серьезная фактическая ошибка.

Читать на habr.com Все новости от habr.com

Кризис джуниоров не касается ИИ: OpenAI и Anthropic платят стажерам шестизначные суммы

Google догоняет OpenAI: веб-трафик Gemini вырос с 5% до 20%, ChatGPT упал до 68%

Anthropic и OpenAI удвоили лимиты до Нового года. Пользователи Claude не заметили разницы

«Общий интеллект — полная чушь»: Янн ЛеКун и Демис Хассабис поспорили, что называть AGI

Кризис джуниоров не касается ИИ: OpenAI и Anthropic платят стажерам шестизначные суммы

Google догоняет OpenAI: веб-трафик Gemini вырос с 5% до 20%, ChatGPT упал до 68%

Anthropic и OpenAI удвоили лимиты до Нового года. Пользователи Claude не заметили разницы

«Общий интеллект — полная чушь»: Янн ЛеКун и Демис Хассабис поспорили, что называть AGI

OpenAI готовит рекламу в ChatGPT: модели будут приоритизировать спонсорский контент в ответах

AI-браузеры никогда не будут полностью безопасны — неожиданное признание OpenAI

Сможем ли мы контролировать GPT-7? OpenAI измерили «наблюдаемость» цепочки рассуждений ИИ

$750 млрд за компанию с убытками: OpenAI обсуждает мегараунд до $100 млрд

«Великая коррекция хайпа»: MIT Technology Review объяснил, что пошло не так с AI в 2025-м

OpenAI выпустила генератор изображений GPT Image 1.5 — бесплатно и лучше Nano Banana Pro

«ИИ написал 85% кода»: как четыре инженера OpenAI собрали Android-версию Sora 2 за 28 дней

OpenAI: каждая новая ИИ-модель может стать кибероружием

Google опередил OpenAI в гонке за Пентагон: Gemini развернули для 3 млн военных

OpenAI тестирует новую генерацию изображений для ChatGPT. Примеры работы и где попробовать

OpenAI будет выдавать сертификаты «готовности к работе с ИИ». План — 10 млн человек за 5 лет

Каждый седьмой запрос в библиотеку — галлюцинация ИИ: в США бьют тревогу

OpenAI набрала обязательств на $1.4 трлн при выручке $20 млрд. Что может пойти не так?

OpenAI законтрактовала до 40% поставок DRAM, а теперь производители пытаются выкупить память обратно у ритейлеров

GPT-5.2 на подходе? OpenAI начала тестировать новую модель на Design Arena

Спустя два месяца «сделка века» между Nvidia и OpenAI так и не подписана. На кону $100 млрд

Разработчик дал трем ИИ задачу собрать клон Counter-Strike. Вот что из этого вышло

Ведущий исследователь OpenAI: AGI — вопрос ближайших 5–20 лет, и в этом согласны все

OpenAI придется раскрыть, как она обучала GPT-модели на пиратских книгах

После GPT-4o OpenAI не выпустила ни одной по-настоящему новой модели ИИ — SemiAnalysis

Ученый OpenAI рассказал, как изменится роль человека в мире ИИ

OpenAI хочет подсадить на ChatGPT каждого третьего пользователя интернета

От безработицы до войн: «крестный отец ИИ» Джеффри Хинтон считает, что мир не готов к ИИ

Вышло обновление Telegram: краткие пересказы от ИИ и дизайн «жидкое стекло»

LG выпустила портативную умную колонку для караоке Xboom Stage 501 со сменным аккумулятором

Clair Obscur: Expedition 33 и Ghost of Yōtei стали лидерами по числу номинаций на ежегодной D.I.C.E. Awards

ТОП-7 вредных кулинарных привычек, от которых стоит избавиться

Вечерняя привычка, которая часто указывает на развитие диабета

Тотальная доминация Китая и провал Tesla Optimus: подведены итоги 2025 года на мировом рынке гуманоидных роботов

SpaceX снизит орбиту спутников Starlink, чтобы уменьшить риск столкновений

Генеративный ИИ на фотонах: Китай показал превосходство над GPU Nvidia в узкоспециализированных задачах

Умер на 6 минут: американец рассказал, что видел в "другом мире"

Раскрыты подробности о смартфоне Samsung Galaxy M17e 5G

Дебютировал Redmi Soundbar Speaker 2 Pro — бюджетная аудиосистема от Xiaomi с беспроводным сабвуфером и RGB‑подсветкой

Неожиданный фактор, из-за которого люди быстрее стареют

Похоже, Samsung отказалась от выпуска милого робота-помощника Ballie

ТОП-8 приборов, которые обязательно нужно отключать от сети

Названа сладость, которая защищает печень и щитовидку

Что любимый тип еды может рассказать о личности человека

Grok столкнулся с волной критики из-за изображений сексуального характера в X

Valve объявила победителей премии Steam Awards 2025

Инженер Anthropic рассказал, как выжать максимум из Claude Code

Rain привлекла $250 млн и достигла оценки почти в $2 млрд

Ripple получила регистрацию FCA для криптоопераций в Великобритании

Колумбия обяжет криптобиржи отчитываться перед налоговой

Meta договорилась о поставках до 6,6 ГВт атомной энергии для ИИ-инфраструктуры

Bloomberg: объем платежей в стейблкоинах может достичь $56 трлн к 2030 году

Как защитить печень и почки от негативного влияния лекарств

Kawasaki готовит к выпуску водородного робо-коня

TCL представила точку доступа 5G Mobile WiFi P50 и домашний маршрутизатор WiFi Router BE36

«Яндекс» раскрыл данные об использовании нейросетей на базе технологии Alice AI и умных устройств в 2025 году

Хорошие новости для геймеров: KDE Plasma больше не будет переходить в спящий режим, пока используется игровой контроллер

Перестаньте говорить "алло": главные ошибки в телефонном разговоре

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA