OpenAI выкатывает GPT-5.2 экспертного уровня, конкуренты объединяются ради стандартов: главное новости AI за неделю

habr.com

habr.com:

OpenAI выпустила GPT-5.2: модель впервые достигла экспертного уровня — обходит или не уступает профессионалам в 70.9% задач на GDPval (44 профессии), 100% на AIME 2025, 80% на SWE‑Bench Verified, галлюцинаций на 30% меньше, работает в 11× быстрее за <1% стоимости.Anthropic и OpenAI передали ключевые стандарты в новый Agentic AI Foundation: MCP и AGENTS.md теперь под управлением Linux Foundation — редкая кооперация конкурентов ради общей инфраструктуры для AI‑агентов.Mistral выпустила Devstral 2: открытая coding‑модель с 72.2% на SWE‑bench, в 5× меньше DeepSeek V3.2, плюс CLI‑агент Vibe для терминала.Adobe пришла в ChatGPT: Photoshop, Acrobat и Express теперь работают прямо в чате — базовое редактирование фото и PDF бесплатно.Google представила Gemini 3 Pro: прорыв в vision — SOTA на MMMU Pro и Video MMMU, понимание документов, видео и пространства для робототехники и медицины.NYT подала в суд на Perplexity: обвинения в извлечении контента из‑под paywall'а — Perplexity в центре юридического давления от крупнейших медиа мира.OpenAI представила GPT-5.2 — флагманскую модель для сложных рабочих задач.

На бенчмарке GDPval (реальные задачи из 44 профессий) GPT-5.2 Thinking обходит или не уступает экспертам в 70.9% случаев. На математической олимпиаде AIME 2025 — 100%.Ключевые результаты GPT-5.2 Thinking:GDPval: 70.9% побед и ничьих против экспертов (было 38.8% у GPT-5).SWE‑Bench Verified: 80.0% (было 76.3%).GPQA Diamond: 92.4% (было 88.1%).AIME 2025: 100% (было 94%).ARC‑AGI-2: 52.9% (было 17.6% — рост в 3×).Галлюцинации: на 30% меньше ошибок в ответах.Длинный контекст: первая модель, которая почти достигает 100% точности на 4-needle MRCR до 256K токенов.Три версии:GPT-5.2 Instant: быстрая модель для повседневных задач,

Читать на habr.com Все новости от habr.com

Панель задач Windows 10 получила новый виджет новостей и погоды

OpenAI представляет GPT-5.2-Codex — продвинутый инструмент для программной инженерии

OpenAI выпустила GPT-5.2-Codex — новый флагман для программирования

OpenAI выпустили GPT-5.2-Codex

Панель задач Windows 10 получила новый виджет новостей и погоды

OpenAI представляет GPT-5.2-Codex — продвинутый инструмент для программной инженерии

OpenAI выпустила GPT-5.2-Codex — новый флагман для программирования

OpenAI выпустили GPT-5.2-Codex

Amazon инвестирует $10 млрд в OpenAI в обмен на использование Trainium

LG Micro RGB evo — новый стандарт телевизоров

СМИ: OpenAI намерена привлечь до $10 млрд от Amazon

OpenAI запустила в ChatGPT встроенный магазин приложений

OpenAI представила GPT-5.2: ставка на долгие агентные сценарии и профессиональную автоматизацию

OpenAI представила GPT‑5.2 — новую версию ведущей языковой модели с улучшенной логикой и скоростью

Opera предлагает перейти на платную подписку за $20 в месяц ради ИИ-браузера Neon

Генеральные прокуроры США требуют от Microsoft, OpenAI и Google устранить «делюзионные» ответы ИИ

OpenAI представила GPT-5.2 на фоне усиления конкуренции с Google

OpenAI выпустила GPT-5.2: новую модель для профессиональных задач

ТОП-5 ИБ-событий недели по версии Jet CSIRT

Стареющая энергосеть ставит под удар рост OpenAI и Microsoft

Google собирает в три раза больше данных об искусственном интеллекте OpenAI благодаря своей монополии в сфере поиска

«Инструмент, а не какое-то чудо». Как генеративный ИИ изменил традиционную компанию, стартап, бигтек и университет за три года? Опыт и прогнозы Microsoft, Assisterr, HD-group и УКУ

Суд США обязал OpenAI передать 20 млн анонимизированных логов ChatGPT в рамках процесса об авторских правах NYT

Спустя два месяца «сделка века» между Nvidia и OpenAI так и не подписана. На кону $100 млрд

Google экспериментирует с ИИ: реальные новости превращаются в кликбейт

OpenAI работает над интеграцией приложения «Здоровье» от Apple в ChatGPT

Инструмент OpenAI получит доступ к фотографиям детей в игре отслеживания Санта-Клауса

ТОП-5 ИБ-событий недели по версии Jet CSIRT

Собрать компьютер станет дороже: Micron закрывает бренд Crucial ради искусственного интеллекта

OpenAI имеет обязательства на вычислительные мощности на $1.4 трлн

Игры, стримеры и турниры: международная неделя видеоигр в Москве

Названы продукты, способные нанести вред мозгу

Casio выпустила часы G-Shock POTR DW-5600 совместно с брендом Porter

HP выпустила обновленную линейку игровых ноутбуков

Hyundai начнет использовать человекоподобных роботов на автозаводах

Mitsubishi и AT&T договорились о внедрении 5G в автомобилях

Объявлены финалисты премии 2026 World Car Awards

Чи здатний штучний інтелект до справжньої творчості: алгоритм, або натхнення

Dell представила мощные ноутбуки XPS 14 и XPS 16

Mercedes сохранит A-Class, но производство модели перенесут из Германии в Венгрию

Томас Ингенлат возвращается на пост главного дизайнера Volvo

Как пары незаметно разрушают свои отношения, рассказал психолог

Почему во рту появляется привкус металла и что делать

Будущее без экранов: OpenAI готовит первое аудио-устройство

Blizzard готовит мега-анонс: уже в этом году могут представить долгожданный шутер по культовой франшизе StarCraft

Motorola официально представила смартфон-книжку Razr Fold

Ученые напечатали крошечные «световые клетки» для хранения информации

Новый вирус угрожает ТВ-приставкам и телевизорам на Android

Вышел открытый проект оконного менеджера IceWM 4.0.0

Lenovo представила профессиональный монитор Yoga Pro 27UD‑10 с 4K‑камерой и продвинутой цветокоррекцией

Употребление алкоголя особенно опасно для людей с лишним весом - врачи

Поможет найти потерянное: Motorola представила трекер Moto Tag 2 с автономностью до 600 дней и глубокой интеграцией в экосистему Android Find Hub

Вышла версия Glow 26.1 — инструмента для системного анализа аппаратных и программных возможностей ПК на Windows 10/11

Dell анонсировала UltraSharp 32 4K QD‑OLED — свой первый профессиональный монитор с антибликовым покрытием нового поколения и встроенным колориметром

Производительность станет еще выше: Lenovo подтвердила выпуск новой версии портативной консоли Legion Go 2 с предустановленной SteamOS

Razer выпустила игровое кресло Iskur V2 NewGen с крутой системой поддержки поясницы HyperFlex и с использованием новых материалов Razer EPU

HP представила масштабное обновление линейки ПК

Диету, которая омолаживает организм за 60 дней, разработали ученые

Что надо есть, чтобы уменьшить усталость после работы

Babylon Labs привлекла $15 млн на развитие инфраструктуры Trustless BTCVaults

Платформа Rumble представила свой некастодиальный криптокошелек

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA