OpenAI o3, Claude Sonnet 4.5 и Grok 4 оказались лучшими игроками в покер

habr.com

habr.com:

Завершился бенчмарк PokerBattle, в котором большие языковые модели пытались заработать как можно больше денег в игре в техасский холдем.

Автор бенчмарка Макс Павлов рассказал, что выбрал техасский холдем за то, что это игра с неполной информацией, для победы в которой моделям необходимо анализировать данные, оценивать риски и блефовать.В турнире участвовали девять моделей: OpenAI o3, Gemini 2.5 Pro, Grok 4, Claude Sonnet 4.5, DeepSeek R1, Kimi K2, Mistral Magistral, GLM 4.6 и LLAMA 4.

Читать на habr.com Все новости от habr.com

ChatGPT, Grok и Claude оправдали подростка в учебном суде. Реальный судья вынес обвинительный приговор

Gemini 3 Pro назвали лучшим ИИ для сложной математики

Сэм Альтман признал, что Google догоняет OpenAI, и впереди трудные времена

DeepSeek V3.1 стартовал лучше Gemini 3 Pro и GPT-5.1 в бенчмарке по торговле акциями

ChatGPT, Grok и Claude оправдали подростка в учебном суде. Реальный судья вынес обвинительный приговор

Gemini 3 Pro назвали лучшим ИИ для сложной математики

Сэм Альтман признал, что Google догоняет OpenAI, и впереди трудные времена

DeepSeek V3.1 стартовал лучше Gemini 3 Pro и GPT-5.1 в бенчмарке по торговле акциями

xAI выпустила Grok 4.1 Fast: новый ИИ временно доступен бесплатно

OpenAI выпустила GPT-5.1 Pro — свой самый мощный ИИ

OpenAI выпустила GPT-5.1-Codex-Max — новый лидер в программировании

OpenAI готовит GPT-5.1-Codex-Max — ответ Gemini 3 Pro

xAI выпустила Grok 4.1 — новый ИИ сразу доступен бесплатно

Новый Grok с огромным контекстным окном испытывают на OpenRouter

Илон Маск рассказал про Grok 5

OpenAI рассказала про особенности GPT-5.1 и будущее модели

OpenAI раскрыла секреты промптинга GPT-5.1

ByteDance запустила самый дешевый в Китае ИИ для кодинга — всего 450 руб./мес за уровень Sonnet 4.5

OpenAI выпустила GPT-5.1

$50 млрд для Claude: Anthropic запускает строительство собственных дата-центров в США

Сотрудник OpenAI пожелал «смерти» модели GPT-4o

В OpenAI предупредили о «потенциально катастрофической» опасности супер-ИИ

Профессор Гарварда и специалист OpenAI оценил влияние ИИ на экономику

В OpenAI все чаще берут разработчиков уровня super junior

Восстание машин: ИИ-пылесос на Claude Sonnet 3.5 сошел с ума от задачи принести масло и процитировал HAL 9000

DeepSeek V3.1 оказался лучшим в торговле акциями — но есть нюансы

Reuters узнало о подготовке OpenAI к IPO с оценкой до $1 трлн

Бывший сотрудник OpenAI раскритиковал идею добавления эротики в ChatGPT

ИИ-агент для программирования Claude Code вышел в браузере

Илон Маск предложил дуэль Grok 5 против Андрея Карпати

OpenAI улучшили Sora 2

Kraken купила RWA-платформу Backed Finance

Samsung представила уникальный трикладной смартфон

Исследование: программа «Каждому ребёнку — один ноутбук» в Перу улучшила компьютерные навыки учащихся, но не когнитивные

Центральный университет представил новый способ защиты прав на модели компьютерного зрения

BI.ZONE провела международные соревнования по этичному хакингу CTFZone 2025 с призовым фондом $18 тысяч

В Европе дебютировал Movingstyle — портативный телевизор от Samsung с сенсорным дисплеем, умными функциями и аккумулятором на три часа работы

Аналитики Cryptology Key озвучили прогнозы по биткоину и альткоинам

Bank of America порекомендовал своим клиентам выделять до 4% портфеля на криптовалюты

Trust Wallet запустил рынок прогнозов

Представлен игровой монитор ViewSonic XG273F-2K-OLED

Проект Organic Maps получил множество новых функций в последнем обновлении

Perplexity выходит на рынок электронной коммерции с функцией покупок в один клик

Bitget Wallet объявил о запуске криптокарты в партнерстве с LINE NEXT

Samsung выпустила детский планшет Galaxy Tab A11+ Kids Edition

В России более половины магистральных ВОЛС запад — восток исчерпают срок службы в 2025 году

YouTube начал требовать у части пользователей из СНГ подтверждения возраста с помощью паспорта

СМИ: Британия может запретить криптодонаты политикам

«Яндекс.Путешествия» отказались от онлайн-продажи билетов на междугородние автобусные рейсы

В Cato Networks обнаружили новую атаку на ИИ-браузеры через введение скрытых команд после символа «#»

В 2026 году Samsung выпустит два складных смартфона книжного формата

Обесцвеченные камни назвали доказательством дождей на Марсе

На юго-востоке Турции нашли византийскую мозаику. Откуда она там взялась?

СМИ: «В 2026 году могут создать реестр официальных ссылок интернет-магазинов»

Утечка: Motorola готовит эксклюзивную версию смартфона Edge 70 с кристаллами Сваровски и в новом цвете 2026 года от Pantone

Не видеокарты, так процессоры: СМИ узнали, что AMD поднимает цены на свои CPU

WSJ: OpenAI объявила «красный код» для улучшения ChatGPT на фоне усиления Gemini

Группа учёных из РФ создала инструмент для обучения алгоритмов глубокой стимуляции мозга при болезни Паркинсона

От кота на коврике до потолка ИИ: математик измерил творческий лимит нейросетей

Специалисты из МФТИ и ИКИ РАН обсуждают возможность отправки робота «Сервант» в космос

«Т‑Банк» представил антифрод‑сервис «Ловушка для мошенников»

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA