Разработчик запустил PokerBattle — бенчмарк, в котором LLM играют в техасский холдем: лидирует Gemini 2.5 Pro

habr.com

habr.com:

Разработчик Макс Павлов запустил бенчмарк PokerBattle, в котором популярные языковые модели играют в техасский холдем и пытаются как можно больше заработать на этом.

Турнир начался 27 октября, а завершится — 31 октября. По итогам автор проекта подготовит подробную аналитику с обзором интересных решений и ходов.В турнире участвуют девять языковых моделей: Gemini 2.5 Pro, Grok 4, Claude Sonnet 4.5, DeepSeek R1, OpenAI o3, Kimi K2, Mistral Magistral, Z.AI GLM 4.6 и Meta LLAMA 4.

Читать на habr.com Все новости от habr.com

Google запустила Antigravity — бесплатную среду для вайб-кодинга на базе Gemini 3 Pro

«Яндекс» запустил «Промптхаб» — платформу с идеями, как применять нейросети

Gemini 3.0 Pro показала сильный прогресс в сложных бенчмарках

Вышла LibrePods — утилита, которая разблокирует функции AirPods на Android и Linux

Google запустила Antigravity — бесплатную среду для вайб-кодинга на базе Gemini 3 Pro

«Яндекс» запустил «Промптхаб» — платформу с идеями, как применять нейросети

Gemini 3.0 Pro показала сильный прогресс в сложных бенчмарках

Вышла LibrePods — утилита, которая разблокирует функции AirPods на Android и Linux

Netflix запустил линейку транслируемых по ТВ игр, в которые можно играть, используя смартфон в качестве контроллера

ByteDance запустила самый дешевый в Китае ИИ для кодинга — всего 450 руб./мес за уровень Sonnet 4.5

Вышел анализ влияния ИИ на рынок труда в США: ML-инженеры растут, разработчики ПО в безопасности

Китайская компания Insta360 дарит своим лучшим разработчикам кейкапы из золота

Разработчик DeepSeek предупредил о риске увольнений из-за ИИ

На macOS теперь можно запустить пропатченную iOS-версию Fortnite

Вышла библиотека Any Language Model, с её помощью можно использовать любые LLM в Foundation Models

Разработчики СhatGPT запросили финансовые гарантии у властей США

В OpenAI все чаще берут разработчиков уровня super junior

100 лучших игр от PC Gamer: на первом месте Baldur's Gate 3

«Яндекс» запустил программу лояльности «Свои Плюсы»

Разработчик рассказал, как его чуть не взломали на фейковом собеседовании по программированию

Google предоставила разработчикам в API Gemini данные из «Карт»

Orange Pi анонсировала плату 4 Pro — альтернативу Raspberry Pi 5 с 16 ГБ LPDDR5 и NPU

Apple представила Vision Pro с чипом M5

Пользователи жалуются, что оранжевые iPhone 17 Pro начали менять цвет

Apple представила MacBook Pro и iPad Pro на чипе M5

Google запустил ИИ-поиск в России

Андрей Карпатый представил nanochat — проект полного цикла создания LLM всего за 100 долларов

Пользователи Reddit нашли незаметные водяные знаки на картинках, сгенерированных в Gemini

Anthropic запустила плагины для Claude Code

Google расширяет ежемесячную подписку для разработчиков и запускает локализованную версию для Китая

В Android Studio тестируют генерацию интерфейсов по скриншотам с помощью Gemini

Команда ApeX Protocol объявила об интеграции Chainlink Data Streams

Идеальные комбинации: что есть на завтрак, обед и ужин для улучшения здоровья

5D-циркуляция и квадратная форма: вентилятор от Foshan Perfect

xAI и Anthropic-Amazon первыми построят дата-центры рекордной мощности 1 ГВт

Релиз qBittorrent 5.1.3

Вышла интегрированная среда разработки Apache NetBeans 28

Смартфон Moto G76 5G протестирован в Geekbench

HierarchicalTopK открывает новый подход к интерпретируемости нейросетей

Компания Джеффа Безоса успешно запустила ракету со спутниками НАСА

Выключение смартфона при пересечении границы Калининградской области поможет пассажирам поездов избежать блока СИМ-карты

Ждем Doom внутри Gemini? Google готовит «креативный холст» для своего чат-бота

SoftBank продала весь пакет акций Nvidia за $5,83 млрд

Представлены сверхкомпактные мини-PC Thunderobot Mix NUC с процессорами Ryzen AI в корпусе на 0,68 литра

Пять популярных завтраков, которые повышают стресс в организме утром

В МЭИ создали онлайн-платформу для моделирования спутниковых систем «Поток»

Минобороны обяжет IT-компании уведомлять военкоматы в течение пяти дней после увольнения сотрудника

BIM на стройке: Sminex поделился опытом внедрения строительной информационной модели на форуме 100+ TechnoBuild

Offline Guardant Meetup в Санкт-Петербурге уже на этой неделе

Где на Марсе могут обитать инопланетяне - новое исследование ученых

Какие препараты категорически нельзя сочетать с чаем

«Крестный отец ИИ» Янн ЛеКун планирует уйти из Meta* и запустить свой стартап

Как глубокие вдохи восстанавливают работу легких: новое исследование

Министерство Великобритании завершило обновление своего парка ПК до Windows 10 после прекращения поддержки ОС

Как масштабироваться в Kubernetes автоматически и экономически выгодно

7 признаков хронического стресса: тело уже подаёт сигналы

Blue Origin совершила второй запуск New Glenn и отправила миссию ESCAPADE на Марс

Причину постоянной усталости назвали ученые

Mercedes-AMG прекратит производство некоторых из своих самых громких автомобилей из-за новых стандартов ЕС, — СМИ

Unitree представила своего первого колесного гуманоидного робота G1-D для сбора данных и обучения ИИ

Мы выпустили приложение ГигаЧат для владельцев iOS-устройств

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA