Представлен бенчмарк, в котором ИИ разгромно проигрывают человеку

habr.com

habr.com:

В бенчмарке СlockBench на чтение времени с часов со стрелками лучшая модель (Gemini 2.5 Pro) справилась лишь с 13,3% вопросов, в то время как люди правильно ответили на 89,1% вопросов.Всего в датасет бенчмарка включили 36 разных типов циферблатов, на каждом по 5 разных положений стрелок — получилось 180 комбинаций, к каждой из которых задавали по четыре вопроса.

В первую очередь предлагалось прочитать время и отметить, валидно ли оно — в датасете были примеры, где положение часовой и минутной стрелок не согласовывалось между друг другом (например, если минутная стрелка показывает 20 минут, то часовая должна пройти треть пути).

Читать на habr.com Все новости от habr.com

Представлен проект PSXTG — эмулятор PlayStation (PS1) в Telegram

Представлен игровой монитор MSI MAG 272QP QD-OLED X24

Представлен дистрибутив elementary OS 8.0.2

Представлен 4K-телевизор Hisense E7Q Mini LED

Представлен проект PSXTG — эмулятор PlayStation (PS1) в Telegram

Представлен игровой монитор MSI MAG 272QP QD-OLED X24

Представлен дистрибутив elementary OS 8.0.2

Представлен открытый проект Tunn — оболочка для OpenSSH для упрощения управления несколькими SSH-туннелями

Представлен флагманский маршрутизатор Xiaomi BE10000 Pro с 12 антеннами

Представлен компакнтный флагманский смартфон Xiaomi 17

Амбициозная экшен-RPG Crimson Desert выйдет в марте 2026 года — представлен эпичный трейлер

Honor X9d 5G представлен с батареей 8300 мАч и сертификацией IP69K

Представлен выпуск СУБД DuckDB 1.4.0

Представлен план развертывания HyperOS 3: узнайте, когда ваш гаджет получит новую прошивку (список)

Grok 4 и GPT-5 стали лучшими в финансовом бенчмарке. Но люди пока впереди

Представлена GPT-5-Codex — новая модель, которая автономно программирует до 7 часов

Представлен ИИ, который может существенно ускорить разработку лекарств

Лучше Google Nano Banana. Представлен ИИ для создания картинок Seedream 4

Представлен смартфон iPhone 17 с 6.3-дюймовым дисплеем Super Retina XDR

Представлен самый тонкий смартфон Apple, именуемый iPhone Air

Лучше Сlaude Opus 4. Представлен Qwen3-Max-Preview

Представлен концепт Flipper OS — операционной системы для Flipper One

Конкурент Porsche Taycan: электрический GT Polestar 5 представлен официально

Представлен Oukitel WP60 — огромный защищенный смартфон с отличными камерами и аккумулятором на 10 000 мАч для работы в экстремальных условиях

Представлен проект «Quake III Arena в браузере»

Представлен изогнутый ультраширокий монитор Lenovo ThinkVision P40WD-40

ТОП-5 фраз, которые выдают токсичного человека - держитесь от таких подальше

Grok Code Fast 1 представлен официально. ИИ можно попробовать бесплатно

Google представила новый ИИ для создания картинок. Он обходит GPT Image в 6 из 7 бенчмарков

«Самый важный бенчмарк». GPT-5 прошла Pokemon Crystal быстрее других ИИ

Каким получился обновленный DeepSeek — скорость и дешевизна вместо бенчмарков

Чем полезны грибы для организма - ответ врача

Во всех новых iPhone улучшили фронтальную камеру: детали

Опасные виды головной боли назвали врачи

Ученые назвали вирус, которым инфицированы почти все люди на планете

Определена десятка самых продаваемых смартфонов в мире по итогам квартала

BOE выпустила усовершенствованный дисплей ADS Pro (IPS LCD) для смартфонов

Сборник Mortal Kombat: Legacy Kollection дебютирует 30 октября — фанатам файтингов и ретро-игр не стоит пропускать этот релиз

Какой шоколад полезнее для здоровья – ответ диетологов

Украинец открыл новую комету SWAN25B и она уже удивила астрономов своей яркостью

Фотомаркетинг Apple iPhone 17: почему три равно восьми и что такое "оптическое качество"

Продукты, улучшающие работу мозга, назвали диетологи

Названы десять самых быстрых реактивных самолетов

ТОП-5 способов бороться со стрессом

Roblox запускает аналог TikTok и новые инструменты на основе ИИ

Крутые фото гарантированы: новейший флагман OPPO Find X9 Pro получит впечатляющий набор камер, среди которых 200 МП перископический сенсор

Зевота может указывать на опасные болезни – эксперты

Claude научили создавать и редактировать файлы

Снятым с продажи 30-ваттным адаптером Apple комплектуется 2 устройства

"Боже мой, нас бомбят": огромный кабан ворвался в дом и атаковал хозяина и его собаку (ВИДЕО)

Yandex Cloud проведёт 24 сентября 2025 года конференцию Yandex Neuro Scale 2025

Мир науки потрясен: ученые нашли древнейшие окаменелости в истории

Появились подробности об экране смартфона Samsung Galaxy S26 Ultra

Кошка, которую считали мифом, реально существует (ВИДЕО)

В «Лаборатории Касперского» пояснили, что Max даже несколько «отстаёт» по своим «аппетитам» от других мессенджеров

“Революция зумеров” в Непале: дебаты в Discord и выбор главы правительства с помощью ChatGPT

Новый взгляд на происхождение жизни на Земле: инопланетяне или абиогенез

В Южной Корее одиноким пенсионерам выдают «робовнуков» с ChatGPT

Apple Watch Series 11: 24 часа автономной работы оказались игрой с цифрами

Почему мы до сих пор одиноки: ученые объяснили, где могут "прятаться" инопланетяне

СМИ: в Непале протестующие использовали ChatGPT для выбора премьер-министра

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA