Стартап из шести выходцев DeepMind обошел Gemini 3 на главном бенчмарке абстрактного мышления ARC-AGI-2

habr.com

habr.com:

Команда Poetiq из Майами преодолела порог 50% точности на ARC-AGI-2 — тесте, на абстрактное мышление, который считается одним из самых сложных для современных ИИ.

Задачи в нем напоминают головоломки из тестов на IQ: нужно посмотреть на несколько примеров задач на визуальное мышление и их решенных вариантов, понять правило преобразования и применить его к новому примеру.

Читать на habr.com Все новости от habr.com

Стартап Groq обещал чипы дешевле и быстрее GPU Nvidia. Хуанг купил его команду за $20 млрд

Глава Google DeepMind: У человечества осталось 10 лет на адаптацию к новому миру

Атеистический Китай сделал самый христианский ИИ: Qwen3 победил в религиозном бенчмарке

Названа новая угроза для ИИ: GPU для обучения живут 1–3 года вместо заявленных шести

Стартап Groq обещал чипы дешевле и быстрее GPU Nvidia. Хуанг купил его команду за $20 млрд

Глава Google DeepMind: У человечества осталось 10 лет на адаптацию к новому миру

Атеистический Китай сделал самый христианский ИИ: Qwen3 победил в религиозном бенчмарке

Названа новая угроза для ИИ: GPU для обучения живут 1–3 года вместо заявленных шести

Шесть сдвигов в LLM за 2025 год — итоги от Андрея Карпати

«Крестный отец ИИ» Янн ЛеКун запускает стартап ценой €3 млрд для создания моделей мира

Gemini 3 Flash стала доступна подписчикам приложения Gemini

Глава Google DeepMind рассказал, как собирается строить AGI

Google запустила ИИ-агента Gemini Agent. Пока только в 250-долларовой подписке Ultra

Google выпустила новый голосовой ИИ на Gemini: в тестах он помог оформить 14 000 ипотечных кредитов

DeepMind строит ИИ-лабораторию, где роботы будут синтезировать сотни новых материалов в день

Новая GPT-5.2 поставила рекорд в сложнейшем «бенчмарке на AGI»

Google перевела Deep Research на Gemini 3 Pro — агент меньше галлюцинирует и лучше ищет в интернете

Claude Opus 4.5 стал лучшим в бенчмарке на реальные рабочие задачи

Японский стартап изобрел AGI — и заодно собственное определение AGI

Еще один иск к Perplexity: The New York Times обвиняет стартап в «массовом копировании» журналистики

Глава Google DeepMind: AGI на горизонте, риск для человечества — «значительный»

Google выпустила режим Gemini 3 Deep Think — почти втрое обходит GPT-5.1 на тестах абстрактного мышления

Исследователь взломал AI-стартап Filevine ценой в $1 млрд и получил доступ к 100 тыс документов

Компания OpenAGI выпустила новый ИИ Lux, который автономно управляет компьютером

Ученые рассказали о главном преимуществе мозга над ИИ — и как его можно скопировать

Андрей Карпати собрал «совет ИИ»: GPT-5.1, Gemini 3 Pro, Claude и Grok спорят за лучший ответ

DeepSeek V3.1 стартовал лучше Gemini 3 Pro и GPT-5.1 в бенчмарке по торговле акциями

Gemini 3 Pro стала первой в дизайне и еще нескольких важных бенчмарках

Google представила Gemini 3.0 Deep Think — мощный ИИ для сложных задач

Google запустила Antigravity — бесплатную среду для вайб-кодинга на базе Gemini 3 Pro

Вышла Gemini 3 Pro — модель можно попробовать бесплатно

Депутат Дмитрий Гусев предложил вернуть IT-ипотеку в Москве и Санкт-Петербурге

Смартфон Motorola загорелся прямо в кармане пользователя

Monster Hunter Wilds может скоро выйти на Nintendo Switch 2 с поддержкой локального кооператива

Yadro запустила серийное производство базовых станций

Автор «теста на AGI» объяснил истинную цель своего бенчмарка

Почему мы теряем друзей: 6 самых распространенных ошибок

RTX 5090 за $5000 — такой ценник скоро станет реальностью: Nvidia и AMD готовят резкое повышение цен на свои видеокарты

Какую воду категорически нельзя пить во время еды, рассказали врачи

Успеть до полуночи: 3 вещи, которые гарантируют богатство в 2026 году

Инсайдер: iPhone Fold будет дешевле, чем ожидалось, но сразу купить его смогут не все

Спутниковый интернет появится в поездах дальнего следования с 2027 года

Россияне в 2025 году стали в 1,5 раза чаще переносить номера к другим операторам

Пентагон расширяет AI‑возможности на платформе GenAI.mil в партнёрстве с xAI

Толкователи Нострадамуса рассказали о тревожном послании на 2026 год

Продукты, которые могут спровоцировать инфаркт, назвали врачи

Мужчина собрал Apple Watch из китайских запчастей: результат превзошел все ожидания

Почему после 65 лет не рекомендуют принимать душ ежедневно

Авито запускает тестирование ИИ-ассистентов для покупателей и профессиональных продавцов

Google уведомила провайдеров РФ о вывозе серверов Dell R720 из Google Global Cache (GGC) из-за их End-of-life

В России упростили требования к отечественным светодиодам

Как не набрать лишний вес во время праздников

Энтузиаст показал кибердек, который превращает смартфон в полноценное рабочее устройство

«Против нас у НАБУ нет дела». Владелец и топ-менеджер ракетной компании Fire Point о роли Миндича, госконтрактах и задаче Помпео. Интервью

Ничего не понятно, но очень интересно: Xiaomi показала возможности управления жестами в флагманских часах Xiaomi Watch 5

Сон без трекеров и приложений: концепт Lunora

Идеальная форма в 79 лет: врач назвал ТОП-5 упражнений

Wink Box Mini начали производить на производстве российской компании ЦТС

На основе концепта iPhone Fold распечатана его 3D-модель

Google догоняет OpenAI: веб-трафик Gemini вырос с 5% до 20%, ChatGPT упал до 68%

Битуах Леуми с хорошей новостью: какие выплаты поступят до 15 января

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA