Новая Gemini 3 Deep Think обогнала среднего человека в «тесте на AGI»»

habr.com:

Google DeepMind выпустила крупное обновление Gemini 3 Deep Think — режима глубоких рассуждений, заточенного под научные и инженерные задачи.

Главная цифра: 84,6% на бенчмарке ARC-AGI-2, который тестирует способность учиться решать абстрактные задачи, не встречавшиеся в обучающей выборке.

Читать на habr.com Все новости от habr.com

Gemini 3 Flash поставили управлять кафе. Она прокричала «погнали!» 574 раза и обанкротилась

Вышла GPT-5.3 Instant: меньше отказов и морализаторства. Thinking и Pro — следом

В 3-4 раза дешевле и быстрее Claude 4.5 Haiku: вышла Gemini 3.1 Flash-Lite

В Лондоне на марш против ИИ пришло до 500 человек

Gemini 3 Flash поставили управлять кафе. Она прокричала «погнали!» 574 раза и обанкротилась

Вышла GPT-5.3 Instant: меньше отказов и морализаторства. Thinking и Pro — следом

В 3-4 раза дешевле и быстрее Claude 4.5 Haiku: вышла Gemini 3.1 Flash-Lite

DeepSeek V4 ожидается до конца недели. По слухам, модель будет полностью мультимодальной

OpenClaw обогнал React и стал самым популярным программным проектом на GitHub — 250K звезд за четыре месяца

«Встречные санкции»: DeepSeek закрыл Nvidia доступ к V4 и отдал приоритет Huawei

«Украли у воров»: Маск высмеял Anthropic за обвинения в адрес DeepSeek, Moonshot AI и MiniMax

Anthropic объяснила, почему ИИ ведет себя как человек — и почему иначе не получится

Claws — новый слой ИИ-стека. Карпати оценил OpenClaw и его конкурентов

DeepSeek научили диагностировать редкие заболевания точнее врачей

Новый DeepSeek Moment: как Anthropic обрушила акции кибербезопасности

Google выпустила Gemini 3.1 Pro — лучший ИИ в большинстве бенчмарков

Gemini 3.1 Pro создала интерфейс Windows 11 с одного промпта

OpenAI заявила о 6 решениях из 10 в «самом сложном тесте для ИИ». Математики не согласны

OpenAI пожаловалась на DeepSeek властям США: дистилляция через роутеры, реселлеров и код

ИИ перестал показывать, что делает: разработчики жалуются на новую версию Claude Code

DeepSeek обновился — в чате модель называет себя «предрелизной версией V4»

DeepMind открыла код AlphaGenome — ИИ, который читает миллион букв ДНК за раз

Claude Opus 4.6 обошел человека в «тесте на AGI». Но это только начало

Cursor показал, как 1000 ИИ-агентов пишут код без человека

Нейро-символические циклы и «параллельное мышление»: Google раскрыл методы работы Gemini в науке

Роботакси Waymo сбило ребенка — компания утверждает, что человек справился бы хуже

Grok 4 провалил тест на распознавание ненависти. Claude — лучший

Gemini 3 научили вглядываться в изображения как человек

Kimi K2.5: новый бесплатный ИИ с режимом «рой агентов»

Qwen3-Max-Thinking прокачали в бенчмарках и добавили в Claude Code

Глава DeepMind призвал к появлению «новых великих философов» — они понадобятся после AGI

Кардиолог назвал ингредиент сэндвичей, который "убивает" здоровье

Apple могла отказаться от выпуска складного iPhone в форм-факторе «флип»

Дефицит какого витамина повышает риск тяжелых инфекций

Energizer P30K Apex: 30 000 мА/ч пауэрбанк, который научили звонить и снимать на 200 МП

Объем торгов фьючерсами на Binance в несколько раз превысил показатели спотового рынка

ФАС признала рекламу в Telegram незаконной

Anthropic запустила программу амбассадоров Claude

Звезда-мигрант? Ученые выяснили откуда прилетело Солнце

Ученые считают, что 3I/Atlas может быть насыщена спиртом

Samsung открывает One UI 8.5 Beta для Galaxy Z Fold7 и Flip7: новые возможности и риски

Золото, бриллианты и немного пикселей: Dreame показала, как должны выглядеть ультрапремиальные смартфоны

Зовём инженеров на DBA-митап 27 марта

М.Видео: продажи портативных медиаплееров выросли на 83% в 2025 году

CEO VanEck назвал биткоин-майнеров перспективным сектором из-за бума ИИ

В 2026 году Microsoft перевыпустит на Xbox “культовые классические игры”

Bitget представила GetClaw — автономного ИИ-агента для торговли без необходимости установки

Прокуроры призвали отклонить просьбу Бенкмана-Фрида о новом судебном процессе

Meta* приобрела Moltbook — первую соцсеть для ИИ-агентов

В Красноярске завершился Суперкубок Национальной студенческой лиги компьютерного спорта

В Autodesk Flow Studio появились инструменты для генерации 3D-объектов

Джефф Дин против Пентагона: главный учёный Google поддержал Anthropic в суде

Учёные МИСИС запатентовали алюминиевый сплав с высокой сочетанием прочности и пластичности

Мартовский календарь вебинаров

Минцифры готовит законопроект о праве отказаться от обслуживания с использованием ИИ

ФАС: при блокировке YouTube, VPN-сервисов, Telegram и WhatsApp* реклама там будет запрещена

Не PS5 Pro, но играть можно: блогер протестировал десять игр на MacBook Neo и получил неплохие результаты

Мозги в серверной: Cortical Labs строит первые в мире биологические дата-центры

В Индии задержали фигуранта дела о криптомошенничестве на $800 млн

СМИ: Ripple Labs планирует выкуп акций при оценке в $50 млрд

Apple выпустила обновление для старых iPhone и iPad, исправляющую сложную уязвимость

Больше новостей