Главный критик LLM почти похвалил Claude Mythos. Почти

habr.com

habr.com:

Гэри Маркус, один из самых известных критиков современного ИИ, неожиданно мягко прокомментировал свежие результаты Claude Mythos на бенчмарке METR.

На последнем замере модель Anthropic показала горизонт автономной работы 16+ часов при 50%-вероятности успеха и 3 часа при 80% — это вдвое больше ближайшего конкурента.

Читать на habr.com Все новости от habr.com

ИИ помог Папе Римскому написать манифест об опасности ИИ. Исследователи подозревают Claude

Anthropic отучила Claude врать клиентам — и он стал зарабатывать вдвое меньше

Claude Mythos выйдет в ближайшие недели — модель круче Opus наконец-то откроют для всех

Claude Code научился запускать сотни ИИ-агентов — и за дни закрывать задачи, на которые раньше уходил квартал

ИИ помог Папе Римскому написать манифест об опасности ИИ. Исследователи подозревают Claude

Anthropic отучила Claude врать клиентам — и он стал зарабатывать вдвое меньше

Claude Mythos выйдет в ближайшие недели — модель круче Opus наконец-то откроют для всех

Вышел Claude Opus 4.8 — модель в 4 раза реже пропускает свои же баги

«Opus 4.7 подсматривает ответы!»: Datacurve раскритиковала бенчмарк SWE-Bench Pro — и выпустила свой

Один Claude пишет, другой проверяет: в Claude Code появился поиск уязвимостей в реальном времени

«Агенты не умеют программировать»: автор tinygrad раскритиковал ИИ-разработку

«Можете называть это DeepSeek Code»: китайская компания готовит клон Claude Code

«Все, кто внутри, понимают — это фейк»: TechCrunch вскрыл главную уловку AI-индустрии

NVIDIA зарабатывает почти миллиард долларов в день — «продавец лопат» ставит рекорд за рекордом

Андрей Карпати присоединился к Anthropic — сооснователь OpenAI теперь работает в ее главном конкуренте

Cloudflare натравила Claude Mythos на свой код — и перестроила процесс поиска багов

Claude Mythos написал 18 рабочих эксплойтов для Chrome. Остальные ИИ — ноль

Новый чекпоинт Claude Mythos взламывает защиту электростанции в 3 из 10 попыток

Андрей Карпати: главная проблема LLM — в том, как они отвечают

С Claude Mythos команда Firefox за апрель закрыла больше уязвимостей, чем за весь 2025-й

Anthropic арендует Colossus у xAI: лимиты Claude Code удваиваются

Программирование решено, дальше — циклы: создатель Claude Code о будущем ИИ-кодинга

Докинз увидел сознание в Claude. Маркус ответил критикой

Внутренний CLAUDE.md Apple утек в сеть: видно, как компания использует ИИ в поддержке

Архив, на котором учились ChatGPT, Claude и DeepSeek, попал под атаку 20 крупных издателей

Всего 20 минут и $12: как исследователь отравил передовые LLM несуществующими данными

«ИИ развивается «удивительно медленно»» — главный ученый OpenAI пообещал чрезвычайное ускорение

Claude подключили к Spotify, Uber и Booking.com

Лауреат премии Тьюринга: Claude Mythos нельзя оставлять под контролем Anthropic

Anthropic назвала причины «отупения» Claude Code

Amazon вложит $25 млрд в Anthropic: Claude получит 5 ГВт мощностей

11 признаков, показывающих, что родители любили вас всей душой

Дневной сон может спровоцировать опасные болезни - ученые

Секрет в миске — что собака знает о вас раньше вас самих

MSI представила игровой QD-OLED-монитор 31,5" с тремя режимами работы

GNOME Circle не будет принимать приложения, созданные с использованием ИИ

Стартап Shift предлагает наводить порядок дома в обмен на данные для обучения роботов

Почти официально: Tomb Raider: Legacy of Atlantis не выйдет в 2026 году — утечка на Amazon раскрыла планы разработчиков

Забудьте о плитке – почему наливные полы стали хитом интерьеров

Секрет шеф-поваров – как приготовить идеальный омлет

Asus представила юбилейную консоль ROG Xbox Ally X20 с OLED-экраном и процессором Ryzen AI Z2 Extreme

В кибербез‑компании «С‑Терра» сменилась вся команда топ‑менеджеров после перехода под контроль «Ростеха»

Представлен открытый проект FluentCleaner (аналог CCleaner) для очистки ПК на Windows 10/11 от ненужных компонентов

Техдолг под капотом ИИ-бума: код пишется быстро, чинится долго

Главные изменения в теле после отказа от мяса – эксперты

Asus представила юбилейный мини-ПК ROG NUC 16 Edition 20 с RTX 5090 и 128 ГБ оперативной памяти

Оттенок выживания – раскрыт самый безопасный цвет купальника

Ученые случайно открыли новую землю из-за шторма

Corsair представила Warthog — переосмысление легендарного стального корпуса для PC в виде ящика для патронов

GIGABYTE презентовала флагманскую серию мониторов AORUS ELITE с 27” трехрежимной Mini LED-моделью и четырьмя OLED-дисплеями

Возраст потери девственности влияет на старение – что узнали ученые

Конец человечества за 4 дня из-за ИИ – эксперимент ученых

Asus показала один из самых красивых настольных ПК 2026 года: стильный корпус с отделкой под дерево и мощное железо

Секреты стюардесс – названы лучшие места в самолете

О чем молчат консультанты – 3 минуса QLED-телевизоров

Грег Кроа-Хартман: Rust спасет Linux от ошибок C

NASA тестирует «космический туалет» будущего: как превратить отходы в еду и стройматериалы

Драматичный сюжет, живой мир и высочайшая детализация: представлена гонка Clutch от создателей серии Forza Horizon

Sony представила 4K-камеры с ИИ: теперь оператор может вообще не понадобиться

Гигант в карманном формате: представлен ASUS Ascent QN10 — первый в мире мини-PC на чипе Snapdragon X2 Elite с мощностью 80 TOPS

Бывший повар Елизаветы II раскрыл суеверную тайну королевы

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA