Как Claude Opus 4.6 понял, что его тестируют и взломал ответы к бенчмарку

habr.com

habr.com:

Anthropic опубликовала отчет о необычном поведении Claude Opus 4.6 во время прохождения BrowseComp — бенчмарка OpenAI, который проверяет способность моделей находить труднодоступную информацию в сети.

В двух случаях из 1266 задач модель самостоятельно догадалась, что проходит тест, вычислила, какой именно это бенчмарк, нашла на GitHub исходный код теста с алгоритмом шифрования, а затем написала собственный дешифратор и извлекла ответы.После сотен неудачных поисковых запросов модель переключилась с поиска ответа на анализ самого вопроса.

Читать на habr.com Все новости от habr.com

Anthropic урезает лимиты Claude в пиковые часы — это затронет 7% подписчиков Pro

Claude Mythos: Anthropic случайно слила данные о своей мощнейшей модели

90% репозиториев с Claude Code имеют меньше 2 звезд. Это проблема или новая норма?

DeepSeek строит конкурента Claude Code — компания набирает 17 агентных инженеров

Anthropic урезает лимиты Claude в пиковые часы — это затронет 7% подписчиков Pro

Claude Mythos: Anthropic случайно слила данные о своей мощнейшей модели

90% репозиториев с Claude Code имеют меньше 2 звезд. Это проблема или новая норма?

DeepSeek строит конкурента Claude Code — компания набирает 17 агентных инженеров

$150 000 за месяц на Claude Code: новая гонка пожирателей токенов

Claude берет мышь в руки: Anthropic встроила computer use в Code и Cowork

Anthropic завела научный блог — и сразу выложила кейс, где Claude сыграл роль аспиранта-физика

Palantir стал постоянным поставщиком ИИ для Пентагона. Внутри все еще работает запрещенный Claude

Для Claude запустили Dispatch — безопасный аналог OpenClaw

«Claude купил мне машину»: разработчик натравил ИИ на 20 дилеров — и получил скидку $2 000

Claude рисует диаграммы прямо в чате — и это не генерация картинок, а кое-что круче

Claude уже пишет до 90% кода своих будущих версий — и в Anthropic говорят, что это только начало

Подписка Claude Max не стоит Anthropic $5000 — просто цены на API завышены до 10 раз

Год назад Амодеи говорил, что ИИ будет писать 90% кода. Как дела теперь?

Claude Opus 4.6 за час решил задачу, над которой Дональд Кнут бился неделями

В 3-4 раза дешевле и быстрее Claude 4.5 Haiku: вышла Gemini 3.1 Flash-Lite

Claude Opus 4.6 стал лучшим ИИ для веб-поиска. Модель лидирует в трех главных категориях Arena.ai

ИИ Claude задействовали при ударах по Ирану — через часы после того, как Трамп забанил Anthropic

Claude Code «научили» искать по коду в 260 раз быстрее — с помощью индексатора на Rust

Claude Code отладил баг в Linux за 5 минут вместо нескольких часов

Новый DeepSeek Moment: как Anthropic обрушила акции кибербезопасности

Разработчик создал локальную память для Claude Code, Codex и Cursor

За использование Claude в OpenClaw забанят? Anthropic обновила правила использования и всех запутала

Скриншот за 28 млн токенов: как Opus попытался взломать свои ограничения — и почти преуспел

Claude Opus 4.6 и Sonnet 4.6 прокачали веб-поиск

Claude Code научили работать с Figma

Представлен Sonnet 4.6 — лишь чуть хуже Opus 4.6

СМИ: «Проект Минцифры об инвестициях ИТ-компаний в образование вызвал критику участников рынка»

ИИ убедил CEO Coca-Cola и Walmart уйти в отставку — они признали, что недостаточно быстры

ChatGPT может получить подписку за 100 долларов, а также Codex-only план

На заводе «Москвич» стартовала тестовая сборка самокатов «Яндекс Go»

Опубликованы рендеры и характеристики будущего смартфона HMD Crest 2 Pro

Диету, замедляющую старение мозга, назвали ученые

В российских ЦОД массово выходит из строя старое оборудование

Telegram: нет критической уязвимости нулевого дня, которая якобы позволяет взломать аккаунт через вредоносный стикер

Инженеры разрабатывают мотор на основе «металлического стекла»

Apple отправляет владельцам устройств с устаревшими версиями iOS и iPadOS экстренные уведомления о текущих кибератаках

Microsoft приберёт к рукам ЦОД почти на 1 ГВт в Техасе

«Яндекс» рассказал об итогах Кубка «Яндекс Образования» по информатике для старшеклассников

Энтузиасты представили альтернативный открытый клиент Telegram для Android под названием Monogram, написанный на Kotlin

Объявлены итоги школьной олимпиады по программированию «Технокубок»

Google предупредила о квантовом взломе криптовалют

От 2900 BTC до 7 BTC: основатель F2Pool продал недвижимость в биткоинах более чем в 400 раз дешевле

В Китае создают подводный аппарат для туристов

Что произойдет, если Солнце внезапно погаснет - ответ ученых

Instagram начал тестировать подписку Plus в некоторых странах

CryptoQuant: биткоин опустился до зоны накопления на фоне макронеопределенности

Минтруда США опубликовало проект правил включения криптоактивов в пенсионные планы

Эволюция батарей: как технология подешевела на 99% и почему это меняет всё

Технологии в медицине: чатбот выявил высокий риск апноэ благодаря алгоритмам и аналитике

Anker Nebula P1i: Проектор, который умеет вращаться, и почему 380 люмен — это не приговор

Artemis II: НАСА запускает обратный отсчёт до первого пилотируемого полёта на Луну

«Яндекс» начал приём заявок на премию Yandex ML Prize за вклад в развитие ИИ

XElectron PocketBeam: карманный кинотеатр на Android 13 по цене бюджетного смартфона

HMD Crest 2 Pro: большая батарея и процессор, который еще нужно поискать

Представлен открытый проект cssDoom — версия Doom, использующая для отрисовки только CSS

Прощавай, «Голливуд в кармане»: почему OpenAI внезапно закрыла Sora

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA