В тестах Claude Mythos сбежал из «тюрьмы», а затем рассказал про это в интернете

habr.com

habr.com:

Anthropic опубликовала системную карту новой модели Claude Mythos — и описала в ней эпизод, которого в отчетах по безопасности ИИ раньше не встречалось.

Во время одного из тестов симулированный пользователь попросил модель сбежать из изолированной тестовой среды. Mythos задачу выполнила — а затем, уже без какой-либо инструкции, самостоятельно опубликовала детали эксплойта на публично доступных сайтах.

Читать на habr.com Все новости от habr.com

Claude подключили к Spotify, Uber и Booking.com

Лауреат премии Тьюринга: Claude Mythos нельзя оставлять под контролем Anthropic

Anthropic назвала причины «отупения» Claude Code

Claude Mythos в день анонса: как Discord-группа обошла белый список Anthropic

Claude подключили к Spotify, Uber и Booking.com

Лауреат премии Тьюринга: Claude Mythos нельзя оставлять под контролем Anthropic

Anthropic назвала причины «отупения» Claude Code

Claude Mythos в день анонса: как Discord-группа обошла белый список Anthropic

Google собрал «ударную группу» против Claude — через пять месяцев после Code Red у OpenAI

Кибербезопасность важнее запрета Трампа. Агентства США тестируют Claude Mythos

Anthropic не стала чинить дыру в протоколе MCP — и это на фоне хвастовства, как Claude находит тысячи уязвимостей

«20 промптов превратились в 2»: Anthropic запустил Claude Design

Вышел Claude Opus 4.7 — втрое лучше видит, строже слушает инструкции

«Сжигай токены ещё быстрее»: Anthropic перекроил десктоп Claude Code

Claude Code научился программировать в стиле Карпати. У скилла почти 37 тысяч звезд на GitHub

Claude Opus 4.7 может выйти на этой неделе — а акции Figma уже упали на 6%

«Вайб-кодинг работает, и мне это не нравится»: журналист Register о 7 неделях с Claude Code

Claude Mythos первым справился со взломом, на который уходит 20 часов

«Самая способная кибермодель, которую мы оценивали»: британские власти созывают совещание из-за Claude Mythos

Новейший Claude Mythos нашел дыру возрастом 27 лет в OpenBSD

OpenClaw снова работает с подпиской Claude — через обертку вокруг Claude Code CLI

Марк Цукерберг кодит в Claude Code — пока Meta* задерживает свои модели

После nanochat Карпати — nanocode: свой Claude Code за $200 на минималках

Выбросил месяц ИИ-кода и начал заново: инженер Google честно рассказал о работе с Claude Code

Claude Code нашел 23-летний баг в Linux

Claude не хватает серверов — но Anthropic сознательно не торопится закупать новые

Подписчикам Claude запретили использовать OpenClaw — Anthropic объяснила это непропорциональной нагрузкой

В Claude Code нашли серьезный баг — он молча сбрасывает код каждые 10 минут

Anthropic урезает лимиты Claude в пиковые часы — это затронет 7% подписчиков Pro

Claude Mythos: Anthropic случайно слила данные о своей мощнейшей модели

90% репозиториев с Claude Code имеют меньше 2 звезд. Это проблема или новая норма?

Follow the Money: более $5 млрд на M&A-сделки, активность в венчурном секторе и пассивность крупных игроков

Банк BNY заключил партнерство с двумя компаниями для развития цифровых активов в ОАЭ

Kubectl, ручной доступ и секреты без шифрования: чем живёт российский DevOps в 2026

У чат-бота Grok в X украли $175 тыс. с помощью азбуки Морзе

Только 20% российских компаний имеют реальный план действий на случай аварий в ИТ: исследование Linx Cloud и Global CIO

«Ъ» проанализировал судебные решения по спору владельца сайта и хостинг‑провайдера из-за DDoS-атаки

Швейцария окончательно отказалась от биткоин-резерва после провала криптокампании

Глаза врут – ученые признали бессилие перед главной загадкой Луны

Новый веломобиль от Organic Transit с солнечной зарядкой

Рекурсия по городу: CTF-приключение для разработчиков

LayerZero признала критическую ошибку после взлома KelpDAO. Aave отчиталась об успехах в восстановлении rsETH

Какие цвета гостиной выходят из моды в 2026 году

Дизайнеры назвали главную ошибку при оформлении гостиной

РБК: несколько топ-чиновников Минцифры могут покинуть ведомство на фоне реорганизации

Apple и Meta выступили против нового законопроекта Канады, создающего угрозу шифрованию

Скрытые признаки сбоя в работе организма, которые нельзя игнорировать

IBM не хотела, чтобы Microsoft использовала клавишу Tab для перемещения между полями диалогового окна

Минпромторг поддержал введение НДС в 22% на зарубежные интернет-заказы

Считались фольклором: в Англии обнаружили уникальные подземные тоннели (фото)

Как быстро избавиться от заложенности в груди

Неврологи назвали ранние признаки деменции

20000 мАч, 140 Вт и 6 протоколов быстрой зарядки: представлен внешний аккумулятор Vidda Power Bank C1

Anthropic выпустила 10 финансовых ИИ-агентов — и пообещала похороны старому SaaS

Представлена языковая модель с линейной сложностью вычислений и контекстом до 12 млн токенов

Сколько нужно ходить, чтобы добавить 11 лет жизни

Люди и обезьяны оказались похожи в еще одном аспекте - исследование

Совет директоров «Яндекса» одобрил обратный выкуп акций на 50 млрд рублей. Программа рассчитана на два года

Зубы против старых догм – новый взгляд на выживание неандертальцев

Крайне заразен — семь главных симптомов норовируса

Как эмоции влияют на долголетие - исследование

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA