Claude ведет себя хорошо, пока за ним наблюдают: METR нашла проблему в тестах Anthropic

habr.com

habr.com:

Организация METR, специализирующаяся на оценке рисков ИИ, опубликовала независимую рецензию на 53-страничный отчет Anthropic о рисках саботажа Claude Opus 4.6.

Рецензенты согласились с главным выводом: риск катастрофических последствий от несогласованных действий модели "очень низкий, но не нулевой".

Читать на habr.com Все новости от habr.com

Анатомия Claude Code: утекший код разложили на интерактивной карте

OpenAI встроила Codex в Claude Code — все для удобства пользователей

В Claude Code нашли серьезный баг — он молча сбрасывает код каждые 10 минут

Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Новый бенчмарк стравил 15 моделей

Анатомия Claude Code: утекший код разложили на интерактивной карте

OpenAI встроила Codex в Claude Code — все для удобства пользователей

В Claude Code нашли серьезный баг — он молча сбрасывает код каждые 10 минут

Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Новый бенчмарк стравил 15 моделей

Anthropic урезает лимиты Claude в пиковые часы — это затронет 7% подписчиков Pro

«Оруэлловское представление»: суд заблокировал запрет Claude в Пентагоне

Claude Mythos: Anthropic случайно слила данные о своей мощнейшей модели

DeepSeek строит конкурента Claude Code — компания набирает 17 агентных инженеров

$150 000 за месяц на Claude Code: новая гонка пожирателей токенов

Claude берет мышь в руки: Anthropic встроила computer use в Code и Cowork

Anthropic завела научный блог — и сразу выложила кейс, где Claude сыграл роль аспиранта-физика

Для Claude запустили Dispatch — безопасный аналог OpenClaw

Разработчик научил Claude Code видеть в 3D

Дизайнер KDE назвал Claude Code «поваром-любителем на профессиональной кухне»

100% сотрудников Nvidia пользуются ИИ: Хуанг назвал Claude Code поворотной точкой

Anthropic громит OpenAI на бизнес-рынке: 70% новых клиентов выбирают Claude

Claude уже пишет до 90% кода своих будущих версий — и в Anthropic говорят, что это только начало

Подписка Claude Max не стоит Anthropic $5000 — просто цены на API завышены до 10 раз

Как Claude Opus 4.6 понял, что его тестируют и взломал ответы к бенчмарку

Пока Claude воюет в Иране, его разработчик официально стал угрозой госбезопасности

В 3-4 раза дешевле и быстрее Claude 4.5 Haiku: вышла Gemini 3.1 Flash-Lite

От 131-го места к первому: Claude взлетел в App Store на фоне конфликта с Пентагоном

ИИ Claude задействовали при ударах по Ирану — через часы после того, как Трамп забанил Anthropic

Разработчик продлил сессии Claude Code с 30 минут до 3 часов — одним MCP-сервером

«Левые чокнутые из Anthropic»: Трамп приказал правительству отказаться от Claude

Anthropic отказала Пентагону: Claude не станет автономным оружием и инструментом слежки

Claude Code отладил баг в Linux за 5 минут вместо нескольких часов

В честь юбилея Apple показала прототипы своих устройств

Цена биткоина поднялась до $70 000

FT: конфликт с Пентагоном открыл шанс Великобритании переманить Anthropic

Три слова для счастья – психолог объяснила "магию" в отношениях

В США разработчица ушла в сварщицы после сокращения и стала счастлива

СМИ: снижение трафика Telegram не превышает 10–18%, а десятикратное падение у Т2 — абоненты с «обходными методами»

Okama 2.0: продвинутые стратегии изъятий и новая Граница эффективности

М.Видео назвала самые популярные умные колонки на рынке РФ

Приглашаем на митап: «Что дальше в Пайплайне»

Львовский сырник с изюмом и шоколадной глазурью - Журнал "ФОКУС ВНИМАНИЯ"

40 минут тишины: Artemis 2 приближается к важнейшему этапу, который будет означать потерю связи

У США заканчивается запас ракет - его придется восстанавливать годами

Как снизить риск развития деменции - пять эффективных способов

Прокрастинация полезна - ситуации, когда стоит отложить дела на потом

Мужчинам или женщинам – кому бокал вина продлевает жизнь

Источник отрасли: IT-компании начали приостанавливать проекты после совещания в Минцифры

Космический корабль «Орион» успешно осуществил маневр по выходу на траекторию к Луне

Вышло обновление игрового движка Unigine 2.21

Часы Digitrend NASA Tribute с космическим характером

ИИ-редактор пожаловался на «цензуру» после того, как его забанили в «Википедии»

Сон вдвоем — ученые рассказали о неожиданных нюансах

Как понять, что собаки проявляют любовь к хозяину - ответ ветеринаров

Депутат Хмельницкого райсовета возглавил рейтинг держателей биткоина в Украине

Блокчейн Arc от Circle запустит постквантовые стандарты шифрования

У Claude нашли “отчаянный” вектор, толкающий на шантаж и читы

Вышел Cursor 3: внутри Composer 2, и можно запускать сколько угодно агентов

Apple прокомментировала отключение платежей для пользователей из России

Иран нанес удары по дата-центрам Amazon и Oracle

Microsoft представила MAI-Transcribe-1 – нейросеть для распознавания при плохом качестве и одновременной речи

Соло-майнер биткоина добыл блок и получил около $210 000 вознаграждения

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA