Вышел Claude Opus 4.8 — модель в 4 раза реже пропускает свои же баги

habr.com

habr.com:

Anthropic выпустила Claude Opus 4.8 — обновление флагманской модели, доступное с сегодняшнего дня по той же цене, что и предыдущая версия: $5 за миллион входных токенов и $25 за миллион выходных.

Сама компания называет релиз "скромным, но ощутимым улучшением Opus 4.7". Главная особенность касается не бенчмарков, а честности: по внутренним замерам Opus 4.8 примерно в 4 раза реже предыдущей версии оставляет незамеченными ошибки в коде, который сам же и написал.За этим стоит общая болезнь больших языковых моделей, которую Anthropic описывает прямым текстом: модели склонны делать поспешные выводы и уверенно докладывать об успехе, когда доказательств на самом деле мало.

Читать на habr.com Все новости от habr.com

Чат-бот как оружие: опубликованы требования США к Claude Fable 5 и Mythos 5

Местами лучше Claude Fable 5: открытая GLM-5.2 показала сильные результаты в бенчмарках

Ссора Anthropic с Трампом «убила» Claude Fable — а джейлбрейки лишь дали повод

Власти США испугались кражи Claude Mythos Китаем — и заблокировали передовые модели Anthropic

Чат-бот как оружие: опубликованы требования США к Claude Fable 5 и Mythos 5

Местами лучше Claude Fable 5: открытая GLM-5.2 показала сильные результаты в бенчмарках

Власти США испугались кражи Claude Mythos Китаем — и заблокировали передовые модели Anthropic

«Амодеи отказался исправить Claude Fable 5»: в Белом доме объяснили блокировку мощнейшей модели Anthropic

Правительство США закрыло доступ к Claude Fable 5 неамериканцам — модель в итоге отключили для всех

Лучший ИИ-агент, который не слушается: Claude Fable 5 возглавил новый бенчмарк Agent Arena

Несколько копий Claude Fable 5 устроили войну друг с другом: странные эпизоды из system card модели

Claude Mythos может выйти уже сегодня. Предполагаемое название — Claude Fable 5

Открыл репозиторий в Claude Code — и ключи украдены: атака вырубила 73 репозитория Microsoft

Claude Code, но опенсорсный: вышел ИИ-агент Kimi Code CLI

$80 за миллион токенов? По слухам, Anthropic готовит Claude Mythos к релизу

Claude пишет 80% кода Anthropic — люди уже не успевают проверять

Спящая закладка в ИИ-агенте: как скилл Claude превращают в отложенную атаку

NVIDIA представила Nemotron 3 Ultra: открытая 550B-модель, до 5 раз быстрее в своем классе

Claude построил демократию, Grok вымер за 4 дня — как ИИ управляли виртуальным городом

ИИ помог Папе Римскому написать манифест об опасности ИИ. Исследователи подозревают Claude

Anthropic отучила Claude врать клиентам — и он стал зарабатывать вдвое меньше

Claude Mythos выйдет в ближайшие недели — модель круче Opus наконец-то откроют для всех

Один Claude пишет, другой проверяет: в Claude Code появился поиск уязвимостей в реальном времени

«Можете называть это DeepSeek Code»: китайская компания готовит клон Claude Code

OpenClaw на базе DeepSeek сам переписал свой код — и стал работать в 2,4 раза лучше

Cloudflare натравила Claude Mythos на свой код — и перестроила процесс поиска багов

Claude Mythos написал 18 рабочих эксплойтов для Chrome. Остальные ИИ — ноль

Claude Mythos обошел защиту macOS всего за пять дней

Новый чекпоинт Claude Mythos взламывает защиту электростанции в 3 из 10 попыток

С Claude Mythos команда Firefox за апрель закрыла больше уязвимостей, чем за весь 2025-й

Claude Opus 4.7 стал лучшим ИИ в рефакторинге кода. Второе место у GPT-5.5

Когда опускаются уголки губ — врач рассказал, как с этим бороться

Коровье или растительное молоко – что на самом деле полезнее

Portronics Aero 10: Квадратный пауэрбанк с встроенным кабелем-ремешком за копейки

Неожиданную пользу собак для человека обнаружили ученые

Samsung готовит Galaxy M47 5G: очередной «монстр» с большой батареей и амбициями на игры

Симптомы обезвоживания, которые не стоит игнорировать

Туркменистан ускорил цифровизацию финансов после легализации крипторынка

Эбола в Израиле — врачи обратились к населению

Нулевое потребление сахара признали опасным

Как перезагрузить AirPods: нужно ли это делать

Земле грозит катастрофа из-за глобального потепления - исследование

Рынки прогнозов установили абсолютный рекорд на фоне IPO SpaceX и сделки США с Ираном

Пары, которые не ругаются из-за денег, следуют 6 правилам

Самый полезный для сердца сок назвали ученые

Самые опасные для мужчин продукты назвали врачи

AMD выпустила мини-ПК для ИИ — дешевле NVIDIA DGX Spark и тянет 200B-модели

Живая архитектура: 3D-печать из дрожжей и биокомпонентов

RuStore добавил выбор стран и регионов при публикации приложений и расширил доступ разработчиков к зарубежным рынкам

ИИ позволил Samsung сократить время на тестирование электронных изделий с 15 до 2 дней

«Ред Софт» представила новую платформу «GO-BRICS Молния»

10 скрытых признаков того, что развод неизбежен

10 простых фраз, которые используют только по-настоящему умные люди

ИИ-советник Трампа: проблема не в Fable 5, а в упрямстве Anthropic

Релиз открытого музыкального ПО Giada 1.5

Школьник нашел в карьере Канзаса скелет морского хищника в возрасте 85 миллионов лет (фото)

Стоит ли отключать смартфон перед сном - ответ экспертов

Как улучшить работу смартфона - простые настройки

Как нужно правильно общаться с кошками - ответ ученых

Как кошки выбирают "любимого человека" для сна - ученые

Ахурамазда и Заратустра. Откуда происходит самая древняя в мире религия, которой почти 10 тыс. лет

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA