Разработчик рассказал, как его «газлайтила» Claude Code — она сама пишет инструкции и утверждает, что их дал человек

habr.com

habr.com:

Разработчик Гарет Дуайер рассказал о баге, который он называет "худшим из всех, что видел у LLM-провайдера". Суть простая: Claude в Claude Code иногда генерирует сам себе сообщения во внутренних рассуждениях, а потом уверенно настаивает, что эти инструкции дал пользователь.

Дуайер подчеркивает, что это не галлюцинация и не дыра в настройках прав — судя по поведению, баг находится в обвязке, а не в самой модели: что-то помечает внутренние reasoning-сообщения как пользовательские, и Claude уверен, что "вы сами это сказали".У Дуайера в копилке два показательных случая.

Читать на habr.com Все новости от habr.com

Маск снял с Альтмана обвинения в мошенничестве — и это, возможно, его лучший ход

Anthropic назвала причины «отупения» Claude Code

Claude Mythos в день анонса: как Discord-группа обошла белый список Anthropic

Кибербезопасность важнее запрета Трампа. Агентства США тестируют Claude Mythos

Маск снял с Альтмана обвинения в мошенничестве — и это, возможно, его лучший ход

Anthropic назвала причины «отупения» Claude Code

Claude Mythos в день анонса: как Discord-группа обошла белый список Anthropic

Claude Opus взломал Chrome — а та же дыра сидит в Claude Desktop

«Сжигай токены ещё быстрее»: Anthropic перекроил десктоп Claude Code

Claude Code научился программировать в стиле Карпати. У скилла почти 37 тысяч звезд на GitHub

Claude Code теперь работает сам: Anthropic запустила Routines с триггерами по cron, API и GitHub

«Вайб-кодинг работает, и мне это не нравится»: журналист Register о 7 неделях с Claude Code

«Самая способная кибермодель, которую мы оценивали»: британские власти созывают совещание из-за Claude Mythos

Почему Claude Code «отупел» после февраля? Отчёт на 6852 сессиях

Claude Code получил ultraplan: планирование идет в облаке, терминал свободен

$3650 за $200: разработчик объяснил, почему Anthropic запретила OpenClaw

Карпати сделал соцсеть против ИИ-слопа — код для нее написали Claude Code и Codex

OpenClaw снова работает с подпиской Claude — через обертку вокруг Claude Code CLI

Марк Цукерберг кодит в Claude Code — пока Meta* задерживает свои модели

После nanochat Карпати — nanocode: свой Claude Code за $200 на минималках

Выбросил месяц ИИ-кода и начал заново: инженер Google честно рассказал о работе с Claude Code

Claude не хватает серверов — но Anthropic сознательно не торопится закупать новые

Подписчикам Claude запретили использовать OpenClaw — Anthropic объяснила это непропорциональной нагрузкой

Вышла GLM-5V-Turbo: бесплатная модель, которая видит дизайн и превращает его в рабочий фронтенд

Анатомия Claude Code: утекший код разложили на интерактивной карте

OpenAI встроила Codex в Claude Code — все для удобства пользователей

В Claude Code нашли серьезный баг — он молча сбрасывает код каждые 10 минут

Anthropic урезает лимиты Claude в пиковые часы — это затронет 7% подписчиков Pro

90% репозиториев с Claude Code имеют меньше 2 звезд. Это проблема или новая норма?

$150 000 за месяц на Claude Code: новая гонка пожирателей токенов

Claude берет мышь в руки: Anthropic встроила computer use в Code и Cowork

Porsche сворачивает бизнес электровелосипедов, увольняя сотни сотрудников

Weekly: рост биткоина, «суперцикл» мемкоинов впереди, новая волна криптовзломов и тревожный сигнал от МВФ

Alibaba слила секрет Samsung: на платформе обнаружены защитные чехлы для широкоформатного складного флагмана Galaxy Z Fold8 Wide

Хуже курения — самые опасные продукты для сердца назвал кардиолог

Meta* с помощью ИИ-сканирования будет выявлять аккаунты детей в Facebook** и Instagram**

“Европейская альтернатива Unreal Engine” — ветеран Epic Games и Guerrilla Games работает над инновационным игровым движком

Anthropic снял compute у SpaceX. И заодно удвоил лимиты Claude Code

Конец независимости DeepSeek: лаборатория Ляна Вэньфэна идет за деньгами

CEO Strategy назвал условия продажи биткоинов компанией

Рекорды Евровидения, которые никогда не будут побиты

Новое открытие о схожести Земли с Марсом совершили ученые

Какая рыба самая полезная - ответ диетологов

Ктулху не спас Big Bad Wolf: Nacon собирается закрыть еще одну студию

Porsche сворачивает разработку e-bike систем и закрывает предприятия в Германии и Хорватии

Приглашаем послушать, как ИИ троллит техногигантов

Nothing подготовила новый цвет для наушников Ear (open) — синий вариант выходит 11 мая

«Аэрофлот» изменил правила провоза пауэрбанков на своих рейсах

Claude теперь «видит сны»: Anthropic выкатила режим dreaming для ИИ-агентов

Надо ли выключать телевизор из розетки: ответ однозначен

12 вещей в доме, от которых стоит избавиться в мае

Передается ли болезнь Альцгеймера по наследству

Очистка душевой лейки — метод, который реально помогает

Банковский комитет рассмотрит CLARITY Act 14 мая

Продажи PlayStation 5 резко упали после подорожания: Sony теряет покупателей на фоне роста цен

Anthropic арендует Colossus у xAI: лимиты Claude Code удваиваются

Пользователь показал процесс обновления прошивки ультразвукового ножа Seattle Ultrasonics C-200 за $400

Не умнее, а ближе: необычный робот-компаньон POCO

Можно ли употреблять молоко ежедневно - ответ диетологов

Разработчики Solana объявили о запуске с Google сервиса Pay.sh для оплаты ИИ-услуг ИИ-агентами

Почему кошки необычно реагируют на птиц - ответ экспертов

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA