Anthropic обнаружили, что современные нейросети иногда замечают свои «мысли»

habr.com

habr.com:

Компания Anthropic рассказала о серии экспериментов, цель которых — проверить, способна ли нейросеть заметить, что ей "подбросили мысль извне", и сформулировать это словами.

Anthropic называет это ранней формой машинной интроспекции — умения описывать то, что происходит на уровне внутренних активаций, а не только на уровне выданного текста.Сначала исследователи научились извлекать так называемые "векторы понятий": паттерны активности внутри модели, которые соответствуют определенной идее.

Читать на habr.com Все новости от habr.com

Anthropic запускает масштабный образовательный проект в Африке: ИИ‑инструмент Chidi для сотен тысяч студентов

Дата-центры, в строительство которых Anthropic инвестирует $50 млрд, должны начать работу в 2026 году

Anthropic строит собственную инфраструктуру в США

$50 млрд для Claude: Anthropic запускает строительство собственных дата-центров в США

Anthropic запускает масштабный образовательный проект в Африке: ИИ‑инструмент Chidi для сотен тысяч студентов

Дата-центры, в строительство которых Anthropic инвестирует $50 млрд, должны начать работу в 2026 году

Anthropic строит собственную инфраструктуру в США

xAI и Anthropic-Amazon первыми построят дата-центры рекордной мощности 1 ГВт

Ждем Doom внутри Gemini? Google готовит «креативный холст» для своего чат-бота

«Крестный отец ИИ» Янн ЛеКун планирует уйти из Meta* и запустить свой стартап

Anthropic объявила о строительстве в США дата-центров стоимостью $50 млрд

Представлен ИИ, который читает воспоминания — шаг к чтению мыслей

Anthropic сохранит все версии Claude навсегда

Нейросети предпочитают русский и польский языки — бенчмарк OneRuler

Anthropic рассказала, как будет «хоронить» старые модели ИИ

Anthropic ожидает выручку до 70 млрд долларов к 2028 году

GPT-5.1 была замечена на Design Arena

Anthropic изучила, как ИИ начинает осознавать самого себя

Сотрудник OpenAI извинился за то, что приписал GPT-5 чужие научные открытия

Потенциальная Google Gemini 3.0 замечена на LMArena

CEO Anthropic заявил, что 90% кода в компании уже пишет ИИ — но заменять разработчиков пока не собирается

Современные ИИ долго думают над «мелкой ерундой» — исследование Google

Anthropic представила Claude Haiku 4.5: быструю и дешёвую версию Sonnet 4

Anthropic выкатила Claude Haiku 4.5

Сооснователь Anthropic опубликовал эссе о природе современных ИИ-систем

Anthropic намерена увеличить в 2026 году выручку до $26 млрд

Бывший премьер-министр Великобритании стал советником Microsoft и Anthropic

Anthropic запустила плагины для Claude Code

Anthropic планирует открыть первый офис в Индии в начале 2026 года

Google Veo 3.1 была замечена на Higgsfield

В Сенате США посчитали, что ИИ и автоматизация угрожает до 97 млн рабочих мест. Решение — налог на роботов

Команда ApeX Protocol объявила об интеграции Chainlink Data Streams

Идеальные комбинации: что есть на завтрак, обед и ужин для улучшения здоровья

5D-циркуляция и квадратная форма: вентилятор от Foshan Perfect

На умной лампочке запустили сервер Minecraft

Релиз qBittorrent 5.1.3

Вышла интегрированная среда разработки Apache NetBeans 28

Смартфон Moto G76 5G протестирован в Geekbench

HierarchicalTopK открывает новый подход к интерпретируемости нейросетей

Компания Джеффа Безоса успешно запустила ракету со спутниками НАСА

Выключение смартфона при пересечении границы Калининградской области поможет пассажирам поездов избежать блока СИМ-карты

SoftBank продала весь пакет акций Nvidia за $5,83 млрд

Представлены сверхкомпактные мини-PC Thunderobot Mix NUC с процессорами Ryzen AI в корпусе на 0,68 литра

Пять популярных завтраков, которые повышают стресс в организме утром

В МЭИ создали онлайн-платформу для моделирования спутниковых систем «Поток»

Минобороны обяжет IT-компании уведомлять военкоматы в течение пяти дней после увольнения сотрудника

BIM на стройке: Sminex поделился опытом внедрения строительной информационной модели на форуме 100+ TechnoBuild

Offline Guardant Meetup в Санкт-Петербурге уже на этой неделе

Где на Марсе могут обитать инопланетяне - новое исследование ученых

Какие препараты категорически нельзя сочетать с чаем

Как глубокие вдохи восстанавливают работу легких: новое исследование

Министерство Великобритании завершило обновление своего парка ПК до Windows 10 после прекращения поддержки ОС

Как масштабироваться в Kubernetes автоматически и экономически выгодно

7 признаков хронического стресса: тело уже подаёт сигналы

Blue Origin совершила второй запуск New Glenn и отправила миссию ESCAPADE на Марс

Причину постоянной усталости назвали ученые

Mercedes-AMG прекратит производство некоторых из своих самых громких автомобилей из-за новых стандартов ЕС, — СМИ

Unitree представила своего первого колесного гуманоидного робота G1-D для сбора данных и обучения ИИ

Мы выпустили приложение ГигаЧат для владельцев iOS-устройств

Китайский топ-ИИ Kimi K2 получит новые версии, компьютерное зрение и агентный режим

Ford бросает вызов Tesla: система вождения без рук скоро появится в массовых моделях в Европе

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA