В Anthropic выяснили, как ИИ вырабатывает те или иные черты характера

habr.com

habr.com:

В Anthropic провели исследование, в ходе которого выяснили, почему ИИ иногда обретает определенные персональные черты, в том числе нежелательные — например, озлобленность, подхалимство или склонность к галлюцинациям.

Исследователи взяли "нормальные" ответы и ответы, в которых ИИ проявлял одну из перечисленных выше особенностей, а затем вычли активации нейронов, получив так называемый persona vector.

Читать на habr.com Все новости от habr.com

Июльские $5 млрд превращаются в $10 млрд. Новый поворот в раунде Anthropic

Каким получился обновленный DeepSeek — скорость и дешевизна вместо бенчмарков

«Я сделал это за десять минут»: как маленькая тамальерия из ЛА стала вирусной сенсацией

Читатели в среднем не отличили ИИ-рассказы от текстов профессиональных писателей

Июльские $5 млрд превращаются в $10 млрд. Новый поворот в раунде Anthropic

Каким получился обновленный DeepSeek — скорость и дешевизна вместо бенчмарков

«Я сделал это за десять минут»: как маленькая тамальерия из ЛА стала вирусной сенсацией

Читатели в среднем не отличили ИИ-рассказы от текстов профессиональных писателей

Stellantis открыла свой первый центр по утилизации автомобилей в Южной Америке

Дельфин единственный раз в истории убил человека: как и почему это произошло

Samsung и Netflix выпустили ограниченный набор тем для смартфонов

Имеет массу в 36 миллиардов Солнце: ученые обнаружили одну из самых масштабных черных дыр

Лимиты использования GPT-5 увеличили в 7,5 раз

В ИИ-агент для программирования Jules добавили модуль-критик

GPT-5 выпустили на 100% пользователей и удвоили лимиты использования

Google хочет, чтобы у Gemini учились, а не копировали

В интернете нашли переписку пользователей с ChatGPT: как это объяснили в OpenAI

Сотрудники OpenAI использовали ИИ Claude для программирования. В Anthropic уже закрыли доступ

Законопроект о создании биткоин-резерва в Бразилии вынесли на публичные слушания

SEC Филиппин ограничит доступ к нелицензированным биржам

Как ИИ OpenAI взял «золото» Международной математической олимпиады

Как одной из самых знаменитых моделей мира удается Жизель Бюндхен удается сохранять вес 50 кг уже 20 лет | ФОКУС ВНИМАНИЯ

В ChatGPT добавили функцию для обучения и «решения домашки»

Opera переносит спор с Microsoft в Бразилию

С 28 августа Anthropic введет дополнительные еженедельные лимиты на планах Claude Pro и Max

Как правильно пить кофе, чтобы исключить его вредное влияние на организм

США могут проиграть Китаю в ИИ-гонке. Anthropic предлагают, как этого избежать

Google раскрыла, как на Android работает система оповещения о землетрясениях

OpenAI, Google и Anthropic предупредили, что мы скоро можем перестать понимать рассуждения ИИ

В Grok добавили аниме-компаньоншу — пользователи шутят, что «AGI наступил»

В xAI объяснили, почему Grok 4 сверялся с мнением Маска, отвечая на политические вопросы

Какое растительное масло самое полезное, рассказали диетологи

Чтобы подключить Xperia 1 к камерам Sony как внешний экран теперь надо дополнительно заплатить

Toyota анонсировала новый электромобиль, который будет производиться в Европе

Супер-ИИ или польза здесь и сейчас? США и Китай идут разными путями

Продемонстрирован дизайн смартфона iPhone 17 Pro Max

Четыре признака приближающегося инфаркта, которые проявляются перед сном

Крутой хоррор, но не идеальная игра — Cronos: The New Dawn получает высокие оценки, но не дотягивает до Silent Hill 2 Remake

Этот день настал! Instagram выпустил полноценное приложение для iPad

Исследование: чат-ботами можно манипулировать с помощью лести и давления

Археологи обнаружили в Перу гробницу с останками более десятка человек: чем уникальна (фото)

Statcounter: почти половина всех ПК с Windows теперь работают под управлением Windows 11

Microsoft прекращает поддержку некоторых компонентов Graph

Acer представила Iconia X12 и Iconia X14 — легкие мощные планшеты для работы, отдыха и творчества

Повседневная привычка, которая провоцирует рак - она есть у многих взрослых людей

IPS или AMOLED — выбор за вами: Acer представила ультралегкий ноутбук Swift Air 16

Таких мультфильмов Disney не показывал: состоялся релиз стильного психологического хоррора Bad Cheese, вдохновенного Микки Маусом

TCL выпустила геймерский QD-miniLED монитор Thunderbird Q9 с частотой обновления 240 Гц

Секрет счастья - в деньгах, но не только - ученые назвали три главные вещи

Земля имеет скрытую временную границу - ученые потрясены новым открытием

Привет из прошлого: на YouTube появились новые геймплейные кадры отмененного шутера Prey 2

Релиз CrystalDiskInfo 9.7.2

Обновление Telegram: музыка в профиле, переработанный дизайн на Android и мини-приложение для стикеров

Вышел открытый проект NeeView 44.1 — просмотрщик изображений и видео для Windows

Представлен ноутбук MAX16 с тремя экранами

Почему кот ворует еду: ветеринар объяснила причину и дала важный совет

Популярный напиток, который повышает риск диабета, рака и гипертонии

Самый опасный возраст для мужчин и женщин назвали ученые

U.S. Bank возобновил услуги хранения криптовалют для институциональных клиентов

Сервис Utila привлек $22 млн в рамках расширенного раунда серии A и почти втрое поднял оценку

Apple запатентовала новый ударопрочный Taptic Engine

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA