Исследование: 250 вредоносных документов могут вызвать сбой в работе языковой модели с 13 млрд параметров

habr.com

habr.com:

Специалисты Anthropic совместно с Институтом безопасности ИИ Великобритании, Институтом Алана Тьюринга и другими исследовательскими центрами провели эксперимент, который показал, что всего 250 вредоносных документов способны вызвать сбой в работе языковой модели с 13 млрд параметров.

Таким образом, для появления багов достаточно «отравить» всего 0,00016% обучающего корпуса.Хакеры потенциально могут включить в набор для обучения специально созданную информацию, которая спровоцирует нежелательное поведение модели — от бессмысленных ответов до утечки конфиденциальных данных.

Читать на habr.com Все новости от habr.com

Признаки, которые могут предупреждать о том, что у вас будет инфаркт в будущем

Старые модели телефонов Google Pixel не могут точно определять местоположение UWB-трекеров

Кошачьи привычки, которые могут вас удивить - ветеринары раскрыли неожиданные факты

Follow the Money: $3,5 млрд для венчура, инвестиции в Polymarket и поглощение GTreasury за $1 млрд — октябрь 2025

Признаки, которые могут предупреждать о том, что у вас будет инфаркт в будущем

Старые модели телефонов Google Pixel не могут точно определять местоположение UWB-трекеров

Кошачьи привычки, которые могут вас удивить - ветеринары раскрыли неожиданные факты

Follow the Money: $3,5 млрд для венчура, инвестиции в Polymarket и поглощение GTreasury за $1 млрд — октябрь 2025

OpenAI выпустила бесплатные модели для модерации контента

OpenAI выпускает открытые safeguard-модели для гибкой настройки классификации контента

В России за сутки дважды произошел сбой в работе Telegram и WhatsApp*

FacebookResearch представил мощную языковую модель для смартфонов

У языковых моделей развивается деградация интеллекта из-за мусорных данных

DeepSeek представил эффективный и дешевый ИИ для распознавания документов

Глобальный сбой: пользователи интернета сообщают о проблемах в работе сервисов

В работе YouTube произошёл глобальный сбой

Ring-1T-FP8 стала одной из крупнейших открытых моделей на триллион параметров

NVIDIA представила исследование нового формата чисел для обучения больших языковых моделей

Сбой в monobank: приложение не работает из-за огромного наплыва пользователей

Какие алкогольные напитки могут вызвать жировую болезнь печени

Ling-1T: триллион параметров, 50 млрд активных — новая архитектура «эффективного мышления»

В Max появился официальный чат‑бот «Госключа» для подписания документов

Британская полиция запретила работу из дома после мошенничества с автонабором текста на ПК

Тысячи сканов документов пользователей Discord попали в руки злоумышленников

В законопроект о виртуальных активах в Украине внесли более 2500 правок

CMF представила модульные полноразмерные наушники с автономной работой до 100 часов

Геймер построил языковую модель с 5 млн параметров в Minecraft

WhatsApp добавил целую кучу обновлений — от сгенерированных ИИ тем до фотографирования документов

Alibaba представила флагманскую модель Qwen3-Max с триллионом параметров

В Asus показали прототип слота PCIe c мощностью до 250 Вт

Исследование: британские банки используют программное обеспечение 60–70-х гг

В Германии начали давать в аренду видеокарту Intel Arc Pro B60 с 24 ГБ видеопамяти

Роботакси Waymo готовятся к масштабной экспансии

Пользователь заплатил $105 000 комиссии в сети биткоина при переводе $10

Существует ли квантовая гравитация: открытие физиков меняет понимание главных сил природы

Блогер провёл двухгодичный эксперимент по изучению влияния быстрой зарядки на состояние аккумуляторов 40 смартфонов

Расширенные обновления безопасности Windows 10 не будут работать на некоторых ПК

И мы снова зажигаем ваши сердца! В ноябре Хабр проводит еще один «Авторский огонёк»

Шмели так хотели сладкого, что выучили простейшую азбуку Морзе: никто не ожидал от них такого

Семья годами жила в доме с тысячами пауков: у ученых нет объяснения этому явлению

Почему одни люди боятся холода, а другие нет: раскрыта тайна того, что превращает нас в мерзляков

СМИ: в РФ с 1 сентября 2026 года планируется технологический сбор для импортёров для поддержки отечественных технологий

Вышла версия открытого проекта для редактирования видео LosslessCut 3.67

Бывший топ-менеджер BlackRock считает Ethereum основой будущих финансов

Google запускает Private AI Compute — облачную платформу ИИ с максимальной защитой данных

Sony представила первый геймерский монитор под брендом PlayStation с диагональю 27" и частотой до 240 Гц

Официально: хоррор-сериал “Чужой: Земля” получит второй сезон

Apple расширила действие функции Emergency SOS на Мексику

«Логистический суперхаб». Украинский Ajax Systems открыл завод во Вьетнаме. Какова выгода?

a16z представила первые предложения в рамках GENIUS Act

Древнеримский театр в Турции раскрыл имя важной жрицы: что известно ученым (фото)

Яндекс обновил Мастер отчетов: больше возможностей для удобного анализа данных

AI-рынок потерял $800 млрд за неделю

Команда открытого проекта runc столкнулась с ростом pull-request и отчётов об ошибках, сгенерированных ИИ

Точно не инопланетяне. Астрономы получили первый «радиосигнал» от кометы 3I/ATLAS

Землю накрыла сверхсильная магнитная буря: она практически достигла уровня G5

Первые подробности Galaxy Z TriFold: складной смартфон получит аккумулятор емкостью 5600 мА·ч и выйдет 5 декабря

Как цитрусовые помогают быстрее выздороветь при простуде - советы и лайфхаки от врача

Почему всё время хочется есть? Виноваты гормоны голода | ФОКУС ВНИМАНИЯ

Почему собаки наклоняют голову, когда вы с ними говорите? Это не просто милая привычка

FT: главный исследователь Meta по ИИ покинет корпорацию ради своего стартапа

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA