Все ведущие LLM провалили первый бенчмарк по киберзащите. Что это значит для SOC

habr.com

habr.com:

Simbian Research опубликовала Cyber Defense Benchmark – первую методику, которая проверяет, способна ли LLM автономно искать атакующего в реальной телеметрии.

Ни одна из 11 фронтирных моделей не набрала проходного балла. Пока AI заметно сильнее помогает атакующим, чем защищающимся, единственный рабочий ответ для корпоративной сети – эшелонированная оборона, микросегментация и ZTNA. Что произошло 28 апреля 2026 года Simbian Research опубликовала результаты Cyber Defense Benchmark – по их словам, первого в мире бенчмарка, который проверяет LLM не на знание MITRE ATT&CK по тестам, а на способность самостоятельно охотиться за злоумышленником в сырой телеметрии.Тестировали 11 фронтирных моделей от Anthropic, OpenAI, Google, Alibaba, DeepSeek, Minimax и Moonshot AI.

Читать на habr.com Все новости от habr.com

ИИ-код — это боль наперед: Lightrun предупреждает о волне техдолга

Codex добавили в мобильный ChatGPT — для всех планов, включая бесплатный

Claude Mythos обошел защиту macOS всего за пять дней

Anthropic увеличил лимиты подписки Claude и API-кредит для агентов. Но довольны не все

ИИ-код — это боль наперед: Lightrun предупреждает о волне техдолга

Codex добавили в мобильный ChatGPT — для всех планов, включая бесплатный

Anthropic увеличил лимиты подписки Claude и API-кредит для агентов. Но довольны не все

Андрей Карпати: главная проблема LLM — в том, как они отвечают

ИИ, который не тупит: стартап Миры Мурати показал первый крупный проект

Главный критик LLM почти похвалил Claude Mythos. Почти

Из настроек Chrome пропало сообщение о приватности локального ИИ Gemini Nano. Это может стоить Google миллиарды

В открытый доступ выложены исходные коды некоторых версий файлового менеджера Volkov Commander для DOS

Как понять, что вы амбиверт, и что это говорит о человеке – психологи

Instagram отказался от сквозного шифрования приватных чатов: что это значит для пользователей

Huawei Watch Fit 5 Pro: действительно ли это конкурент для Apple Watch Ultra 3?

Оптимизм вокруг биткоина достиг максимума за 4 месяца: что это означает для рынка

Пентагон пустил 8 ИИ-моделей в свои секретные сети. Без Anthropic — но не совсем

GPT-5.5 и Opus 4.7 провалились в ARC-AGI-3. Вот почему

Реализованная прибыль биткоин-инвесторов превысила $200 млн — что это означает для рынка?

Всего 20 минут и $12: как исследователь отравил передовые LLM несуществующими данными

32 ГБ – новый стандарт: Microsoft намекает, что 16 ГБ для Windows 11 уже «впритык»

OnePlus и Realme сливаются в экстазе корпоративной реструктуризации: что это значит

Хассабис: AGI, скорее всего, построят поверх нынешних языковых моделей

Эти чипы изменят все: OpenAI в сотрудничестве с MediaTek и Qualcomm создает инновационные процессоры для смартфонов будущего

Опубликована подборка 1000+ промптов для GPT Images 2. Подойдут и для других рисовалок

Google придумала «гиперкомпьютеры»: что это за зверь и зачем он искусственному интеллекту

Мережа Base запланировала обновление Azul на май — что это изменит для крипторынка?

Соучредитель Ethereum: контроль Big Tech над ИИ — это угроза для криптоиндустрии

На 18 месяцев без новых дата-центров: парламент штата Мэн принял первый в США мораторий на крупные ЦОД

SEC отменила требование минимального капитала в $25 000 для трейдеров в США — что это значит для криптоиндустрии?

В пустыни Аризоны крошечных муравьев застали за чисткой мандибул — что это означает

Не прыщ, а катастрофа – как распознать дисморфическое расстройство

Apple готовит смену руководства и масштабную перестройку внутри компании

Вся правда о знаках Зодиака: какие плохие привычки они скрывают годами

ТОП-9 вещей, которые вы должны знать о своей кошке

Фрукт, который эффективно снижает риск образования тромбов

Результаты тестов по математике и чтению в США продолжают снижаться уже 13 лет

Nintendo попыталась запатентовать функцию ловли монстров, специфичную для сенсорных экранов, но компании отказали

Warhammer 40,000: Dawn of War 4 выйдет 17 сентября — стратегия получила эпичный трейлер

Неприятный сюрприз от Sony: для новых подписчиков подорожали все тарифы PlayStation Plus

Два симптома рака, которые игнорировали большинство пациентов

Какие продукты могут спровоцировать появление тромбов

Xiaomi выпустила флагманский фитнес‑браслет Smart Band 10 Pro с облегченным корпусом, улучшенным мониторингом здоровья и керамической версией

Red Magic представила пауэрбанк с опцией полного отключения батареи от цепи питания

Xiaomi Mijia Air Conditioner Strong Wind Pro: 10 лет гарантии и ветер, который сбивает с ног

Sony повысит цены на PlayStation Plus из-за «текущих рыночных условий» и больше не будет выпускать эксклюзивы на ПК

Правда ли, что измена повторяется — данные исследования

Третье поколение BYD Atto 3: «Божий глаз», флеш-зарядка и ценник от 681 000 грн

Стеллаж по цене острова: аналитики подсчитали стоимость Nvidia NVL72 на архитектуре Rubin

Xiaomi представила свои первые наушники-клипсы с впечатляющим диапазоном частот, глубокой интеграцией AI и элегантным дизайном

Capcom обновила “Платиновый список”: Resident Evil и Monster Hunter продаются огромными тиражами, а Requiem уже в десятке самых успешных частей

Компрометация удаленного доступа: увидеть и обезвредить

Доменное имя Ask.com выставили на продажу

Какой тип боли может быть признаком рака

Какое молоко самое полезное для здоровья, рассказали врачи

Как снизить риск сердечных заболеваний с помощью 10 продуктов

Жители Японии страдают от ошибки, совершенной 70 лет назад

Пять простых правил успеха, которые могут перевернуть жизнь

Google и Blackstone запускают AI cloud-проект с дата-центрами на 500 МВт

Hisense представила лазерные телевизоры Xplorer X1 Pro: экраны до 120 дюймов и домашний кинотеатр нового уровня

Рекордный доход и планы на IPO: Securitize отчиталась о результатах за I квартал

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA