«Кошачья атака» на модель рассуждений показывает, насколько важна контекстная инженерия

habr.com

habr.com:

Исследовательская группа обнаружила, что даже такие простые фразы, как «кошки спят большую часть своей жизни», могут существенно нарушить работу продвинутых моделей логического мышления, увеличив количество ошибок в три раза.Языковые модели, оптимизированные для рассуждений, часто считаются прорывом в решении задач, требующих поэтапного мышления.

Однако новое исследование «Кошки сбивают с толку рассуждающие языковые модели» показало, что всего одно обычное предложение может резко увеличить количество ошибок.Команда создала автоматизированную систему атак под названием CatAttack.

Читать на habr.com Все новости от habr.com

Mistral AI публикует первую комплексную оценку жизненного цикла большой языковой модели

Компания Tencent выпустила открытую 3D-модель HunyuanWorld-1.0

Yandex B2B Tech открыла доступ к крупнейшей языковой модели Qwen3

Hierarchical Reasoning Model: иерархическая модель рассуждений, имитирующая работу мозга человека

Mistral AI публикует первую комплексную оценку жизненного цикла большой языковой модели

Компания Tencent выпустила открытую 3D-модель HunyuanWorld-1.0

Hierarchical Reasoning Model: иерархическая модель рассуждений, имитирующая работу мозга человека

Qwen3-MT — Alibaba выпускает еще одну модель для машинного перевода

Alibaba выпустила «самую мощную» ИИ-модель для программирования — Qwen3-Coder

NVIDIA представила модели OpenReasoning-Nemotron на базе DeepSeek для запуска на игровых ПК

Перегрузка языковых моделей информацией приводит к нерелевантным ответам

OpenAI тестирует новую модель o3 Alpha для программирования на WebArena

Т-Банк представил ИИ-модель T-Pro 2.0 с гибридными рассуждениями, которая вдвое экономнее DeepSeek R1-Distil

FlexOlmo позволяет организациям совместно обучать языковые модели без обмена данными

Decart запустил MirageLSD — модель искусственного интеллекта, которая преобразует видео в реальном времени

Adobe представила обновления для Firefly: новые звуковые эффекты и интеграция моделей ИИ

Voxtral — новая модель распознавания речи от Mistral, которая дешевле проприетарных аналогов

OpenAI усиливает меры безопасности, чтобы не дать конкурентам скопировать свои передовые модели ИИ

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач

Компания Huawei опровергла обвинения в плагиате моделей ИИ

Искусственный интеллект возрождает успешную модель Александра Дюма

Alibaba представила Qwen VLo: мультимодальная модель для работы с изображениями

Почему наблюдаемость так важна для экосистем ИИ-агентов?

Hunyuan-A13B от Tencent: языковая модель с динамическим подходом к рассуждению

Заявления Apple о больших моделях обработки данных стали предметом нового исследования

Исследование Pfizer о причинах трудностей больших языковых моделей при решении задач

Meta* нанимает ключевого исследователя OpenAI для работы над моделями рассуждений ИИ

Новый эксперимент с Othello подтверждает гипотезу о модели мира для больших языковых моделей

YouTube встраивает модель Veo 3 для создания видеороликов прямо в Shorts

OpenAI обнаружила скрытые функции в моделях ИИ, которые приводят к несогласованным ответам

Midjourney запускает свою первую видеомодель, которая превращает изображения в короткие ролики

Удалите этот тип приложений со своего iPhone и Android, если хотите избежать киберпреступников

Самый полезный завтрак в Израиле назвал диетолог

Как долго можно жевать жвачку - стоматологи удивили ответом

Врачи рассказали, кому стоит отказаться от кофе и почему

Chevrolet Bolt нового поколения получит китайскую батарею

Раскрыты характеристики китайских Tesla Model 3+ и Model Y L

На Amazon стали продавать Pixel Tablet Pen - стилус от Google, который так и не вышел (фото)

ROG Xbox Ally выйдет раньше, чем ожидалось: инсайдер раскрыл точную дату старта продаж новых консолей от Microsoft и ASUS

Samsung подтвердила, что произвела аккумуляторы для электромобиля с самым большим запасом хода в мире

Через детектор вейпов можно подслушивать людей через детектор вейпов

Можно ли пить зеленый чай при повышенном давлении - врачи поставили точку в спорах

Самые полезные морепродукты для нашего здоровья - врачи составили список

ТОП-5 вопросов, которые обязательно стоит задать на первом свидании

Опубликованы официальные изображения часов Google Pixel Watch 4

DOOM: The Dark Ages получил крупное обновление — исправлены баги, подкорректирован баланс и добавлен новый режим Ripatorium

Tesla закрывает собственный суперкомпьютер для тренировки AI Dojo

54 минуты с Михаилом Поливахой | Spring АйО Подкаст №29

Учим Cloud Video лучше понимать людей — и представляем новую версию нашего сервиса

Пять продуктов, которые больше всего вредят сердцу, назвал американский эксперт

Зуд кожи может свидетельствовать о серьезных проблемах с органами - что надо знать

Почки "запоминают" все: врач рассказал, какие вещи незаметно убивают орган

Популярная головоломка о возрасте взорвала соцсети и рассорила пользователей

Молодой Джеймс Бонд заинтриговал геймеров: всего за два месяца экшен 007 First Light 750 тыс человек добавили в свой Wishlist

YouTube Music чи Spotify: що обрати, якщо ви не аудіофіл

iPhone 16 Pro выпал из самолета и остался цел, даже видеосъемку не прекратил

Три вещи в вашем доме могут указывать, что вы очень несчастны

iPhone 17 Pro минимально получит 256 ГБ памяти

Какие органы нашего организма стареют быстрее всего и с чего все начинается

Желтые или зеленые: какие бананы самые полезные, рассказали врачи

На рынке дебютировал iQOO Z10 Turbo+ — доступный смартфон с топовым чипсетом Dimensity 9400+, AMOLED-дисплеем и аккумулятором на 8000 мАч

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA