Исследование OpenAI: больше времени на размышление делает AI более устойчивым к манипуляциям

habr.com

habr.com:

Новое исследование OpenAI показывает, что модели AI становятся более устойчивыми к попыткам манипуляции, если им дать больше времени на «подумать».

Исследователи также обнаружили новые методы атак.Недавнее исследование OpenAI показывает, что предоставление моделям AI большего времени для обработки информации позволяет им лучше противостоять попыткам манипуляции.

Читать на habr.com Все новости от habr.com

Исследование AI выявило ключевые факторы, лежащие в основе долгосрочных способностей LLM к рассуждениям

OpenAI планирует выпустить GPT-4.5 в течение нескольких недель, подготавливая почву для GPT-5

OpenAI готовится к разработке собственных чипов AI к 2026 году

Исследование: reCAPTCHA стоила пользователям 819 млн часов времени

Исследование AI выявило ключевые факторы, лежащие в основе долгосрочных способностей LLM к рассуждениям

OpenAI планирует выпустить GPT-4.5 в течение нескольких недель, подготавливая почву для GPT-5

OpenAI готовится к разработке собственных чипов AI к 2026 году

Исследование: reCAPTCHA стоила пользователям 819 млн часов времени

Стартап по разработке суперинтеллекта бывшего ученого OpenAI Суцкевера может достичь оценки в 20 миллиардов долларов

Hugging Face работает над копированием возможностей OpenAI Deep Research с помощью агента AI с открытым исходным кодом

Исследователи создали открытого конкурента модели рассуждений OpenAI o1 менее чем за $50

Робототехнический стартап Figure AI прекращает партнерство с OpenAI, чтобы создавать собственные модели AI

Китайский конкурент OpenAI o1 Kimi k1.5 теперь доступен бесплатно в веб-версии

OpenAI обновляет Canvas ChatGPT: поддержка модели o1 и рендеринг HTML/React кода

Meta* делает шаг вперед в AI разработке с выпуском Llama-Stack 0.1.0

Claude 3.5 становится более доверительным: Anthropic вводит автоматическое цитирование

OpenAI становится единственным заказчиком предлагаемого проекта инфраструктуры искусственного интеллекта Stargate

SoftBank и OpenAI инвестируют по $19 млрд в проект Stargate

OpenAI заявляет, что может хранить удаленные данные Operator до 90 дней

Microsoft больше не является эксклюзивным поставщиком облачных услуг OpenAI

Сообщается, что OpenAI планирует представить «суперагентов уровня доктора наук» в конце января

AI не справляется с высокоуровневыми историческими экзаменами: исследование показало лишь 46% точности

OpenAI тихо профинансировала независимый математический бенчмарк перед установлением рекорда с o3

OpenAI сотрудничает с Axios в последней медиасделке

OpenAI тестирует регистрацию в ChatGPT только по номеру телефона

Google заключает сделку с Associated Press, чтобы предоставить Gemini больше информации в режиме реального времени

OpenAI возвращается в сферу робототехники

Deepseek v3 на уровне o1 OpenAI: что показывают независимые бенчмарки

OpenAI рассматривает повышение цен на подписки для достижения прибыльности, ввиду убытков

Google запускает SALT: Новый способ ускоренного обучения больших моделей AI с помощью малых

Claude от Anthropic больше не может цитировать ваши любимые песни

Датамайнер раскрыл дату релиза и бонусы Deluxe-издания амбициозного экшена Hell is Us от создателя последних частей Deus Ex

Новая тенденция среди тиктокеров: носить Apple Watch на ноге

Некоторые Mercedes-Benz EQB будут отозваны из-за риска возгорания батареи

Samsung готовит One UI 7 для Galaxy S24 FE - утечка указывает на мартовский релиз

Nothing Phone (3a) будут собирать в Индии

Официально: Grand Theft Auto 6 изначально выйдет лишь на консолях, но порт на ПК также в планах

WB Games Montreal, вероятно, работает над игрой по мотивам "Game of Thrones", - слухи

Спортивная драма для любителей гонок: представлен тизер фильма F1 с Брэдом Питтом в главной роли

Oppo представит новые смарт-часы Oppo Watch X2 20 февраля

Угроза из космоса нависла над гражданской авиацией: ученые оценили риски катастрофы

Бум ИТ-консалтинга: почему проектов становится все больше?

Названы симптомы, которые присущи всем видам рака - это нужно знать всем

Из каких чашек опасно пить горячие напитки, рассказали специалисты

Meta создала технологию для набора текста силой мысли

Аудиторы F.A.C.C.T. подтвердили защищенность информационных систем Selectel

Logitech добавила в приложение Options+ поддержку большего числа устройств

Новая система Ford Pro Delivery Assist автоматически выключает двигатель, закрывает окна, блокирует двери и включает аварийную сигнализацию, когда водители фургонов доставки делают остановки

Проблемы с OLED-панелями от BOE могут вынудить Apple увеличить заказы дисплеев у Samsung и LG

Мощный, тонкий, элегантный: OPPO показала тизер флагманского складного смартфона Find N5 и анонсировала презентацию

Bloomberg: Apple не отказалась от разработки собственных AR-очков, но существенно пересмотрела их концепцию

Древние люди знали толк в искусстве: ученые показали артефакты, которым больше 50 тысяч лет (фото)

Патенты Nintendo показывают, что Switch 2 Joy-Con действительно может работать как мышь

Google добавила SynthID в Magic Editor

Легко не будет: разработчики тактического стелс-шутера Project TH показали впечатляющие возможности ИИ врагов

Resident Evil 5 все же получит обновленную версию: новый возрастной рейтинг косвенно подтвердил планы Capcom

Как предотвратить 80% сердечных приступов у женщин, подсказали врачи

В GitHub Copilot появилась возможность задать кастомные инструкции в репозитории проекта

В Денвере состоится Agents Day — AI x Web3

Strategy потратила более $742 млн на покупку 7633 BTC

Трейдер превратил $5000 в $12 млн на инвестициях в мемкоин

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA