Исследование способности языковых моделей к логическим рассуждениям — тест RELIC

habr.com

habr.com:

Исследователи из Нью-Йоркского университета представили RELIC (Recognition of Languages In-Context) — новый тест, разработанный для проверки того, насколько хорошо большие языковые модели могут понимать и выполнять сложные многоэтапные инструкции.

Команда получила результаты, аналогичные тем, что были представлены в недавней статье Apple, но отметила, что есть ещё над чем поработать.Тест RELIC работает следующим образом: ИИ получает формальную грамматику — по сути, точный набор правил, определяющих искусственный язык, — а также строку символов.

Читать на habr.com Все новости от habr.com

Hunyuan-A13B от Tencent: языковая модель с динамическим подходом к рассуждению

Исследование: ИИ-модели стали чаще советовать ничего не делать и говорить «нет»

Авторы Marvel Rivals показали способности Феникс в новом геймплейном трейлере

Языковые модели ИИ научились распознавать эмоции и скрытый смысл лучше некоторых людей

Hunyuan-A13B от Tencent: языковая модель с динамическим подходом к рассуждению

Исследование: ИИ-модели стали чаще советовать ничего не делать и говорить «нет»

Авторы Marvel Rivals показали способности Феникс в новом геймплейном трейлере

Языковые модели ИИ научились распознавать эмоции и скрытый смысл лучше некоторых людей

Исследование Pfizer о причинах трудностей больших языковых моделей при решении задач

Исследователи DeepSeek выпустили nano-vLLM — компактный движок для запуска языковых моделей

Новый эксперимент с Othello подтверждает гипотезу о модели мира для больших языковых моделей

Простой способ улучшить умственные способности назвали эксперты

EA Sports College Football 26 выходит на новый уровень: 2800 новых розыгрышей, "Платиновые" способности и полный контроль над полем игры

Как на организм влияет бессонница – исследование

Rednote выпускает свою первую языковую модель с открытым исходным кодом и архитектурой Mixture-of-Experts

Все акулы в мировом океане соблюдают одно старое правило - интересное исследование ученых

Как стресс влияет на организм - исследование

Украина разработает национальную большую языковую модель (LLM)

Новый метод адаптирует языковые модели без обучения

В Украине начали создание первой национальной большой языковой модели

Исследование спутников Урана выявило его темную сторону

Пугливость кошки может быть тревожным симптомом - новое исследование ученых

ИИ научился распознавать данные как человек, — исследование

«Ростелеком» и ИРИ выпустили исследование о новых интернет‑технологиях и использовании ИИ

Международная группа учёных определила границы сжатия информации для языковых моделей

Иллюзия интеллекта: что исследование Apple раскрывает о способности ИИ рассуждать

МТС вложила 1 млрд рублей в развитие своих языковых моделей

Кошки и собаки способны видеть сны - исследование

Исследование: модем Apple C1 в iPhone 16e оказался слабее решений Qualcomm в тесте на скорость

Как ходьба влияет на умственные способности – ответ экспертов

Почему взрослые не запоминают моменты из детства - новое исследование ученых

OneNote для Windows получило поддержку Dynamic DPI

Прорыв в области диабета: напечатанные на 3D-принтере островки поджелудочной железы могут заменить уколы инсулина

Каким "преимуществом" обладают люди, ложащиеся спать рано - ответ ученых

Идеи для осеннего отпуска: шесть топовых мест Европы

Грозит дисфункцией почек: кому нельзя пить более трех чашек кофе в день

Что нужно есть утром, чтобы похудеть, рассказали диетологи

Популярные средства для похудения могут вызвать серьезную болезнь

Tinder начал проверять профили новых пользователей в Калифорнии с помощью технологии распознавания лиц

Samsung Galaxy S26 Ultra получит аккумулятор прежней емкости, но с большей плотностью

ТОП-8 тревожных сигналов, что новый партнер вас просто использует, назвал психолог

Новый Alpine A290 Rallye готов раскидывать грязь и гравий за 60 тысяч евро

Еще одна жертва увольнений в Microsoft: Blizzard завершает контентную поддержку мобильной игры Warcraft Rumble

Бензиновый Ford Mustang вновь обогнал электрический Mach-E по продажам в США

Шеф-дизайнер Mercedes заявил, что EQS вышел слишком рано и второго поколения не будет

Redmi Note 14 Pro и Pro+ теперь доступны в элегантном цвете Champagne Gold

Представлено умное кольцо Pebble HALO с цифровым дисплеем

Сеанс со списанием: мошенники похищают деньги под предлогом онлайн-просмотра кино

Вещество, останавливающее рост раковых клеток, ученые нашли в популярной специи

Три продукта, которые снижают риск развития деменции, обнаружили ученые

Honda и Sony потеряли $360 миллионов на автомобиле Afeela ещё до старта продаж

Techland возвращается к истокам: авторы Dying Light работают над новой частью Call of Juarez

Блогер показал жизнь, полностью лишенную Google

Из-за ошибки тысячи жителей Норвегии стали «миллионерами» после «выигрыша» в лотерее

Instagram** теперь позволяет делиться песнями Spotify со звуком в Stories

В Сочи сделали парковки для электросамокатов вне тротуара

Завтра Земля будет дальше всего от Солнца: что это значит для нас

Раньше не встречались: ученые открыли три новых минерала

EGS запустил раздачу музыкальной адвенчуры Figment и roguelike-игры Backpack Hero

Motorola выпустила бюджетный смартфон Moto G100 Pro с неплохими характеристиками за разумные деньги

Релиз Qmmp 2.2.7 — открытого мультимедийного проигрывателя на базе Qt для Windows и Linux

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA