«Героиня прикована к полу, но спускается по лестнице»: разбираем логику ИИ-писателей

habr.com

habr.com:

Леч Мазур добавил три модели в свой бенчмарк по оценке навыков написания коротких рассказов. Kimi K2.5 — 8,07 балла, Qwen3 Max — 7,84, MiniMax-M2.1 — 7,78.

Результаты неплохие, но самое ценное в этом бенчмарке — не цифры, а разбор конкретных ошибок.Если вы используете ИИ для текстов, вот на что стоит обращать внимание при проверке.Физическая непрерывность.

Читать на habr.com Все новости от habr.com

OpenAI получила $110 млрд инвестиций при оценке $730 млрд

Ученые решили давнюю загадку магнитного поля Луны: какое оно на самом деле (фото)

СМИ: второй главной героиней новой части Wolfenstein вместе с Би Джеем Бласковицем станет украинская девочка София

Anthropic объяснила, почему ИИ ведет себя как человек — и почему иначе не получится

OpenAI получила $110 млрд инвестиций при оценке $730 млрд

Ученые решили давнюю загадку магнитного поля Луны: какое оно на самом деле (фото)

СМИ: второй главной героиней новой части Wolfenstein вместе с Би Джеем Бласковицем станет украинская девочка София

Anthropic объяснила, почему ИИ ведет себя как человек — и почему иначе не получится

iPhone 18 Pro и iPhone 18 Pro Max получат основную камеру с переменной диафрагмой

Соло-майнер арендовал хешрейт на $75 и получил $200 000 за добытый блок биткоина

Слух: подписчики Xbox Game Pass Ultimate могут получить доступ к World of Warcraft и к платным подпискам других сервисных игр

Новости Warhorse: Kingdom Come получит полнометражную экранизацию, а новая игра студии создается без Даниэля Вавры

Соучредитель Nvidia потерял возможность получить до $600 млрд из-за продажи акций

Threads получил новую функцию: посты можно распространять в Instagram Stories без смены приложений

Опубликовали исследование киберугроз в облачной среде за второе полугодие 2025 года

Как быстро получить заряд энергии, если вы устали или не выспались

Подписчики Xbox Game Pass получили временный бесплатный доступ ко всему контенту Battlefield 6

В Роскомнадзоре не получали требований заблокировать сервисы Linux для пользователей в РФ

Jupiter выпустил Agent Skills — AI-агенты получили доступ к крупнейшему DEX-агрегатору на Solana

В Роскомнадзоре не получали требований заблокировать сервисы обновления Windows для пользователей в РФ

Dyson представила устройство для влажной уборки пола PencilWash

Anthropic представила Sonnet 4.6 — улучшенная логика и контекст до 1 млн токенов

Сын Энтони Скарамуччи купил карту Pokémon Логана Пола за более чем $16 млн

Команда Injective запустила байбэк токенов для сообщества — разбираем механизм

xAI открыл вакансии для профессиональных писателей, журналистов и сценаристов по обучению ИИ

Эксперты и бренды вне поля зрения нейросетей: системная проблема, о которой пока мало говорят - ФОКУС ВНИМАНИЯ

Нынешняя россия не способна победить Украину на поле боя - генерал США

Nvidia пыталась получить книги у пиратов для обучения ИИ

НАСА продолжает разбираться в причинах поломки своей антенны дальней космической связи в США

Samsung Galaxy S26 Ultra получит новейшее поколение защитного стекла Gorilla Glass

Как проверить свое здоровье можно с помощью обычных лестниц - тест

Как SYNERGETIC автоматизировал маркетинговые процессы с MWS Tables

«Биологический компьютер» на основе клеток мозга научили играть в Doom

В Барселоне состоится презентация новой флагманской линейки смартфонов Xiaomi: где смотреть трансляцию

Опубликованы фото смартфонов Moto Razr Fold и Edge 70 в версии FIFA World Cup 26

Bloodborne могла получить ремейк: Bluepoint Games была готова воплотить мечту геймеров, но Sony и FromSoftware не позволили этого

Опасность в банке: как домашние консервы могут превратиться в яд - ФОКУС ВНИМАНИЯ

От разрозненных систем — к единой ЦИМ. Комплексный проект школы в экосистеме nanoCAD

Потанин: с конца 2021 года инвестиции «Интерроса» в финтех превысили $5 млрд

Keychron выпустила бетонную клавиатуру — и это не шутка, а новая версия популярной K2 HE

При каких болезнях чай может быть смертельно опасен

Официально: Paramount покупает Warner Bros. Discovery за $110 миллиардов — это крупнейшая сделка в развлекательной индустрии

Pika Labs запустила Pika AI Selves

Гуманоидные роботы с искусственным интеллектом будут трудиться на заводе BMW

Ученые обнаружили доказательства существования письменности около 40 тысяч лет назад (фото)

Четыре продукта, с которыми строго запрещено сочетать кофе

Астронавт НАСА Майк Финке рассказал, что стал причиной первой медицинской эвакуации НАСА

Tecno анонсировала концепт модульного смартфона с толщиной корпуса 4,9 мм

Космонавт Сергей Тетерятников вошёл в основной состав экипажа миссии Crew-13

В Microsoft Japan — обыск по подозрению в нарушении антимонопольного законодательства

Банки нарастили закупки оборудования для включения в «белые списки»

Генпрокурор штата Нью-Йорк подала в суд на Valve за продвижение азартных игр

Вебинар «Повышение безопасности приложений с применением искусственного интеллекта»

В России зарегистрировали аналог хирургического робота Da Vinci

Британский стартап Wayve привлек 1.2 миллиарда на систему беспилотного вождения

OpenAI опубликовали интервью с Peter Steinberger, разработчиком OpenClaw

Не LLM, а видеомодель: ИИ научили работать в Blender и водить машину без единого слова

Модель, как в Qlik. Фильтрация, как в Power BI. Группировки, как в Tableau

Uber совместно с Joby Aviation запустит электрическое аэротакси в Дубае

Ford начала брать деньги за передний багажник в электромобиле Mustang Mach-E

Пора внедрять новые критерии оценки сложности паролей

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA