Исследователи MIT и Google повышают качество AI-генерируемых изображений без переобучения

habr.com:

Группа исследователей из Нью-Йоркского университета, Массачусетского технологического института и Google нашла способ улучшить изображения, генерируемые AI, заимствуя идеи из последних моделей рассуждений AI, таких как o1 от OpenAI.Их подход повышает качество изображения в процессе генерации, основываясь на том, как модели диффузии уже улучшают изображения с помощью шагов шумоподавления.

В своей статье «Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps» исследователи представляют два ключевых компонента: верификаторы, которые действуют как контролеры качества, и алгоритмы поиска, которые используют эти оценки качества для поиска лучших изображений.Этот подход интересен тем, что он улучшает результаты без переобучения модели AI — вместо этого он оптимизирует сам процесс генерации, подобно тому, как такие модели, как o1 от OpenAI , Gemini 2.0 Flash Thinking от Google и R1 от DeepSeek , совершенствуют свои выходные данные при генерации текста.Система использует несколько типов верификаторов для оценки различных аспектов каждого сгенерированного изображения.

Читать на habr.com Все новости от habr.com

Проект хранилища Monotone перешёл на лицензию MIT

Google TV Streamer получил первое обновление 2025 года: Новые исправления и улучшения безопасности

«Вспомнить всё»: исследователи предложили архитектуру языковых моделей с большой памятью

Исследователи выпустили MedRAX — медицинского ИИ-агента для анализа рентгенограмм грудной клетки

Проект хранилища Monotone перешёл на лицензию MIT

Google TV Streamer получил первое обновление 2025 года: Новые исправления и улучшения безопасности

«Вспомнить всё»: исследователи предложили архитектуру языковых моделей с большой памятью

Исследователи выпустили MedRAX — медицинского ИИ-агента для анализа рентгенограмм грудной клетки

Исследователи Apple показали умную танцующую лампу в стиле Pixar

Исследователи создали открытого конкурента модели рассуждений OpenAI o1 менее чем за $50

Редактор Google Magic Editor будет помечать изображения с помощью искусственного интеллекта водяными знаками