X-Omni от Tencent: авторегрессионная text-to-image модель с RL

habr.com

habr.com:

X-Omni — методика обучения T2I моделей, которая наглядно доказывает, что RL может вдохнуть новую жизнь в авторегрессионный подход и вывести такие модели на SOTA-уровень.X-Omni построена на гибридной, но при этом унифицированной архитектуре.

Семантический токенизатор изображений SigLIP-VQ с фиксированным словарем на 16 384 токена кодирует картинку в дискретные токены.

Читать на habr.com Все новости от habr.com

Qwen Image Edit — новый шаг к умному и смысловому редактированию фото

X-Omni от Tencent бросает вызов GPT-4o в генерации изображений, опираясь на опенсорс

Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o

Baidu до конца месяца выпустит новую ризонинг-модель

Qwen Image Edit — новый шаг к умному и смысловому редактированию фото

X-Omni от Tencent бросает вызов GPT-4o в генерации изображений, опираясь на опенсорс

Baidu до конца месяца выпустит новую ризонинг-модель

Xiaomi выложила в опенсорс SOTA-модель для универсального понимания аудио

Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Cohere выпустила новую мультимодальную модель Command A Vision

Nvidia представит на SIGGRAPH 2025 ИИ-модель Queen для создания 3D-видео

ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии

Вышел Mass Image Compressor 4.1.0 для Windows для сжимания, изменения размера и конвертации больших наборов изображений

Horizon Alpha: загадочная модель, которую уже считают «младшим GPT-5»

Появилась новая опенсорсная модель FLUX.1-Krea-dev

Google DeepMind представила Gemini 2.5 Deep Think — новую мультиагентную модель ИИ

DeepMind показала модель для создания цифрового двойника Земли

Skild Brain: единая модель для управления любыми роботами

Компания Tencent выпустила открытую 3D-модель HunyuanWorld-1.0

Yandex B2B Tech открыла доступ к крупнейшей языковой модели Qwen3

Hierarchical Reasoning Model: иерархическая модель рассуждений, имитирующая работу мозга человека

Qwen3-MT — Alibaba выпускает еще одну модель для машинного перевода

Alibaba выпустила «самую мощную» ИИ-модель для программирования — Qwen3-Coder

NVIDIA представила модели OpenReasoning-Nemotron на базе DeepSeek для запуска на игровых ПК

Перегрузка языковых моделей информацией приводит к нерелевантным ответам

OpenAI тестирует новую модель o3 Alpha для программирования на WebArena

FlexOlmo позволяет организациям совместно обучать языковые модели без обмена данными

Decart запустил MirageLSD — модель искусственного интеллекта, которая преобразует видео в реальном времени

Google запустили модель для создания видео Veo 3 на Gemini API по высокой цене

Adobe представила обновления для Firefly: новые звуковые эффекты и интеграция моделей ИИ

Voxtral — новая модель распознавания речи от Mistral, которая дешевле проприетарных аналогов

Хакеры научились прятать вредоносное ПО в смарт-контрактах Ethereum

Комиссарка CFTC раскритиковала одобрение рынков прогнозов перед своим уходом

Стартовал The International 2025 — узнайте главные подробности самого престижного киберспортивного турнира года

Acer представила легкий бизнес-ноутбук TravelMate X14 AI с обширной поддержкой ИИ-функций

AIRI открывает этический комитет по ИИ в биомедицине

27 сентября в Москве пройдёт конференция Perl-Conf.Ru/25

В МГУ объявили о создании факультета искусственного интеллекта

Как правильно мыть овощи, фрукты и зелень, чтобы избежать проблем со здоровьем

Стресс-тесты для отношений: три испытания, которые лучше пройти до брака

Официально: главную роль в сериале Tomb Raider исполнит звезда “Игры престолов” Софи Тернер — съемки стартуют в середине января 2026 года

Океанологи обнаружили тревожное явление: закисление океана угрожает акулам

СМИ: Mistral AI привлечет более $2 млрд при оценке в $13 млрд

Представлен флагманский ноутбук Acer Predator Helios 18P AI

Ripple сообщил о запуске стейблкоина RLUSD в Африке

Samsung представила Galaxy S25 FE — недорогой флагманский смартфон с топовыми характеристиками и самыми передовыми ИИ-возможностями

Click.ru проводит Марафон кейсов

Stargate в действии: OpenAI запустит крупнейший дата-центр в Азии

Apple признала MacBook Air (2015), MacBook Pro (2017) и iPhone 8 Plus устаревшими устройствами

ИИ в медицине: исследование показало слабое место языковых моделей

ИИ Gemini 2.5 не справился с кодом и предложил оплатить услуги профессионала

Google DeepMind доказали: любой ИИ неизбежно учится строить модель мира

Может ли подгоревшая пища спровоцировать рак - врачи поставили точку в этом вопросе

Ланчбокс для школьника: медики назвали лучшие и худшие перекусы для вашего ребенка

У вас нет своей жизни: пользователи соцсетей поспорили, когда стоит бить тревогу

Конец эпохи - Samsung официально прекратила поддержку последнего Galaxy Note

Тактическая игра Commandos: Origins выйдет на консолях прошлого поколения PS4 и Xbox One уже 17 сентября

Garmin представила серию Fenix 8 Pro, в которую входят первые в мире смарт-часы с MicroLED-дисплеем

Глава ЕЦБ призвала к ужесточению регулирования отдельных эмитентов стейблкоинов

CEO Coinbase поставил цель достичь доли написанного ИИ исходного кода в 50%

Билайн AdTech и МТС AdTech начнут развивать таргетинг в Telegram — теперь с данными двух операторов

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA