Microsoft выпустила VibeVoice — открытую TTS-модель для генерации диалогов и подкастов продолжительностью до 90 минут

habr.com

habr.com:

Исследователи Microsoft Research представили VibeVoice — модель для генерации диалогов из текста. Главная особенность TTS-системы в том, что она может создавать диалоги продолжительностью до 90 минут с четырьмя действующими лицами.В основе архитектуры VibeVoice лежит языковая модель Qwen2.5-1.5B.

Она анализирует сценарий, удерживает контекст и управляет генерацией. Также в системе есть два токенизатора: акустический и семантический.

Читать на habr.com Все новости от habr.com

Tencent представила открытую ИИ-модель для генерации трёхмерных видео по картинке

Atari выпустила Gamestation Go — портативную консоль для поклонников ретро-гейминга

Релиз PicView 3.2.0.1 — открытого просмотрщика изображений для ПК на Windows 10/11 и macOS

Snapchat запустила инструмент для генерации изображений по промптам

Tencent представила открытую ИИ-модель для генерации трёхмерных видео по картинке

Atari выпустила Gamestation Go — портативную консоль для поклонников ретро-гейминга

Релиз PicView 3.2.0.1 — открытого просмотрщика изображений для ПК на Windows 10/11 и macOS

Snapchat запустила инструмент для генерации изображений по промптам

Microsoft готовится изменить цены на Copilot для бизнеса

Релиз NWinfo 1.4.3 — открытого портативного инструмента для быстрого просмотра ключевых характеристик ПК на Windows

Microsoft выпустила PowerToys 0.94

Droplet3D: новая модель для генерации 3D-объектов из видео

Microsoft прекратит поддержку браузерных расширений Editor для Chrome и Edge с 31 октября

Tencent представила новую модель для перевода текста

VK выложила в открытый доступ датасет для инженеров, развивающих рекомендательные системы

PixVerse представила модель V5 для генерации видео

ByteDance выпускает Waver 1.0 для генерации видео

Microsoft выпустила обновления Windows Terminal 1.23

Nvidia выпустила большой открытый набор данных Granary для обучения ИИ и работы с текстами на европейских языках

Nvidia и Национальный научный фонд США создают открытые ИИ-модели для исследователей

Вышел ToonComposer — инструмент для генерации аниме по ключевым кадрам

Cloudflare выпустила Pingora v0.6.0 для разработки защищённых высокопроизводительных сетевых сервисов на языке Rust

Разработчики выпустили Jan-v1 — локальную нейросеть для веб-поиска, конкурирующую с Perplexity Pro

Вышла Matrix-Game 2.0 — открытая модель для генерации интерактивных 3D-миров

Microsoft представила ИИ-агента Project Ire для поиска скрытых вредоносов

Microsoft выпустила собственный Python-драйвер для MS SQL, в тестах он быстрее pyodbc

Релиз PicView 3.2 — открытого просмотрщика изображений для ПК на Windows 10/11 и macOS

JetBrains анонсировала Kineto — ноукод-платформу с нейросетями для генерации приложений и сайтов

Xiaomi выложила в опенсорс SOTA-модель для универсального понимания аудио

ElevenLabs запустила IIElevenMusic — конкурента Suno для генерации музыки

«Сбер» на конференции ACL 2025 представил новую модель для улучшения поиска и создания чат-ботов GigaEmbeddings

Нейросети для руководителей: новый тариф курса по управлению командой в Практикуме

Спелый авокадо за 10 минут: простой лайфхак от экспертов

Разработчики смогут быстрее получать доступ к официальной документации Microsoft через сервер MCP

OpenAI ускорила работу ChatGPT. Но не все пользователи довольны

7 изменений в образе жизни, которые помогают бороться с раком и снижают риск заболевания

Продукты, которыми нельзя закусывать алкоголь, назвали диетологи

Почему перед смертью люди теряют обоняние - врачи нашли ответ

Стали известны цены Xiaomi 15T, 15T Pro и Redmi Pad 2 Pro

Владельцы iPhone с iOS 26 получили доступ к приложениям Apple через спутниковую связь Starlink в США

Zoom готовит к выпуску реалистичные ИИ-аватары, которые смогут разговаривать на встречах вместо пользователей

Вышла стабильная версия systemd 258

Первые жалобы на iPhone 17: конденсат в камере и царапины на корпусе

Релиз рабочего окружения GNOME 49 Brescia

Путешественница посетила 90 стран и выбрала 5 самых впечатляющих мест

Выпуск Mozilla Thunderbird 143.0

Разделение Африканского континента: что ждет планету в случае полного разлома

Осеннее равноденствие 2025 открывает портал перемен: к чему готовиться знакам Зодиака

ИИ OpenAI набрал 12/12 на Олимпиаде по программированию. Официальные чемпионы — команда СПбГУ

Представлена серия портативных твердотельных накопителей SanDisk ELE

В Китае в институт поступил робот-гуманоид

ВТБ закупил 13 тысяч российских планшетов Kvadra_T на KvadraOS

Anker выпустила Soundcore Sleep A30: наушники, которые заботятся о вашем сне

Представлен зарядный адаптер Baseus PicoGo AE21

Китай объявил бойкот AI-чипам Nvidia: удар по Alibaba и ByteDance

Google представила приложение для Windows, похожее на Apple Spotlight

На Камчатке не будет быстрого интернета минимум четверо суток — с 25 по 29 сентября 2025 года

Алкоголь помогает в обучении - ученые опубликовали неожиданное исследование

Артур Хейс спрогнозировал рост крипторынка по мере заполнения TGA

Три вещи, на которых держатся здоровые отношения

Пиратский контент на Rutube загружают пользователи, Netflix и другие компании не жалуются в сервис на эти нарушения

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA