Stability AI выпускает модель преобразования текста в звук, которая работает на мобильных устройствах

habr.com:

Stability AI и Arm выпустили компактную модель преобразования текста в звук, которая работает на смартфонах и способна генерировать стереофонические аудиоклипы продолжительностью до 11 секунд примерно за 7 секунд.Модель под названием Stable Audio Open Small основана на методе, известном как «состязательный релятивистско-контрастный» (ARC), разработанном исследователями из Калифорнийского университета в Беркли и других учреждений.

На высокопроизводительном оборудовании, таком как графический процессор Nvidia H100, она может воспроизводить стереозвук частотой 44 кГц всего за 75 миллисекунд — достаточно быстро для генерации практически в реальном времени.Первоначальная версия Stable Audio Open была выпущена в прошлом году как бесплатная модель с открытым исходным кодом с 1,1 миллиарда параметров.

Читать на habr.com Все новости от habr.com

Модели ИИ могут определять, когда их тестируют, и вести себя по-другому

Anthropic ограничивает доступ к моделям Claude 3.x из-за планов OpenAI приобрести Windsurf

Meta* запускает программу, призванную стимулировать стартапы к использованию моделей ИИ Llama

Новая модель ИИ от Anthropic переходит к шантажу, когда инженеры пытаются отключить её

Модели ИИ могут определять, когда их тестируют, и вести себя по-другому

Anthropic ограничивает доступ к моделям Claude 3.x из-за планов OpenAI приобрести Windsurf

Meta* запускает программу, призванную стимулировать стартапы к использованию моделей ИИ Llama

Как модель ИИ Anthropic Claude Opus 4 выражает себя через эмодзи

OpenAI обновляет модель искусственного интеллекта, на которой работает агент Operator

Document AI от Mistral извлекает текст из документов и заметок с высокой точностью

Палата представителей США приняла законопроект, который запретит регулирование ИИ на 10 лет