Xiaomi выложила в опенсорс SOTA-модель для универсального понимания аудио

habr.com

habr.com:

Компания Xiaomi официально выпустила и открыла исходный код большой модели MiDashengLM-7B с функцией распознавания звука. Этот компонент является ключевым элементом стратегии компании по созданию «полноценной экосистемы людей, автомобилей и домов».

MiDashengLM обладает возможностью кросс-доменного анализа, объединяя понимание голоса, окружающих звуков и музыки. Модель не только распознаёт происходящее вокруг пользователя, но и анализирует скрытый смысл событий, улучшая общее понимание контекста.Взаимодействие с пользователями происходит через естественный язык, что делает общение более человечным.

Читать на habr.com Все новости от habr.com

Baidu до конца месяца выпустит новую ризонинг-модель

Anthropic выпустила опенсорсный инструмент для автоматической проверки кода на уязвимости

Grok 2 будет опубликован в опенсорс на следующей неделе

X-Omni от Tencent: авторегрессионная text-to-image модель с RL

Baidu до конца месяца выпустит новую ризонинг-модель

Anthropic выпустила опенсорсный инструмент для автоматической проверки кода на уязвимости

Grok 2 будет опубликован в опенсорс на следующей неделе

X-Omni от Tencent: авторегрессионная text-to-image модель с RL

Nvidia представит на SIGGRAPH 2025 ИИ-модель Queen для создания 3D-видео

ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии

Horizon Alpha: загадочная модель, которую уже считают «младшим GPT-5»

Появилась новая опенсорсная модель FLUX.1-Krea-dev

Google DeepMind представила Gemini 2.5 Deep Think — новую мультиагентную модель ИИ

DeepMind показала модель для создания цифрового двойника Земли

Skild Brain: единая модель для управления любыми роботами

Компания Tencent выпустила открытую 3D-модель HunyuanWorld-1.0

Hierarchical Reasoning Model: иерархическая модель рассуждений, имитирующая работу мозга человека

Alibaba выпустила «самую мощную» ИИ-модель для программирования — Qwen3-Coder

Илон Маск намерен привлечь ещё $12 млрд кредитов на закупку ускорителей Nvidia для Grok

NVIDIA представила модели OpenReasoning-Nemotron на базе DeepSeek для запуска на игровых ПК

OpenAI тестирует новую модель o3 Alpha для программирования на WebArena

Т-Банк представил ИИ-модель T-Pro 2.0 с гибридными рассуждениями, которая вдвое экономнее DeepSeek R1-Distil

Decart запустил MirageLSD — модель искусственного интеллекта, которая преобразует видео в реальном времени

Google запустили модель для создания видео Veo 3 на Gemini API по высокой цене

Adobe представила обновления для Firefly: новые звуковые эффекты и интеграция моделей ИИ

Reflection представил Asimov: ИИ-агент, созданный для отслеживания каждого этапа разработки ПО

Google Cloud Platform становится новым партнером для ChatGPT

xAI ищет инженера для создания аниме-девушек, а Маск показал нового персонажа в стиле аниме

AWS запустила AgentCore для простого создания готовых к использованию ИИ-агентов

Google представил продвинутые ИИ-инструменты для поиска: теперь ИИ может звонить от имени пользователей

Google тестирует интерфейс Chrome для Android с кнопкой ИИ-режима

Больше не эксклюзив: Google сделала видеоредактор Vids доступным всем пользователям

Творческие команды КРОК разработали собственные проекты на BE/TA CAMP

Сервис для ведения блогов Typepad завершает работу спустя 22 года

В мессенджере Max появились видеокружки

На популярном курорте началась "война" с туристами

Как освободить память на Android: места в смартфоне, которые нужно регулярно чистить

За год в Crusader Kings 3 прошло 3,4 млн похорон и создано 30 млн собственных персонажей: в честь 5-летия популярной стратегии Paradox опубликовала интересную статистику

Как Илон Маск переделывает Grok по своему образу и подобию

Семь овощей, которые способны замедлить старение организма

К Земле приближается астероид — за ним можно будет наблюдать в прямой трансляции

HMD готовит бюджетный смартфон с хорошим экраном Pulse 2 Pro

Бюджетная модель серии Pixel 10 скоро появится в продаже: инсайдер раскрыл некоторые характеристики нового смартфона Google

Ученые создали перекати-поле для Луны: робот пройдет там, где застрянут другие

К нам приближается астероид размером с авиалайнер: это можно увидеть в прямом эфире (видео)

На четверть увеличили выручку в первом полугодии

Некоторые диалоги с ChatGPT могут быть переданы в полицию — OpenAI

Как повлияют новые требования Google на российских разработчиков — экспертное мнение

Microsoft обещает улучшить качество звука по Bluetooth в Windows 11

Лингвисты НИУ ВШЭ — Санкт-Петербург создали уникальный «эмоциональный словарь» для обучения ИИ

Threads тестирует способ делиться длинными текстами на платформе

Samsung Galaxy Tab A11 4G протестирован в Geekbench

Helldivers 2 получила крупное обновление Into The Unjust — игрокам предлагают отправиться на родные планеты Терминидов

Продукт для гипертоников, который поможет снизить давление

Дія первой в мире ввела искусственный интеллект в сфере предоставления государственных услуг - как это работает

Инсайдер: новая консоль Xbox будет в два раза дороже PlayStation 6 — и все из-за Steam и других сторонних магазинов

Исследование: большинство опенсорсных проектов держатся на одном разработчике

Японский город предлагает ограничить использование смартфонов двумя часами в день

Маск судится с Apple и OpenAI, прорыв в мобильной съемке и новые игровые патенты: дайджест новостей

«Умный город» в 2024 году закрыл более 15 тысяч проблемных обращений

Nvidia и Carbon Robotics показали роботрактор для уничтожения сорняков

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA