Вышел Mercury Coder: первая модель на принципиально новой архитектуре dLLM, в 10 раз быстрее LLM

habr.com:

Текущие большие языковые модели (LLM) являются авторегрессивными, то есть генерируют текст слева направо, по одному токену за раз.

Этот процесс по своей природе последовательный — новый токен не может быть сгенерирован, пока не сформирован весь предшествующий текст (потому что он поступает в виде контекста на вход нейросети для генерации следующего токена), а генерация каждого токена требует вычислений в модели с миллиардами параметров.Компании, работающие над передовыми LLM, делают ставку на дополнительную генерации в процессе подготовки ответа для улучшения логических рассуждений (reasoning) и исправления ошибок, но генерация длинных цепочек рассуждений приводит к резкому росту затрат на вычисления и огромной задержке (минуты).Чтобы сделать высококачественные AI-решения по-настоящему доступными, необходима смена парадигмы.Диффузионные модели обеспечивают такую смену.

Читать на habr.com Все новости от habr.com

Акула и осьминог: ученых поразило необычное зрелище в океане – видео

Вышел пиринговый видеохостинг PeerTube 7.1

Samsung подтверждает дату выхода One UI 7 для более старых моделей Galaxy: новые устройства в списке обновлений

BYD анонсирует технологию зарядки в два раза быстрее, чем Tesla

Акула и осьминог: ученых поразило необычное зрелище в океане – видео

Вышел пиринговый видеохостинг PeerTube 7.1

Samsung подтверждает дату выхода One UI 7 для более старых моделей Galaxy: новые устройства в списке обновлений

BYD анонсирует технологию зарядки в два раза быстрее, чем Tesla

Вышел CrossOver 25.0.0 для macOS и Linux

Тихий океан сотрясается: ученые нашли новый способ фиксировать подземные толчки под водой

В Бразилии рассмотрят законопроект о регулировании зарплат в криптоактивах