ByteDance разогнала языковую модель в 5.4 раза с помощью дискретной диффузии
ByteDance показала экспериментальную языковую модель Seed Diffusion Preview, основанную на дискретной диффузии, которая работает в 5.4 раза быстрее аналогов того же размера, достигая скорости 2146 токенов в секунду.
При этом качество генерации кода на ключевых бенчмарках остается сопоставимым.Seed Diffusion Preview — это экспериментальная языковая модель на основе диффузии, выпущенная командой ByteDance Seed.
habr.com