Знакомьтесь, HIGGS — новый метод сжатия LLM от исследователей из Яндекса и ведущих научно-технологических вузов
Исследователи из Yandex Research, НИУ ВШЭ, MIT, KAUST и ISTA разработали новый метод HIGGS для сжатия больших языковых моделей.
Его особенность — высокая производительность даже на слабых устройствах без существенной потери качества. Например, это первый метод квантизации, с помощью которого удалось сжать DeepSeek R1 размером 671 млрд параметров без значительного ухудшения модели.Метод позволяет быстро тестировать и внедрять новые решения на основе нейросетей, экономить время и деньги на разработку.
ПК и смартфоны избегут новых тарифов США, но игровым консолям не повезло попасть в список исключений
habr.com