Новые модели искусственного интеллекта Phi-4 от Microsoft сочетают в себе большую производительность и компактность
Microsoft представила новый класс высокоэффективных моделей AI, которые обрабатывают текст, изображения и речь одновременно, требуя при этом значительно меньше вычислительной мощности, чем существующие системы.
Новые модели Phi-4 , выпущенные сегодня, представляют собой прорыв в разработке малых языковых моделей (SLM), которые предоставляют возможности, ранее зарезервированные для гораздо более крупных систем AI.Согласно техническому отчету Microsoft, Phi-4-Multimodal , модель с 5,6 миллиардами параметров, и Phi-4-Mini с 3,8 миллиардами параметров превосходят конкурентов аналогичного размера и даже соответствуют или превосходят производительность моделей в два раза большего размера при выполнении некоторых задач .«Эти модели предназначены для того, чтобы предоставить разработчикам передовые возможности AI», — сказал Вэйчжу Чен, вице-президент по генеративному AI в Microsoft. «Phi-4-multimodal, с его способностью обрабатывать речь, зрение и текст одновременно, открывает новые возможности для создания инновационных и контекстно-зависимых приложений».Техническое достижение появилось в то время, когда предприятия все чаще ищут модели AI, которые могут работать на стандартном оборудовании или «на периферии» — непосредственно на устройствах, а не в облачных центрах обработки данных — для снижения затрат и задержек при сохранении конфиденциальности данных.Отличительной чертой Phi-4-Multimodal является его новая технология «смешивания LoRA», позволяющая обрабатывать текст, изображения и речевые входные данные в рамках одной модели.«Используя смесь LoRA, Phi-4-Multimodal расширяет мультимодальные возможности, минимизируя помехи между модальностями», — говорится в исследовательской статье . «Этот подход обеспечивает бесшовную
habr.com