Новая модель Alibaba с открытым исходным кодом QwQ-32B: конкурент DeepSeek?
Qwen Team , подразделение китайского гиганта электронной коммерции Alibaba , разрабатывающее растущее семейство моделей большого языка (LLM) Qwen с открытым исходным кодом, представило QwQ-32B — новую модель рассуждений с 32 миллиардами параметров, предназначенную для повышения производительности при решении сложных задач с помощью обучения с подкреплением (RL).Модель доступна как open-weight на Hugging Face и ModelScope по лицензии Apache 2.0.
Это означает, что она доступна для коммерческого и исследовательского использования, поэтому предприятия могут немедленно использовать ее для питания своих продуктов и приложений (даже тех, за использование которых они взимают плату с клиентов).Напомним, предыдущая модель - QwQ была впервые представлена Alibaba в ноябре 2024 года как модель рассуждений с открытым исходным кодом, призванная конкурировать с o1-preview от OpenAI.Первоначальная версия QwQ, выпущенная еще в ноябре 2024 года (называемая просто «QwQ»), также имела 32 миллиарда параметров и длину контекста в 32 000 токенов.
habr.com