Вышла Qwen2.5-Coder 32B. Открытая локальная модель для кода небольшого размера конкурирующая с GPT-4o

habr.com:

После выхода Qwen2.5, которая подняла LLM небольших размеров на новый уровень, так как при размере всего 72B и, особенно, 32B - она показывала очень хорошие качество размышления и следования инструкциям, все начали с нетерпением ждать выхода Coder 32B модели, так как ожидали от неё уровня близкого к GPT-4o.И вот, наконец-то, Qwen представила эту коллекцию моделей для кода размерами: 0.5B, 1.5B, 3B, 7B, 14B и 32B.

Размер контекста 128k, лицензия Apache 2.0 (кроме модели 3B). До текущего момента самой популярной локальной моделью для программирования была Codestral 22b, новая же модель в бенчмарке McEval на 40 языках программирования показывает результаты лучше чем она, и по некоторым языкам обгоняет GPT-4o.Падение качества от модели к модели с уменьшением размера B можно оценить из этой таблицы.

Читать на habr.com Все новости от habr.com

Alibaba представила открытую ИИ-модель QwQ-32B-Preview

Вышла OminiControl — нейросеть для перемещения объектов с одного изображения на другое

Вышла превью-версия Xogot — редактора Godot для iPadOS

В Gray Zone Warfare появились ночные операции и новое оружие: для реалистичного шутера вышло первое крупное обновление

Alibaba представила открытую ИИ-модель QwQ-32B-Preview

Вышла OminiControl — нейросеть для перемещения объектов с одного изображения на другое

Вышла превью-версия Xogot — редактора Godot для iPadOS

Для Arma 3 вышло дополнение Expeditionary Forces, которое посвящено морской пехоте и сражениям на воде

Вышло обновление для редактора маинд карт MIND IN MAP от 18.11.2024

В США машины для голосования вышли из строя

«Будет первой украинской игрой, собравшей более $1 млрд». S.T.A.L.K.E.R. 2 вышла в продажу. Сколько студия GSC Game World Максима Криппы может заработать на долгострое