Исследование Hugging Face: Как малые языковые модели превосходят гигантов благодаря масштабированию
В новом исследовании Hugging Face исследователи продемонстрировали, как можно настроить малые языковые модели SLM так, чтобы они превосходили гораздо более крупные модели.
Их результаты показывают, что модель Llama 3 с параметрами 3B может превзойти версию модели 70B в сложных математических задачах.
habr.com