Nvidia представила LLM Llama-3.1-Nemotron-70B. Качественный файнтюн Llama 3.1 для рассуждений

habr.com:

Файнтюн выполнен по методу RLHF (в частности REINFORCE) и показывает хороший результат для задач рассуждений и логики. Новая модель занимает высокое место в метрике Arena Hard, включающая в себя 500 сложных запросов от пользователей, в основном это задачи логики, загадок, рассуждений и математики.

В этих задачах эта модель показывает себя лучше чем Llama-3.1 размером 405B или версии gpt-4o от 13 мая.При этом модель не обучалась для написания кода, поэтому тут модель показывает себя на 3.7% хуже, чем просто Llama-3.1-70B.Размер контекста такой же как и у Llama 3.1 и составляет 128k токенов.Карточка модели: https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct-HFgguf файлы: https://huggingface.co/bartowski/Llama-3.1-Nemotron-70B-Instruct-HF-GGUFДемо онлайн: https://build.nvidia.com/nvidia/llama-3_1-nemotron-70b-instruct https://huggingface.co/chat/models/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF https://lmarena.ai/ (выбрать 2 вкладку side-by-side и найти там нужную модель)Как запускать модели локально на обычном ПК (без видеокарты просто на CPU, на видеокартах включая 8Гб памяти, и на AMD видеокартах).

Читать на habr.com Все новости от habr.com

Nvidia ограничит с 2025 года 100 часами ежемесячное игровое время в облачном сервисе GeForce Now по подписке

Nvidia заменит конкурирующего чипмейкера Intel в индексе Dow Jones

NVIDIA анонсирует AI Blueprint: машинное зрение для анализа видео с камер наблюдения

Steam запустил запись игровых видео — оптимизация для NVIDIA, AMD и Deck, множество режимов

Nvidia ограничит с 2025 года 100 часами ежемесячное игровое время в облачном сервисе GeForce Now по подписке

Nvidia заменит конкурирующего чипмейкера Intel в индексе Dow Jones

NVIDIA анонсирует AI Blueprint: машинное зрение для анализа видео с камер наблюдения

Steam запустил запись игровых видео — оптимизация для NVIDIA, AMD и Deck, множество режимов

Nvidia анонсировала ежемесячные ограничения для GeForce Now, дополнительные часы будут платными

NVIDIA ограничивает игровое время в GeForce Now начиная с 2025 года

Nvidia сообщила о наличии критических уязвимостей в драйверах и ПО для RTX, Quadro, NVS, Tesla и GeForce