Исследователи из Unsloth сжали DeepSeek R1 на 80% от оригинального размера

habr.com

habr.com:

Исследователи из компании Unsloth, которая специализируется на обучении и файнтюнинге языковых моделей, сжали нейросеть DeepSeek R1 на 80% от оригинального размера.

В итоге языковая модель занимает 131 ГБ вместо 720 ГБ, а запускать её можно на более слабом железе. При этом производительность модели всё ещё остаётся на достаточно высоком уровне.В своём проекте исследователи использовали китайскую большую языковую модель DeepSeek R1 с 671 млрд параметров.

Читать на habr.com Все новости от habr.com

Исследователи обнаружили, что больше не нужна тонна данных, чтобы обучить LLM выполнению логических задач

Исследователи обучают искусственный интеллект интерпретировать эмоции животных

«На уровне с OpenAI и лучше DeepSeek и Gemini». Исследователь искусственного интеллекта Андрей Карпаты протестировал обновленную языковую модель Grok Маска. Что она умеет

Исследователи обучают ИИ интерпретировать эмоции животных

Исследователи обнаружили, что больше не нужна тонна данных, чтобы обучить LLM выполнению логических задач

Исследователи обучают искусственный интеллект интерпретировать эмоции животных

«На уровне с OpenAI и лучше DeepSeek и Gemini». Исследователь искусственного интеллекта Андрей Карпаты протестировал обновленную языковую модель Grok Маска. Что она умеет

Исследователи обучают ИИ интерпретировать эмоции животных

История рифов в Эйлате переписана: израильские исследователи сделали неожиданное открытие

«Вспомнить всё»: исследователи предложили архитектуру языковых моделей с большой памятью

Исследователи выпустили MedRAX — медицинского ИИ-агента для анализа рентгенограмм грудной клетки

Исследователи создали открытого конкурента модели рассуждений OpenAI o1 менее чем за $50

Яндекс добавил в Шедеврум возможность протестировать визуальную модель от DeepSeek

Не только Xiaomi: Honor также интегрирует DeepSeek-R1 для своего AI-ассистента YOYO

Oppo Find N5 получит интеграцию с DeepSeek-R1

Эксперты Feroot Security выяснили, что после регистрации DeepSeek передаёт данные пользователей в China Mobile

Исследователи Nvidia демонстрируют прогресс в обучении роботов

CEO Anthropic: ИИ-модель DeepSeek «худшая» в тесте на безопасность данных

DeepSeek для iOS передает незашифрованные данные: эксперты предупреждают о серьезных угрозах

Американские законодатели запретят DeepSeek на правительственных устройствах

В Австралии запретили использовать DeepSeek в госсистемах и рабочих ПК чиновников по соображениям нацбезопасности

Исследователи создали конкурента ChatGPT и DeepSeek-R1 всего за $50

Исследователи поместили ИИ в робота для лучшего понимания мира

Исследователи разработали ткань для сохранения тепла зимой

Осторожно, PDF: исследователи рассказали, как злоумышленники используют PDF-файлы для кражи данных через SMS и Email

Исследователь из Wiz Research раскрыл действия в рамках пентеста сетевых ресурсов DeepSeek

Исследователи безопасности обнаружили большую уязвимость в DeepSeek

Исследователи взломали модель DeepSeek-R1 для создания вредоносных выходных данных

Исследователи MIT и Google повышают качество AI-генерируемых изображений без переобучения

Исследователи открыли планету с самыми сильными ветрами во Вселенной

Исследователи открыли Sky-T1, модель AI с «рассуждающими» возможностями

Всего $41 млн — создатель Kingdom Come: Deliverance 2 раскрыл поразительно скромны производственный бюджет игры

Амбициозная экшен-RPG Empyreal скоро получит демоверсию: разработчики рассказали о главных особенностях игры и пригласили Steam Next Fest

Oppo Find X8 Ultra может получить кнопку действия, как в iPhone 16, вместо ползунка оповещений

Пользователи смартфонов серии Samsung Galaxy S25 массово жалуются на перегрев этих устройств без особых на то причин

Продукт, который нельзя разогревать - может стать причиной рака

Команда Hugging Face представила собственную открытую реализацию агента DeepResearch от OpenAI

Вышел Pickle — сервис для генерации цифровых аватаров, которых можно использовать на созвонах

ТОП-3 овоща, которые "очистят" почки и улучшат их работу

Представлен миниатюрный компьютер The Boiler, похожий на самогонный аппарат

ФАС предупредила Ozon и Wildberries, что нужно сделать участие в распродажах добровольным для продавцов

Семейство моделей Gemini 2.0 от Google пополнилось Flash-Lite и Pro

Galaxy S25 Edge может получить 200 МП камеру и 12 ГБ RAM

Android 16 сможет предупредить пользователей об автоматической смене часового пояса

Робототехнический стартап Figure AI прекращает партнерство с OpenAI, чтобы создавать собственные модели AI

Таганский районный суд Москвы оштрафовал Discord за отказ локализовать персональные данные российских пользователей

Лучшее время для ужина, чтобы жить дольше и похудеть

Как группа крови влияет на риски развития болезней, рассказали врачи

TikTok рекомендует пользователям Android в США загружать приложение через официальный сайт

iQOO Neo 10R представлен в цвете MoonKnight Titanium

Представлен BoquilaHUB — проект открытого локального кроссплатформенного приложения для мониторинга природы с помощью ИИ

Тесты помогают быстрее и дешевле учить ИИ писать код. Новая работа китайских ученых: TDD для обучения ИИ

Эксперты: Новая функция Deep Research, представленная в ChatGPT, не способна на самостоятельные научные прорывы

Обновлена форма заказа доменов в BILLmanager

Геймерская настройка от Samsung: One UI 7 позволяет регулировать FPS на Galaxy S25

Xiaomi Watch S4: раскрыта цена и основные характеристики для европейского рынка

Huawei представила беспроводные наушники FreeArc в виде крючка в виде крючка

Motorola Razr Ultra 2025 с новым чипом Snapdragon 8 Elite появился на Geekbench

“Оставайтесь на связи”: разработчики Fallout: London скоро раскроют важные новости о первом сюжетном дополнении Rabbit & Pork

10 продуктов, от которых стоит отказаться, чтобы продлить молодость

InfoWatch: половина российских компаний не страхуют риски от утечек данных

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2025. Все права защищены.

DMCA