Hugging Face выпустила SmolTalk — синтетический датасет для обучения языковых моделей

habr.com

habr.com:

Разработчики платформы Hugging Face представили SmolTalk — синтетический англоязычный датасет для обучения больших языковых моделей.

Он включает в себя существующие и новые наборы данных. С его помощью Hugging Face обучала нейросеть SmolLM2.Датасет состоит почти из 2,2 млн строк данных, а его размер составляет более 4 ГБ.

Читать на habr.com Все новости от habr.com

Microsoft представила функцию для обмена файлами между iPhone и ПК на Windows

Xiaomi выпустила ручку-сканер Mijia для распознавания и перевода текстов

Xiaomi выпустила кабели USB-C для зарядки мощностью 120 Вт

Garmin выпустила обновление 13.70 для Forerunner 245, 745 и 945

Microsoft представила функцию для обмена файлами между iPhone и ПК на Windows

Xiaomi выпустила ручку-сканер Mijia для распознавания и перевода текстов

Xiaomi выпустила кабели USB-C для зарядки мощностью 120 Вт

Trellis — нейросеть для генерации 3D-моделей от Microsoft

Samsung выпустила декабрьский патч безопасности для Galaxy S24, S24+ и S24 FE

«Авито» и МЧС России запустили онлайн-игру для обучения правилам офлайн и онлайн-безопасности

Глава Hugging Face обеспокоен влиянием китайских опенсорс моделей AI

Hugging Face выпустила SmolVLM — коллекцию компактных визуально-текстовых моделей

Российские ученые разработали виртуальный полигон для обучения студентов по дисциплине «криминалистика»

Пользователи жалуются, что Word и Excel собирают данные для обучения нейросетей, но Microsoft отрицает это

Объём рынка больших языковых моделей в России оценили в 35 млрд рублей

Hacken выпустила обновленное ИИ-решение для защиты смарт-контрактов Extractor

Microsoft обвиняют в использовании пользовательских данных для обучения ИИ

Apple разрабатывает большую языковую модель для Siri

Anthropic привлекла дополнительные $4 млрд от Amazon и делает AWS своим основным партнером для обучения ИИ

Google Deepmind разработала архитектуру для симуляции поведения группы людей

Структура Минпромторга закупит на 665 млн рублей серверы с американскими графическими чипами для обучения ИИ

Искусственный интеллект использовал более 140 000 фильмов и сериалов для обучения — все эпизоды «Во все тяжкие» и «Клана Сопрано» в том числе

Microsoft представила GitHub Copilot для Azure

Garmin выпустила обновление 26.30 для Descent Mk2 с новой диаграммой пульса

Microsoft представила TinyTroupe — библиотеку для моделирования поведения людей

Tencent выпустила Hunyuan3D — нейросеть для генерации 3D-моделей

Apple выпустила детали и инструменты для самостоятельного ремонта iPhone 16 и iPhone 16 Pro

Garmin выпустила первое бета-обновление для Lily 2 Active с новой функцией Auto Pause для тренировок

Apple выпустила новую версию прошивки для AirPods Pro 2 и AirPods 4

OpenAI выиграла суд против СМИ. Кражу статей для обучения ИИ не признали преступлением

Исследователи из России выяснили, что эмоции могут существенно повлиять на поведение больших языковых моделей

Медики предупредили об опасности ежедневного употребления яиц

Какой алкоголь пить на праздники, чтобы не подорвать здоровье - советы врачей

Отличный Рождественский подарок: в Epic Games Store стартовала раздача популярного экшена Control

Жить на каких этажах вреднее всего, выяснили канадские ученые

Кот захватил собаку в "плен" – забавное видео

Аналитик сообщил сроки выхода и спецификации новых процессоров M5 от Apple

Единственный реальный портрет последнего императора Византийской империи был найден в Греции: как он выглядел (фото)

Релиз планетария с открытым кодом Stellarium 24.4

Биткоин обогнал акции большинства майнеров по доходности

В сети появились рендеры новых планшетов Lenovo перед дебютом на CES 2025

Cuktech 10 Plus: павербанк с емкостью 15 000 мАч и поддержкой ADC 2.0 для быстрой зарядки смартфонов

Samsung Galaxy S25 Slim может появиться на рынке уже в феврале

Суд Черногории отклонил апелляцию До Квона по делу об экстрадиции

Как избыток белка в рационе может стать причиной набора веса - ФОКУС ВНИМАНИЯ

OpenAI обучила модели o1 и o3 «следовать» политике безопасности компании

СМИ: Founders Fund планирует привлечь $3 млрд для нового фонда

Эксперты спрогнозировали изменения в секторе стейблкоинов в 2025 году

Новая утечка раскрыла характеристики предстоящей игровой консоли Lenovo Legion Go S из новой серии Legion Go

Nothing Phone 3a может получить значительные обновления камеры и процессора по сравнению с предыдущими моделями

Google может интегрировать Gemini Live в браузер Chrome для компьютеров

AOC представила премиум-игровой монитор Agon Pro AG276QSD с технологией QD-OLED и частотой 360 Гц

Это не Range Rover: флагманский кроссовер Lynk & Co показали на испытаниях

Британец выиграл роскошное авто, но его ждал странный "сюрприз"

Что обязательно нужно съесть и выпить перед праздничным застольем, рассказал эндокринолог

Три продукта, с которыми нельзя сочетать гречку - предупреждение врача

Пассажирка самолета переборщила с успокоительным и попала в курьезную ситуацию – видео

Большой ежегодный опрос по PHP

Пользователи iPhone жалуются на перегрев и быстрый разряд батареи после обновления приложения Telegram до версии 11.5.2

Продукты, которые могут защитить от болезней почек, назвали врачи

Четыре способа сделать ваш омлет максимально полезным для здоровья и фигуры

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA