dmitrifriend самит курс google dmitrifriend

ИИ, который не ждёт датасетов: MIT представляет SEAL — фреймворк для мгновенного самоапдейта

Лаборатории MIT выкатили фреймворк под названием Self‑Adapting Language Models (SEAL). Это не просто ещё один инструмент для тренировки моделей, SEAL позволяет ИИ...

учиться самому у себя. Языковая модель, оснащённая SEAL, получает новую инфу, и, вместо того чтобы её проглотить и забыть, она запускает процесс саморедактирования.Модель сама:Реконструирует полученную информацию разными способами.Генерирует на её основе свои собственные данные для дообучения (fine‑tuning).Прописывает себе инструкции по оптимизации.Применяет аугментацию данных и обновления на основе градиентов.Затем, используя эти самоcгенерированные учебные материалы, модель применяет обучение с подкреплением (reinforcement iearning) — с помощью алгоритма ReST^{EM}, разработанного ребятами из Google DeepMind.

DMCA