dmitrifriend технологии Олимпиада общество AMD крипто dmitrifriend

Instella Math: языковая модель AMD с поддержкой рассуждений

AMD представила Instella Math — языковую модель, ориентированную на решение задач, требующих сложных логических построений. Отмечается, что это первая модель, в которой применено обучение с подкреплением на основе длинных цепочек рассуждений, и при этом — целиком на графических процессорах AMD.В основе проекта лежит Instella 3B Instruct, чьи возможности расширили многоэтапным циклом обучения: двумя стадиями контролируемой донастройки и тремя этапами обучения с подкреплением по методике VERL.

Всё это выполнялось на ускорителях AMD Instinct MI300X.Instella Math — первая языковая модель AMD для рассуждений, с объёмом 3 млрд параметров, обученная на кластере из 32 ускорителей AMD Instinct MI300X.

DMCA