Microsoft опенсорснула семейство эмбеддингов Harrier
Компания Microsoft объявила о выпуске Harrier-OSS-v1 - семейства из трёх многоязычных моделей встраивания текста, предназначенных для создания высококачественных семантических представлений на широком спектре языков.
В релиз вошли три модели с разным количеством параметров: модель с 270M параметрами, модель с 0,6B параметрами и модель с 27B параметрами.Модели Harrier-OSS-v1 показали лучшие на сегодняшний день (SOTA) результаты на многоязычном тесте MTEB (Massive Text Embedding Benchmark) v2.
habr.com