OpenAI придется раскрыть, как она обучала GPT-модели на пиратских книгах
Федеральный судья Она Ванг в Нью-Йорке обязала OpenAI раскрыть внутренние переписки с юристами о том, почему были удалены два набора данных с пиратскими книгами из теневой библиотеки LibGen.
Решение было принято в рамках судебного дела, в котором OpenAI обвиняют в обучении моделей серии GPT на книгах без получения разрешений от их авторов.Истцы из Authors Guild и группа известных писателей — среди них Джордж Мартин и Джон Гришэм — утверждают, что еще в 2018 году сотрудник OpenAI скачал массив LibGen, из которого собрали два набора Books1 и Books2.
habr.com