OpenAI попалась на удалении датасета с пиратскими книгами
OpenAI оказалась в центре нового скандала, связанного с обучением своих моделей на нелегальных текстах. По данным Bloomberg Law, в распоряжении авторов и издателей оказалась внутренняя переписка сотрудников компании, в которой обсуждалось удаление набора данных, содержащего пиратские копии книг, использованных для тренировки ChatGPT.Если сообщения подтвердятся, это станет доказательством умышленного нарушения авторских прав, ведь OpenAI, по сути, знала о незаконном происхождении части обучающего материала и попыталась его скрыть.
В этом случае компании может грозить штраф до 150 тысяч долларов за каждое произведение, использованное без разрешения автора.Аналитики отмечают, что последствия могут быть колоссальными.
habr.com