OpenAI транскрибировала более миллиона часов видео с YouTube для обучения GPT-4
OpenAI расшифровала более миллиона часов видео с YouTube для обучения GPT-4, пишет New York Times. Для этого компания использовала инструмент распознавания речи Whisper.Ранее на этой неделе Wall Street Journal писала, что OpenAI намерена использовать транскрипции роликов с YouTube для обучения грядущей GPT-5.
Источники газеты отмечали, что разработчик применял расшифровки контента с видеохостинга Google при работе над GPT-4, которая вышла в марте прошлого года.В 2021 году OpenAI столкнулась с нехваткой данных из авторитетных англоязычных источников в интернете.