Według nowych zarzutów OpenAI przeszkoliło GPT-4 za pomocą milionów filmów na YouTube, mimo że wiedział o naruszeniu praw autorskich. Źródłem tego nowego twierdzenia jest „New York Times”.
Jak wynika z nowego raportu opublikowanego przez NYT, OpenAI wykorzystało dane Google do szkolenia nowej wersji swojego modelu sztucznej inteligencji. Mówi się, że w szkoleniu GPT-4 wykorzystano ponad milion godzin filmów z YouTube.
W GPT-4 wykorzystano miliony godzin filmów z YouTube
W szczegółach zarzutów podano, że firma w większości korzystała z filmów na YouTube. Narzędzie do rozpoznawania głosu o nazwie Whisper dokonało transkrypcji milionów godzin danych wideo. To było na potrzeby szkolenia GPT-4.
Dodatkowo w raporcie NYT zacytowano wypowiedź prezesa firmy, Grega Brockmana, który stwierdził, że choć korzystanie z filmów na YouTube budzi wątpliwości prawne, nie stanowi problemu.
Z kolei oświadczenie właściciela YouTube’a, rzecznika Google’a Matta Bryanta, wydało oświadczenie w tej sprawie dla The Verge. W związku z tym podkreślił, że widział niezweryfikowane doniesienia w tej sprawie i takie nieuprawnione wykorzystanie jest zabronione.
Ujawniono także, że Google trenował swoje modele, korzystając z danych YouTube.
„Profesjonalny guru sieci. Przyjazny odkrywca. Miłośnik jedzenia. Ogólny rozrabiaka. Miłośnik telewizji. Nieuleczalny fanatyk piwa”.