Elisa Calvet/Unsplash

Schrijvers klagen OpenAI aan: ChatGPT illegaal getraind met 300.000 boeken

Schrijvers klagen OpenAI aan: ChatGPT illegaal getraind met 300.000 boeken

29-06-2023 19:15 Laatste update: 19:33

Twee Amerikaanse schrijvers hebben ChatGPT-maker OpenAI aangeklaagd omdat het bedrijf hun boeken heeft gebruikt om het AI-taalmodel achter de chatbot te trainen. Andere auteurs kunnen in de zaak mogelijk ook schadevergoedingen eisen van het AI-bedrijf.

De schrijvers Paul Tremblay en Mona Awad zeggen in hun aanklacht dat OpenAI zonder toestemming teksten uit tienduizenden boeken heeft verzameld, wat volgens hen een inbreuk van de auteursrechten is. Boeken zijn volgens Tremblay en Awad een 'sleutelingrediënt' voor het ontwikkelen van AI-taalmodellen, omdat ze de "beste voorbeelden bieden van hoogwaardige lange teksten".

Het is de volgende rechtszaak in een reeks over vermeende copyrightschendingen door AI-bedrijven. Eerder spanden drie kunstenaars en de fotodatabank Getty al rechtszaken aan tegen de makers van AI-plaatjesgeneratoren, zoals Stability AI en Midjourney, die afbeeldingen op basis van geschreven prompts genereren. Ook die AI-systemen zijn getraind met een enorme hoeveelheid auteursrechtelijk beschermd materiaal.

Verder loopt er een zaak tegen OpenAI en Microsoft-bedrijf GitHub over het AI-systeem GitHub Copilot voor het genereren van programmeercodes, dat is gebaseerd op werk van menselijke programmeurs. In al die zaken bewaren de bedrijven dat hun systemen op een eerlijke manier gebruik maken auteursrechtelijk beschermd werk.

294.000 boeken

In de aanklacht schrijven Awad en Tremblay dat de trainingsdata van OpenAI minstens 294.000 volledige boeken bevatten, die deels afkomstig zouden zijn van illegale schaduwbibliotheken. Populaire voorbeelden daarvan zijn LibGen, Z-Library, Sci-Hub en Bibliotik.

Tremblay is de schrijver van onder meer de roman The Cabin at the End of the World, waarvan begin dit jaar de verfilming 'Knock at the Cabin' verscheen. Awad schreef onder andere de roman Bunny. ChatGPT genereerde van hun boeken 'zeer nauwkeurige samenvattingen', wat volgens hen aantoont dat ze volledig in de database van OpenAI staan.

De schrijvers eisen een schadevergoeding, maar het bedrag hebben ze nog niet aangegeven. Andere auteurs zouden zich in een class-action-zaak erbij kunnen voegen en ook een schadevergoeding van OpenAI kunnen eisen.

AI-onzinboeken op Amazon

Schrijvers hebben ook steeds meer last van AI doordat de technologie wordt gebruikt om gigantische aantallen boeken te genereren. Die met AI-gemaakte boeken, die vaak vol onzin staan, worden vervolgens verkocht via online-platforms als Amazon.

Tientallen van zulke AI-boeken verschenen deze week zelfs in de bestsellerslijsten op Amazon, tot afgrijzen van schrijvers.

Luister ook onze podcast: