EssaySchrijfrobot

De schrijfrobot zit de schrijver op de hielen

Hij levert teksten, beantwoordt vragen erover, maar snapt ze niet. Schrijft de schrijfrobot straks de krant vol? En is hij zo gevaarlijk als de makers zelf denken?

Een bedreiging voor de mensheid. Zo kwalificeerden de ontwikkelaars hun eigen schrijfsoftware GPT-2. Dus mocht die vorig jaar niet openbaar wor­den. Het bericht verbaasde me. Is een ‘schrijfrobot’ tegenwoordig even gevaarlijk als een killerbot? Het gaat hier tenslotte niet om een kanon dat automatisch gaat schieten zodra een radar een drone detecteert.

AsiBot slaat zelf aan het schrijven

Eind 2017 schreef ik in deze krant over een experiment rond ‘Nederland Leest’. Ronald Gip­hart zou in samenwerking met de schrijf­robot AsiBot een nieuw verhaal toevoegen aan de bundel ‘Ik, robot’ van de sciencefictionschrijver Isaac Asimov. Het project werd destijds aangekondigd als een wereldwijde primeur. Bijzonder was dat ‘geïnteresseerden ook zelf aan de slag konden om samen met AsiBot een verhaal te schrijven, via een daarvoor opgerichte website’. Duizenden mensen maakten daar gebruik van, toen ging AsiBot off­line. In 2017 was er nog een krachtige server voor nodig. Kosten: 3000 euro per maand.

Maar iedereen weet dat de ontwikkelingen op het gebied van AI (artificiële intelligentie) razendsnel gaan. Nog geen jaar later stelde Goo­gle de gebruikers van Gmail gratis Smart Compose ter beschikking. Deze applicatie geeft een e-mailer tijdens het schrijven suggesties voor het volgende woord en kan zelfs hele zinnen afmaken. Het voornaamste verschil met de AsiBot is dat Smart Compose niet ‘gevoed’ is met tienduizend Nederlandstalige romans, maar met miljoenen (Engelse) woorden die Gmail­gebruikers schreven. Om een idee te krijgen hoeveel dat er zijn: ongeveer een vijfde van de wereldbevolking maakt gebruik van Gmail: 1,5 miljard mensen. Gmailgebruikers kunnen zelf bepalen of zij Smart Compose willen activeren, en ook of zij de suggesties ervan willen ‘personaliseren’. Net als bij de AsiBot beslist de gebruiker of die de suggesties van Smart Compose accepteert door op de tabtoets te drukken.

Robot productiever dan journalisten

Ook bij de schrijfsoftware die NOS en RTL momenteel gebruiken is er nog sprake van een samenwerking tussen mens en computer. Adam, de ‘redactierobot’ van RTL, publiceert op het internet bijvoorbeeld de uitslagen van plaatselijke voetbalwedstrijden. De schrijfvaardigheid van Adam is beperkt, het gaat vooral om het invullen van cijfers op stippellijntjes, de tekstsjablonen zijn door journalisten gemaakt. Maar er is wel iets anders wat opvalt.

“Met 2462 unieke verhalen is Adam in één klap heel veel van onze redacteuren voorbij­gestreefd wat betreft het aantal geschreven ­artikelen”, vertelt Jasper Bunskoek, datajournalist van RTL.

Misschien is het wel niet eens nodig dat een robotredacteur als Adam goed ‘schrijft’ om straks zijn menselijke collega’s te verdringen. Adam is snel en gratis. Als ik kijk naar welke verschuivingen er op het gebied van de fotografie of de muziek al hebben plaatsgevonden, dan voorspelt dat weinig goeds. Getalenteerde, goed opgeleide (pers-) fotografen moeten nu al wijken voor amateurs die over de juiste elektronica beschikken, of voor een tarief werken waar geen leraar of verpleegkundige zijn bed voor uitkomt. Waarom zou een slecht schrijvende computer het werk van een menselijke schrijver dan niet tenminste deels kunnen overnemen? 

Is GPT-2 daarvoor de geschiktste kandidaat? Die software kan veel meer dan cijfers op stippellijntjes invullen. GPT-2 kan teksten ‘lezen’, samenvatten, er vragen over beantwoorden, ze vertalen, maar ook geheel zelfstandig een artikel produceren. Dit alles zonder de betekenis van een tekst te begrijpen.

Een apparaat zonder ziel

Virginia Woolf schreef ooit: “Elk geheim uit de ziel van de schrijver en elke ervaring uit zijn leven zijn breeduit te lezen in z’n werk.”

Wat een ziel precies is, weet ik niet, maar ik begrijp wat zij er waarschijnlijk mee bedoelde. Als het over artificiële intelligentie gaat, wordt vaak het woord ‘bewustzijn’ in plaats van ‘ziel’ gebruikt. Ook niet direct heel verhelderend, maar als ik zeg dat een computer vooralsnog geen bewustzijn heeft en een menselijke schrijver wel, begrijpt iedereen vast wat ik bedoel.

Hierin schuilt dan direct ook het probleem van een ‘schrijfrobot’. GPT-2 heeft geen bewustzijn, geen levenservaring, geen kind, vriend of buurvrouw om wie die geeft, geen moraal, geen geloof, geen doel. Toch kan het zijn dat GPT-2 straks door evenveel mensen wordt gebruikt als de typemachine vroeger of een spellingscorrector nu. Is de mensheid gebaat bij een machine, even gevoelloos als een mixer, die teksten produceert?

Op sommige terreinen misschien wel. Zo schijnt de robotschrijver in een aantal medische sectoren al te worden ingezet. Maar wat als het om een artikel, essay of een verhaal in een (online) krant, tijdschrift of bundel gaat?

GPT staat voor Generative Pretrained Transformer. Deze tweede versie draait op een neuraal netwerk dat tien keer zo groot is als het vorige. GPT-2 is getraind met behulp van machine learning, een onderzoeksveld binnen AI dat gericht is op de ontwikkeling van algoritmes op basis van data, waarmee computers zelfstandig kunnen leren. In dit geval ‘las’ GPT-2 maar liefst acht miljoen artikelen op de Amerikaanse sociale nieuwswebsite Reddit. Door het ontdekken van patronen in teksten kan GPT-2 zich zonder tussenkomst van een mens verder ontwikkelen. Niemand weet vooralsnog waar die ontwikkeling eindigt.

In 2018 leerde het computerprogramma AlphaZero zichzelf in een dag op bovenmenselijk niveau schaken, shogi en go spelen, zonder enige andere voorkennis dan de spelregels. Hoewel de media minder aandacht besteedden aan die prestatie van AlphaZero dan aan de schaakcomputer Deep Blue die in 1997 Kasparov versloeg, is wat AlphaZero kan misschien wel revolutionairder.

Schrijven is geen schaken, al was het alleen maar omdat er oneindig veel meer zinnen mogelijk zijn dan schaakzetten. Schrijven is ook meer dan patroonherkenning. Chimpansees kunnen sommige patronen ook sneller dan mensen herkennen. Meer niet. Maar computers ‘evolueren’ sneller dan chimpansees. In de nabije toekomst zullen de neurale netwerken waarop applicaties als GPT-2 draaien steeds groter worden. AI-onderzoekers voorspellen dat er over vijf jaar evenveel verbindingen mogelijk zijn in een neuraal netwerk als in het menselijk brein.

Schrijfster Anja Sicking.

De koeien van Hemingway

John Seabrook, een schrijver die verbonden is aan The New Yorker, vroeg zich af of GPT-2 een artikel voor dat tijdschrift zou kunnen produceren. Hij schakelde hiervoor de hulp in van AI-onderzoekers. Zij lieten GPT-2 alle sinds 2007 in The New Yorker gepubliceerde non-fictie ‘lezen’ en ook enkele gedigitaliseerde klassiekers uit de jaren zestig. Een mens zou hier minstens een week dag en nacht mee bezig zijn. GPT-2 verwerkte deze ‘data’ binnen een uur en analyseerde en categoriseerde ook de meest opvallende kenmerken ervan, zoals woordkeus, zinsritme en toon.

Vervolgens koos Seabrook de openingsalinea uit een van zijn lievelingsartikelen, ‘The Moods of Ernest Hemingway’, van Lillian Ross. Ernest Hemingway, misschien wel de beste Amerikaanse romancier, bezoekt New York zelden. De meeste tijd brengt hij door op een boerderij, Finca Vigía, twaalf kilometer buiten Havana, waar hij met zijn vrouw woont en zijn personeel, 16 honden en twee koeien.

Hierna nam GPT-2 het van Lillian Ross over en produceerde de tweede alinea: Ik liep het pad op tot aan het hek, en zag een logge hond naar het hoofdgebouw galopperen. Een kleine koe met dezelfde naam stond naast haar. In de voortuin waar Hemingway in zijn tuinstoel zat, stond een plas van jus.

Dat zou Lillian Ross nooit schrijven – zij weet dat een koe niet klein is en dat er geen jusplas in de tuin ligt. “Intelligentie gaat ook over het modelleren van de wereld”, zegt AI-onderzoeker Josh Tenenbaum. “Daar hoort bij: verklaren en begrijpen wat we zien, verbeelden wat we zouden kunnen zien maar nog niet hebben gezien, problemen oplossen, acties plannen en nieuwe modellen ontwikkelen terwijl we meer over de wereld leren.”

Wat dat betreft heeft AI momenteel nog het niveau van een peuter. Verder valt op dat hoe verder GPT-2 van Ross’ beginalinea verwijderd raakt, hoe meer onzin het taalmodel uitspuugt. GPT-2 is nog helemaal niet in staat om causaal te denken, de heilige graal van AI.

Dus heeft de robotjournalistiek er weinig van te duchten. Maar dat kan op de lange termijn veranderen. De traditionele media maken er inderdaad nog steeds weinig gebruik van, maar voor de meerderheid van de mensen zijn sociale media vandaag de dag de belangrijkste online nieuwsbron, met Facebook (44 procent), YouTube (19) en Twitter (10) in de frontlinie. Hoe kan het ook anders in een tijd waarin presidenten twitteren? Het waarheidsgehalte van deze gratis online nieuwsbronnen staat steeds meer ter discussie. Het gaat veelal om korte berichten die vluchtig worden gelezen, de bronnen worden meestal niet geverifieerd.

Een miljardeninvestering 

Het onderzoekslaboratorium OpenAI dat GPT-2 ontwikkelde, werd in 2015 opgericht om onderzoek te doen naar artificiële intelligentie die de gehele mensheid ten goede zou komen, zonder de noodzaak winst te maken. Maar de uitdijende neurale netwerken zijn enorm kostbaar. Inmiddels is OpenAI dan ook een samenwerkingsverband aangegaan met OpenAI LP, dat wel winst wil maken. Techreus Microsoft heeft er vorig jaar maar liefst een miljard dollar in geïnvesteerd. Ter vergelijking: de onderzoekstak van het Amerikaanse leger stak in 2019 twee miljard dollar in onderzoek naar killerrobots.

Critici beweerden dat het uitstellen van het openbaarmaken van de openbronsoftware van GPT-2 een publiciteitsstunt was. Maar het kan ook samenhangen met een waarschuwing van Jack Clark, de beleidsdirecteur van OpenAI, dat extremistische groepen GPT-2 voor propagandadoeleinden zouden kunnen inzetten. De schrijfsoftware kan tenslotte met allerlei soorten teksten en ideeën worden gevoed. Extremisten, voorspelt Clark, zouden onder de naam van bekende journalisten met GPT-2 artikelen of korte berichten kunnen generen over bijvoorbeeld witte suprematie of jihadisme en die op nooit eerder vertoonde grote schaal razendsnel, in meerdere talen, via sociale media kunnen verspreiden. De kosten van desinformatiecampagnes gaan zo enorm omlaag. Want jonge Russen kunnen dan vanuit een trollenfabriek met nepnieuws de wereldpolitiek proberen te beïnvloeden met schrijfsoftware die beter presteert dan zij. Dit was wat de medewerkers van OpenAI nerveus maakte bij het online plaatsen van deze openbronschrijfsoftware.

Toch is niet iedereen bezorgd over nepnieuws. De in psychologie en datamining gespecialiseerde hoogleraar Michal Kosiński stelt in de podcast Future Shock dat ondanks de verspreiding van nepnieuws, meer mensen dan ooit toegang hebben tot ‘echt nieuws’. Het verspreiden van nepnieuws is van alle tijden.

Slaat de ‘Mona Lisa’ zelf aan het schrijven?

Dat laatste is ongetwijfeld waar, maar geavanceerde schrijfsoftware zal het mensen online steeds moeilijker maken om echt van nep te onderscheiden. Dit speelt nu al een rol bij de verspreiding van deepfakes. Was er vroeger nog een hele filmstudio voor nodig om filmbeelden te manipuleren, nu kun je de ‘Mona Lisa’ met een app een ingevoerde tekst laten uitspreken. Hoelang duurt het nog voordat zij die ‘zelf’ schrijft?

OpenAI heeft uiteindelijk besloten GPT-2 gefaseerd openbaar te maken. Er zijn al nieuwe toepassingen, zoals een game en een neuraal poëzienetwerk. Op Reddit bootst het menselijke conversaties na. Het internet is de perfecte plek voor GPT-2 om zich verder te ontwikkelen.

Het is moeilijk te voorspellen of de angst dat schrijfsoftware een bedreiging voor de mensheid is, bewaarheid wordt. Het zou kunnen. Niet morgen, maar misschien wel over een paar jaar. Het is te hopen dat de lezers dan teleurgesteld raken over de steeds grotere hoeveelheid in kromtaal geschreven nepnieuws die er on­line te vinden is en massaal terugkeren naar de oude media.

Of, wie weet, het boek. 

Anja Sicking (1965) studeerde klarinet. Voor haar debuut als schrijver, ‘Het Keuriskwartet’, ontving ze de Marten Toonder / Geert Jan Lubberhuizenprijs. 

Lees ook:

De literatuur gereduceerd tot cijfers

Anja Sicking voorspelde in 2017 dat de ’literobot’ het werk van schrijvers over zou nemen, met grote gevolgen voor de lezer en de literatuur.

Meer over

Wilt u iets delen met Trouw?

Tip hier onze journalisten

Op alle verhalen van Trouw rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@trouw.nl.
© 2020 DPG Media B.V. - alle rechten voorbehouden