Gebruik mijn organen, wis mijn data

Achter de schermenEen nieuwe generatie algoritmes wekt dode stemmen tot leven en creëert plaatjes met twee keer klikken. Op de scheidslijn van deep fake en fantasie.



Illustratie Roel Venderbosch

Soms droom ik een telefoongesprek. „De bramen doen het goed, pa. En je oude fiets is laatst gejat. Bij jullie nog nieuws?”

„Nee hoor. Gaat prima hier.”

„Fijn, tot snel!”

Al weet ik dat hij er niet meer is, even leefde ik in de veronderstelling dat mijn vader aan de andere kant van de lijn luisterde.

Dromen is niet meer nodig – we hebben kunstmatige intelligentie. Die wekt stemmen uit het verleden tot leven. Het laatste hoogstandje op dat gebied is een fictief podcastinterview met wijlen Steve Jobs. De medeoprichter van Apple overleed in 2011, maar er waren genoeg geluidsopnames om een algoritme te trainen en zo een synthetische stem te fabriceren.

Je kunt de computer alles laten zeggen met Jobs’ timbre. ‘Hij’ klinkt wel als Steve Jobs die een zaal vol toehoorders toespreekt, omdat de stem gebaseerd is op opnames van zijn Apple-presentaties.

De gekloonde stem van de interviewer, talkshowhost Joe Rogan, klinkt geloofwaardiger. Er waren honderden uren van Rogans podcasts beschikbaar waar de algoritmes op konden kauwen. En hoe meer data, des te beter het eindresultaat.

Ook de conversatie tussen Jobs en Rogan is verzonnen door kunstmatige intelligentie. Het gesprek loopt stroef: met name de lachjes tussendoor klinken ongemakkelijk.

Het is een kwestie van tijd voordat zulke oneffenheden eruit zijn, zegt Jarno Duursma. Hij is een Nederlandse techexpert die zich verdiept in kunstmatige intelligentie. Duursma’s fascinatie: deepfakes, gemanipuleerde versies van de werkelijkheid. Hij bouwde een digitale versie van zichzelf, compleet met nagebootste stem.

Batman eet een hamburger

Dit is het tijdperk van text-to-everything, zegt Duursma. Je kunt geloofwaardige teksten creëren op basis van een paar steekwoorden – een trucje van taalmodel GPT-3. De laatste trend in kunstmatige intelligentie is het genereren van plaatjes op basis van een tekstuele beschrijving.

Het is een verslavende bezigheid, zo’n plaatjesmaker: alles wat je kunt bedenken, is in twee klikken zichtbaar. Bijna onvoorstelbaar.

Je typt bijvoorbeeld: ‘Batman die een hamburger eet in München’ of ‘Een baby met een oud gezicht in een auto op de maan’ en de image-generator maakt een unieke afbeelding, in vier varianten. De resultaten zijn verrassend echt. Sommige plaatjes hebben iets absurds. Verwrongen gezichten, of mensen met een ledemaat te veel; ergens tussen Halloween en een hallucinatie. Maar de techniek schrijdt voort – meer rekenkracht, meer data – en wordt realistischer.

Veel afbeeldingen lijken op cartoons of schilderijen. Zo kun je eenvoudig zelf ‘kunst’ in de stijl van Monet, Van Gogh, Picasso of Warhol creëren. Kunst wordt laagdrempeliger met zulk krachtig gereedschap. Iedereen kon al schilderen met Ravensburger, nu kan iedereen zijn fantasie laten uitbeelden door een algoritme. De echte kunstenaars krabben zich achter de oren.

Bij elkaar geharkt

Er zijn meerdere projecten waar je deze technologie kunt uitproberen. Ze heten Dall-E2, Stable Diffusion en Midjourney en zijn sinds kort voor iedereen toegankelijk.

De techniek werkt ongeveer zo: je kunt algoritmes trainen om ruis te verwijderen van een afbeelding. Als je dat proces omdraait, kun je de computer leren van ruis stapsgewijs een compleet nieuwe afbeelding te maken, bijvoorbeeld met de termen Batman en hamburger. De netwerken worden getraind op databases met miljarden (door mensen) gelabelde plaatjes, bij elkaar geharkt op internet. Je kunt er eigen afbeeldingen aan toevoegen.

Microsoft, een van de investeerders in Dall-E, voegt de plaatjesmaker toe aan zijn ontwerpsoftware, zodat je zelf „unieke ansichtkaarten en uitnodigingen kunt maken”.

Dat is de vriendelijke variant.

De beeldgeneratoren smeken erom misbruikt te worden. Om nep-gebeurtenissen rond te strooien, om politici woorden in de mond te leggen. Om mensen af te persen of op te lichten, via het scherm.

Google heeft filters ingebouwd om te voorkomen dat je plaatjes of video’s maakt die gewelddadig of pornografisch van aard zijn. Maar niet alle misbruik is te voorkomen. Dall-E2 genereerde op mijn verzoek een beeld waarop het leek alsof er een demonstratie bij het Vredespaleis in Den Haag plaatsvond. Nep. Via Stable Diffusion liet ik Vladimir Poetin en Xi Jinping elkaar innig zoenen – ook nep.

De gemiddelde mediaconsument is makkelijk om de tuin te leiden als de technologie zich zo snel ontwikkelt, denkt Jarno Duursma. „Veel plaatjes lijken nu nog een tekening of schilderij. Maar over een jaar kun je fotorealistische beelden maken met een paar woorden tekst.” Er zit maar één ding op: zero trust. Vertrouw niets wat je op het scherm ziet.

Bij de eerste toepassing van deepfakes, in 2018, plakten algoritmes gezichten van filmsterren op het lichaam van pornosterren. Vier jaar later ligt de lat om iemand na te bootsen veel lager. Amazon zegt dat je op basis van één minuut audiomateriaal iemands stem al kan reproduceren. Zo kan oma tot in eeuwigheid verhaaltjes blijven voorlezen via Amazons slimme speaker.

Ook voor video’s is niet veel data nodig: je kunt een oude foto tot leven wekken via een algoritme dat Deep Nostalgia heet. Dat levert een bewegend plaatje op als in een Harry Potter-krant. Duursma: „Ik heb het uitgeprobeerd met een foto van mijn moeder, die drie jaar geleden overleed. Haar foto bewoog, maar ik dacht: zo kijkt mijn moeder absoluut niet. Dit is surrogaat.”

Er gloort een nieuwe markt voor nep. Die van de rouwverwerking. Je kunt via kunstmatige intelligentie alsnog in gesprek met overledenen, is het idee. Tijdschrift Wired noemde dat verschijnsel een voorbeeld van „onze veranderende relatie met dood, niet per se creepy”.

De vraag is of je na je dood zo wilt blijven doorleven, als digitaal museumstuk. Jarno Duursma heeft er geen trek in: „Ik heb een avatar van mezelf gemaakt en een voice-kloon. Dus als ik vanmiddag overlijd, kunnen mijn kinderen en mijn vrouw tot in oneindigheid filmpjes van mij blijven maken. Maar ik mag hopen dat ze dat niet gaan doen.”

Verliezen hoort bij het leven, zegt Duursma. En wil je daar zeker van zijn, dan zul je in je testament moeten vastleggen of nabestaanden je stem en beeltenis niet mogen hergebruiken. Zie het maar als een uitbreiding op het huidige donorregister: gebruik mijn organen, maar wis mijn data. Dromen mag.

Lees verder…….