Experimentje: Wat als je GPT4-V een foto laat beschrijven en hergenereren op basis van zijn eigen beschrijving en dat dan 10x herhaalt?

Hoe goed blijft hij nog bij het origineel?


ballonnen0

Mijn uitgangspunt: een foto van vier rennende kinderen met ballonnen in het gras.

De prompt:

👱🏻‍♂️Maak een beschrijving van deze afbeelding. Wees zo gedetailleerd mogelijk want je beschrijving moet gebruikt worden om de afbeelding op nieuw te genereren. Voor dat je antwoord geeft: kijk nog eens goed. Welke elementen mis je?

Eens kijken wat hij ervan maakt.

Stap 1

ballonnen1

OK, dat is wel heel wat anders. Nog steeds rennende kinderen met ballonnen in het gras maar heeft veel aan realiteit verloren.

Ben benieuwd waar hij nu mee komt.

Stap 2

ballonnen2

Stap 3

Kinderen zijn wat ouder geworden en rennen niet meer.

ballonnen3

Stap 4

Wow! Het is ineens avond geworden.

ballonnen4

Stap 5

ballonnen5

En weg zijn de ballonnen! Lastig lopen trouwens, zo met de handen vast.
De volgende keer vraag ik de AI om hier een video van te maken :-)

Stap 6

ballonnen6

Hij houdt dat omgedraaide erin. Maar de centrale persoon is ineens een jongetje geworden.

Stap 7

ballonnen7

Terug naar een meisje. Het aantal kinderen wisselt wat.

Stap 8

ballonnen8

Stap 9

ballonnen9

De messias is terug! En het is een meisje.

Stap 10

ballonnen10

Dit toont goed de hang naar gladde perfectie van GPT4. Je ziet dat ook bij andere GenAI modellen.
Ze zijn minder goed in het rauwe levensechte.

Ik hou toch meer van het origineel.


Vorige post: GPT’s! Apps voor ChatGPT