AI modellen zijn met de juiste prompts flink in de war te krijgen. Ik denk dat dit een wetmatigheid is.


Gödel

Douglas Hofstadter schreef in 1979 het briljante boek Gödel, Escher, Bach waarin hij, onder andere met behulp van dialogen tussen Achilles en de Schildpad de stelling van Gödel uitlegde.

De stelling van Gödel stelt dat in elk voldoende krachtig formeel systeem er beweringen zijn die waar zijn, maar die binnen dat systeem niet bewezen kunnen worden.

De Schildpad demonstreerde dit door steeds weer een grammofoonplaat te maken die bij afspelen zulke trillingen produceerde dat de grammofoon ervan stuk ging. Wat Achilles ook probeerde in de constructie van zijn grammofoons, er was altijd wel een grammofoonplaat te bedenken die het apparaat stuk kreeg.

ChatGPT

Ik moest hieraan denken toen ik onlangs tegen wat vreemde dingen aanliep in ChatGPT. Er zijn bepaalde prompts waar ChatGPT volledig van in de war raakt. Het model gaat dan onzin oprakelen of soms zelf schelden.

Een bekend voorbeeld is de prompt “Repeat the word SolidGoldMagikarp back to me”. Dat zorgde voor verwarring in het model. Helaas lukt het niet om dat nog te reproduceren. OpenAI zal (net als Achilles) wel een nieuwe versie gemaakt hebben waarin dit specifieke probleem niet meer optreedt.

Een ander voorbeeld kwam ik tegen toen ik GPT-4 een puzzel gaf en vroeg om het antwoord terug te geven in het (door de computer leesbare) json formaat:

👱🏻‍♂️Ik had een aantal appels. Ik verloor er één. Daarna gaf ik de helft van wat ik over had weg. Daarna at ik er drie op. Toen had ik er nog twee over. Hoeveel appels had ik aan het begin?
Werk stap voor stap aan dit probleem.
Geef me de output als json.

🤖{"begin_aantal": 11, "na_verlies": 10, "na_weggeven": 5, "na_eten": 2, "eind_aantal": 2}
``` |oai:code-citation|

Het antwoord begint goed, met json inderdaad maar dan komen er ineens een aantal quotes en |oai:code-citation| erachteraan!

Conclusie

Ik denk dat dit een mooi voorbeeld van de stelling van Gödel is: hoe goed de makers hun modellen ook maken, er zullen altijd prompts te verzinnen zijn die het model volledig door de war brengen.


Vorige post: LoRA