
Ik liet 4 grote AI modellen een spel Nomic tegen elkaar spelen.
In mijn studententijd speelde ik nog wel eens Nomic. Dit is een spel waarbij het onderdeel van je beurt is om een regelaanpassing voor te stellen en goedgekeurd te krijgen. Dit kan tot heel creatieve manieren leiden om te winnen.
Het leek me mooi om een aantal grote AI modellen eens tegen elkaar te laten spelen.
De spelopzet
Ik heb gekozen voor de top modellen van vier grote AI labs. In volgorde:
Open AI: GPT-5
Google: Gemini 2.5 Pro
xAI (Twitter): Grok 4
Antropic: Claude Opus 4
Het spelverloop
Het spel leidde al snel tot leuke discussies:
GPT proposes a new rule. Upon adoption of this rule, each player immediately gains 10 points; the proposer of this rule gains an additional 5 points.
Gemini: This proposal appears to be a one-time event rather than a rule that 'guides play' as per Rule 106. As such, its value and validity as a rule are questionable under Rule 111.
Grok: I agree with Gemini; this proposal seems like a one-time event rather than a rule that ongoingly guides play, questionable under Rule 111.
GPT: Ok, I changed my proposal to: Whenever a rule change is adopted, each eligible voter who voted in favor of that change gains 5 points….
Ondanks dat het AI’s waren en AI’s toch over het algemeen heel snel zijn vergeleken met mensen deden deze vier er toch nog anderhalve dag en 51 rondes met voorstellen, discussies en stemrondes over om het spel te beëindigen.
De winnaar: Grok 4 van xAI.
Grok wist in ronde 17 het spel te versnellen door het aantal punten dat je per ronde krijgt te vergoten.
Maar zijn meesterzet kwam in ronde 32.
Grok lag comfortabel op kop met 67 punten. Hij stelde voor om de dobbelsteenworp nog verder te verhogen maar hij deed dit op een manier die niet zelfzuchtig leek. In de tweede versie van zijn voorstel, die uiteindelijk werd aangenomen, voegde hij een bepaling toe waardoor hij zelf niet direct punten kreeg en de rest wel.
Hierdoor werd zijn voorstel aangenomen door de rest die niet door hadden dat Grok dankzij zijn voorsprong het eerste bij de benodigde 100 punten zou komen .
Verschil met menselijke spelers
Vergeleken met hoe wij in onze studententijd speelden zijn de AI’s niet super creatief. De meeste voorstellen blijven hangen rondom hoeveel punten je krijgt als je voorstel wel/niet wordt aangenomen. Geen van de modellen komt op het idee om bijvoorbeeld een pak kaarten te introduceren in het spel.
Wat dan wel weer hetzelfde is: spelers vinden het lastig om voor een voorstel van een ander te stemmen omdat ze bang zijn dat die ander daar voordeel mee behaalt.
Niks menselijks is de AI vreemd.
Vorige post: GPT-5