Intelligentie vs. Prijs

Er zijn veel AI modellen in omloop. De correlatie tussen intelligentie en prijs is ver te zoeken.

Het is opvallend dat de beste AI modellen helemaal niet de duurste hoeven te zijn. Zie deze chart waarin ik intelligentie volgens de Artificial Intelligence Analysis Index (*) heb afgezet tegen de prijs van een model (**).

Intelligentie_vs_Prijs

Je zou verwachten dat de datapunten op een stijgende lijn zouden liggen van links naar rechts: hoe intelligenter hoe beter. Maar nee, het lijkt nogal willekeurig. Een aantal van de top modellen zoals DeepSeek R1 ($0,20), Grok 3 mini in de reasoning variant ($0,10) en Google’s Gemini 2.5 Flash ($0,20) kosten bijna niks!

In contrast daarmee is Anthropic’s Claude Sonnet Thinking ($5,70) enorm duur en dan heb ik Claude 4 Opus ($30) en O3 Pro ($36) nog weggelaten uit de chart omdat ze ver buiten de prijs range van de rest liggen.

Waarom deze grote verschillen?

Ik denk dat het voor de grote labs ook een beetje uitvinden is welk prijsniveau het beste werkt. Daarbij word het trainen van modellen steeds goedkoper dus nieuwere modellen kunnen relatief goedkoper worden aangeboden dan oude.

Conclusie

Het loont nogal de moeite om te kijken naar welk model je gebruikt in je software. Je kan flink besparen door naar een ander model te switchen.
Moet wel gezegd dat niet elk model voor elke toepassing even goed werkt. Dus dat is toch eerst een kwestie van uitproberen.

(*) De Artificial Intelligence Analysis Index is een samenstelling van verschillende grote benchmarks voor AI modellen met als doel om een goed gemiddelde te geven in één getal.

(**) De prijs hier een gewogen gemiddelde tussen kosten voor input tokens en de kosten voor output tokens waarbij input 3x telt.

Vorige post: Prompting voor reasoning modellen