©Unsplash

Finalestress nekt Grok in schaakclash der AI-giganten met ChatGPT
Techbedrijven gebruiken al jarenlang schaken om te testen hoe goed hun computers, systemen en modellen zijn. Het komt dan ook niet als een verrassing dat nu ook grote AI-modellen het tegen elkaar opnemen op het schaakbord. ChatGPT-maker OpenAI versloeg Grok van xAI in de finale en won daarmee het driedaagse AI-schaaktoernooi.
Dat deed het bedrijf met zijn o3-model. In de finale was dit model te sterk voor het AI-model van Elon Musk: Grok 4. De derde plek ging naar Google Gemini. Andere deelnemers die het podium niet haalden waren onder meer Google, Anthropic, DeepSeek en Moonshot AI.
Het is niet voor het eerst dat AI-modellen elkaar met pionnen en paarden te lijf gaan. Toch was dit toernooi anders, omdat de strijd niet ging tussen klassieke schaakengines, maar tussen general-purpose AI’s die je normaal inzet voor tekst, code en alledaagse vragen.
Grok heeft last van finalestress
Op dat gebied heeft OpenAI het dus het beste voor elkaar. In de finale rekende o3 af met Grok 4. Volgens grootmeester Hikaru Nakamura maakte het model van Elon Musk simpelweg te veel grote fouten om ChatGPT van de titel te houden. Vooral het herhaaldelijk weggeven van de dame deed Grok 4 de das om. Zo eindigde de finale in een klinkende 4-0.
Volgens kenners die aanwezig waren op het driedaagse toernooi kwam dat echter wel als een verrassing. Tot aan de finale was het namelijk Grok 4 dat de meeste indruk maakte. Het model van xAI maakte her en der weleens een foutje, maar was over het geheel gezien de beste speler op het toernooi. Misschien is het AI-model van Musk al zo menselijk dat het last krijgt van finalestress.
Waarom schaken iets zegt over het niveau van AI
Elon Musk zag de dramatisch verlopen finale overigens al aankomen. Vooraf liet hij op X weten dat er bij xAI “bijna geen moeite” in schaken was gestoken en dat eerdere overwinningen vooral een bijeffect waren. Grote kans dat daar een kern van waarheid in zit, maar dat geldt waarschijnlijk net zo goed voor de andere modellen.
Het verandert in ieder geval niets aan de uitslag: ChatGPT o3 van OpenAI is op dit moment het beste model als het op schaken aankomt. In de techwereld is dat toch wel iets om trots op te zijn. Schaken is namelijk de ultieme testbank voor tech: simpele regels, keiharde uitslagen en enorme denkdiepte. Perfect dus om te zien of modellen écht kunnen plannen zonder te blunderen.
Meer nieuws over ChatGPT en mis niets met onze Bright-app.




