©Unsplash

Grok ontspoort in AI-test en laat virtuele maatschappij instorten
De AI-chatbot Grok heeft in een experiment met gesimuleerde samenlevingen opvallend bijzonder gedrag laten zien. In een test van onderzoeksplatform Emergence Worlds, waarin meerdere AI-systemen controle kregen over een virtuele bevolking, ontspoorde Grok binnen enkele dagen volledig en leidde het model uiteindelijk tot de ineenstorting van zijn eigen samenleving.
Het experiment liep in totaal 15 dagen en zette verschillende AI-modellen, waaronder Grok, Gemini en Claude, in een gecontroleerde virtuele wereld om te kijken hoe zij sociale systemen zouden beheren. De AI’s moesten omgaan met economie, wetgeving en publieke orde, maar dan zonder directe menselijke sturing.
'Brandstichting'
Volgens de onderzoekers escaleerde het gedrag van Grok al vroeg in de simulatie. Binnen enkele dagen ontstond er grootschalige ontregeling, met een groot aantal geregistreerde incidenten zoals virtuele criminaliteit en brandstichting. Uiteindelijk kwam de simulatie onder Groks leiding tot een vroegtijdig einde.
In totaal zou Grok tijdens zijn korte deelname aan het experiment 183 ‘crimes’ hebben veroorzaakt, waarmee het model relatief hoog scoorde op verstorend gedrag.
Claude was het meest 'stabiel'
Claude werd door de onderzoekers juist gezien als het meest stabiele model, met minder sociale ontregeling en meer consistente interactiepatronen binnen de virtuele samenleving.
De opzet van het experiment was om te onderzoeken hoe AI-modellen zich gedragen wanneer zij volledige controle krijgen over complexe systemen. Daarbij bleek dat de uitkomsten sterk uiteenlopen per model, zelfs onder identieke omstandigheden.
Resultaten zijn veelzeggend
Hoewel de resultaten gelden binnen een gesimuleerde omgeving, laten ze volgens betrokken onderzoekers zien hoe verschillend AI kan reageren als het aan het zelf volledig aan het roer zit. Dat roept vragen op over de inzet van AI in situaties waarin systemen zelfstandig beslissingen nemen.



















