Google-software leert in 24 uur schaken als grootmeester

07-12-2017 14:28 Laatste update: 26-04-2018 15:37

RTL Z

Google-software AlphaGo lijkt naast kampioen in het Chinese bordspel Go ook de beste schaker ter wereld te zijn. Daar had het systeem maar een dag voor nodig.

24 uur is alle tijd die AlphaGo, het zelflerende computersysteem van Google, nodig had om een van de beste schakers ter wereld te worden. In een reeks van honderd potjes verloor de software geen enkele keer van wat tot nu toe werd gezien als de beste schaakcomputer ter wereld, Stockfish.

AlphaGo werd bekend als de eerste zelflerende computer die mensen kon verslaan met het spelletje Go. Dat complexe Aziatische bordspel is bij uitstek geschikt voor het testen van de mogelijkheden van kunstmatige intelligentie, door de vele mogelijke zetten. AlphaGo kreeg alleen de regels van Go uitgelegd, en leerde zichzelf vervolgens de winnende strategieën aan de hand van een eindeloze reeks potjes.

Go is vele malen complexer dan schaken. Al in 1996 versloeg de eerste schaakcomputer schaakgrootmeester Gary Kasparov. Toch hadden schaakliefhebbers zo hun twijfels of AlphaGo wel succes zou hebben in het schaken, omdat het zo'n ander spel is dan Go.

Nieuwe strategieën

Dat Google's zelflerende systeem slechts 24 uur na het leren van de regels de beste systemen ter wereld kan verslaan, mag dus gerust opzienbarend worden genoemd. Het laat zien hoe flexibel inzetbaar het systeem eigenlijk is. Ook de manier waarop AlphaGo te werk ging is interessant.

Bekende schaakstrategieën, zoals de herdersmat of the Queen's Gambit, die door fervente schakers graag worden toegepast, kende AlphaGo nog niet. Die moest hij zichzelf leren. Maar al snel kwam hij met eigen strategieën die ongekend waren en onverslaanbaar bleken.

Toekomst

AlphaGo werd ontwikkeld om erachter te komen wat er mogelijk is met kunstmatige intelligentie. De lessen die hieruit getrokken worden, kunnen in een later stadium wellicht worden ingezet voor nuttigere zaken dan het spelen van spelletjes.

Het leren van het schaakspel geeft in ieder geval een opvallend inkijkje in hoe snel zo'n systeem zichzelf dingen kan leren die het eerder nooit heeft gekund.

Wat de volgende stap van AlphaGo gaat zijn, is nog onbekend. In complexe online strategiespellen zoals Starcraft, die vragen om een goed geheugen, een slimme strategie en een flexibel planningsvermogen, is de mens nog altijd superieur. De vraag is alleen hoelang dat nog duurt.

Lees ook: 'Google-software kan behandeling ongeneeslijke ziektes vinden'