Direct naar artikelinhoud
AnalyseAlphaZero

Hoe AlphaZero zich de schaakkunst eigen gemaakt heeft en beïnvloeding van de mens niet nodig had

Hoe AlphaZero zich de schaakkunst eigen gemaakt heeft en beïnvloeding van de mens niet nodig had
Beeld ANP

Eind vorig jaar maakten we kennis met het door het Britse technologiebedrijf Deep Mind ontwikkelde computerprogramma AlphaZero. In een tweekamp tegen de commerciële wereldkampioen Stockfish liet het iets zien wat nooit eerder was vertoond: het speelde schaak dat de moeite van het volgen waard was. Voor de komst van AlphaZero was weinig saaier dan de ellenlange partijen van twee tegen elkaar spelende computers.

AlphaZero heeft zich de schaakkunst eigen gemaakt zonder beïnvloeding van de mens. Meer dan de basale spelregels kreeg het programma niet mee. Door miljoenen partijen tegen zichzelf te spelen, ontdekte het in een mum van tijd wat de beste openingen zijn en hoe het midden- en eindspel dient te worden behandeld. Stockfish was kansloos tegen het nieuwe wereldwonder.

Opmerkelijk is dat AlphaZero ongeveer hetzelfde openingenrepertoire heeft ontwikkeld als dat van de huidige wereldtop. De favoriete verdediging van het programma tegen 1. e2-e4 is de nauwelijks te kraken Berlijnse verdediging, waarmee Kramnik in de WK-match in 2000 Kasparov in toom hield. De mens had ruim honderd jaar nodig om deze al in de 19de eeuw bekende steen der wijzen opnieuw te ontdekken. AlphaZero lukte het in enkele uren.

Onlangs verscheen fascinerend materiaal uit een begin dit jaar gespeelde tweede match tussen AlphaZero en Stockfish. Geïnteresseerden raad ik aan op YouTube de video’s te bekijken, waarin de Engelsman Matthew Sadler enkele partijen becommentarieert. Binnenkort verschijnt zijn boek Game Changer.