Uw profiel is aangemaakt

U heeft een e-mail ontvangen met een activatielink. Vergeet niet binnen 24 uur uw profiel te activeren. Veel leesplezier!

Computer waar wereldkampioen go van verloor verpletterd door eigen opvolger

Home

Joep Engels

De Zuid-Koreaanse go-speler Lee Sedol nadat hij vorig jaar van een go-computer verloor. © AP

Een nieuwe go-computer heeft het moeilijkste bordspel ter wereld geleerd zonder hulp van de mens. En wint alles.

Het was een sensatie. Begin 2016 veroverde de computer het laatste bastion van de denksport. Het eeuwenoude go was in al zijn eenvoud zo’n complex spel dat het voor een computer te hoog gegrepen leek. Maar AlphaGo, een computerprogramma van Google-dochter DeepMind, maakte zich de kneepjes van het bordspel eigen. Het kreeg talloze bestaande partijen voorgeschoteld en leerde zichzelf zo de kansen van elke zet te wegen. In maart 2016 versloeg AlphaGo Lee Sedol, de achttienvoudige wereldkampioen.

Lees verder na de advertentie

> Wat is go precies voor spel? Lees onderaan dit stuk een uitleg.

Maar nu is er AlphaGo Zero, een programma dat alleen de regels uitgelegd kreeg, maar het verder helemaal zelf mocht uitzoeken. AlphaGo Zero was zijn eigen leermeester, het speelde tegen zichzelf. De computer probeerde zetten, dacht ook een aantal zetten vooruit en calculeerde telkens zijn winstkansen. Dat deed zijn spiegelbeeld aan de overkant van het bord ook, en zo bouwde de AlphaGo Zero zijn kennis van het spel op.

Na drie dagen en miljoenen oefenpotjes was hij zijn voorganger ruim de baas. Ze speelden een heuse match en Zero won: 100-0.

Het begin- en eindspel ogen nog conventioneel, maar het middenspel lijkt bo­ven­men­se­lijk. ‘Het lijkt wel tovenarij’.

Denkwijze

De kracht van de computer schuilt in zijn eenvoud, schrijven zijn ontwerpers in het vakblad Nature. AlphaGo kreeg dan wel hulp van de mens, maar dat beperkte zijn mogelijkheden. Juist omdat Zero als een onbeschreven blad begon, kon hij boven de concurrentie uitgroeien. De computer was bij de ontwikkeling van zijn strategieën niet gebonden aan de keuzes die de mens ooit voor hem had gemaakt.

Go-spelers verbazen zich in een begeleidend schrijven in vakblad Nature over de denkwijze van de computer. Een menselijke speler vaart volgens hen deels op vuistregels, patronen en strategische concepten. Op inzichten die in drieduizend jaar zijn vergaard. De computer heeft die kennis in drie dagen gekregen, maar daar ook nieuwe spelopvattingen aan toegevoegd. Begin- en eindspel ogen nog conventioneel, maar het middenspel lijkt bovenmenselijk. “AlphaGo Zero lijkt hier wat te winnen, daar wat te geven, maar op de een of andere manier eindigt hij steeds met een voordeel. Het lijkt wel toverij.”

De computer was bij de ontwikkeling van zijn strategieën niet gebonden aan de keuzes die de mens ooit voor hem had gemaakt

De slimme computer, of kunstmatige intelligentie zoals het officieel heet, toont zijn kunnen vaak in denksporten. Twintig jaar geleden werd het schaken veroverd, nu dus go. Een denksport is een goede manier om aan te tonen hoe ver het vakgebied is gevorderd. Maar er is een hoger doel, zegt de baas van DeepMind, Demis Hassabis. “Deze doorbraken in kunstmatige intelligentie helpen ons problemen uit de echte wereld op te lossen. Zoals het ontwerp van nieuwe materialen of geneesmiddelen, of de bouw van medische expertsystemen.”

Wat is Go?

Go is een bordspel met een rooster van 19 bij 19 lijnen. Om beurten leggen de twee spelers hun zwarte of witte stenen op één van de 361 roosterpunten. Geplaatste stenen blijven liggen, ze worden hooguit weggenomen als ze door de stenen van de andere kleur zijn ingesloten. Het gaat erom zoveel mogelijk gebieden te veroveren en stenen van de ander weg te nemen.

Het spel is al gauw heel complex. Er zijn meer standen op het bord denkbaar dan er atomen zijn in het heelal. Een partij go beslaat zeker tweemaal zoveel zetten als een potje schaak, en per zet heeft een go-speler wel tien keer zoveel opties. Zelfs de krachtigste computer kan bij go niet meer dan een paar zetten vooruit rekenen.

Lees ook: Wereldkampioen go moet buigen voor computer

Deel dit artikel

Het begin- en eindspel ogen nog conventioneel, maar het middenspel lijkt bo­ven­men­se­lijk. ‘Het lijkt wel tovenarij’.

De computer was bij de ontwikkeling van zijn strategieën niet gebonden aan de keuzes die de mens ooit voor hem had gemaakt