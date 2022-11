Opnieuw heeft de computer zich een bordspel toegeëigend. De afgelopen jaren hebben de beste schakers en go-spelers het al afgelegd tegen een machine. Ook met poker veegt de computer zijn tegenstanders inmiddels van tafel. En nu is dan Diplomacy aan de beurt. Amerikaanse computerwetenschappers melden dinsdag in Science dat hun systeem, Cicero genaamd, in een online competitie van het spel in de toptien is geëindigd.

Dat getuigt misschien niet van een onoverwinnelijke status, maar voor een spel als Diplomacy is het een opmerkelijke prestatie. Bij schaken of go moest de computer zich het spel eigen maken. Het systeem kreeg de regels, speelde talloze spellen – vaak ook met zichzelf – en leerde zo wat bij een willekeurige stand op het bord de beste zet was. Maar Diplomacy is een spel waarbij spelers afspraken met elkaar moeten maken en bondgenootschappen sluiten. Een spel waarbij je het vertrouwen van je medespelers moet winnen, in de wetenschap dat je niet iedereen kunt vertrouwen.

Heerschappij op het oude continent

Het bord is de kaart van Europa, kort voor de Eerste Wereldoorlog. Zeven grootmachten streven naar heerschappij op het oude continent. In geheime overlegrondes probeert iedereen kongsi’s te sluiten – steun je mij in die aanval, dan geef ik jou daar rugdekking. Aan het eind van zo’n ronde noteert iedereen zijn voorgenomen acties waarna ze tegelijk openbaar worden en blijkt wie zijn beloftes gestand doet en wie niet. Vervolgens worden de acties eventueel uitgevoerd – als een aanval op een verdediging stuit, of de agressor wordt zelf aangevallen, dan gaat de aanval niet door.

De computer moet voor dit spel van vele markten thuis zijn. Hij moet een strategisch plan kunnen ontwikkelen. Hij moet zijn tegenstanders leren lezen: wat is iedereen van plan, wie is te vertrouwen en wie niet. Hij moet het vertrouwen van een ander zien te winnen. En hij moet geloofwaardig kunnen communiceren.

Net als de schaak- of go-computer kreeg ook Cicero vele spellen voorgeschoteld: ruim 40 duizend in dit geval die op een internetversie van Diplomacy waren gespeeld, met daarbij bijna 13 miljoen berichten waarmee de spelers hadden onderhandeld. Zo kreeg hij inzicht in het spel maar vervolgens moest hij leren zelf geloofwaardig te communiceren. Dat wil zeggen, berichtjes versturen waar niet alleen een slimme strategie achter zat, maar die ook het vertrouwen van de menselijke tegenstanders konden winnen.

Niemand had door dat hij tegen een machine speelde

Omdat de computer slimmer moest spelen dan de mens, was er meer nodig dan alleen de berichtjes uit de dataset nabootsen. De ontwerpers moesten daarom de taalverwerving van hun computer verweven met zijn strategie. Daarin slaagden ze volkomen. Toen ze Cicero aan een competitie lieten deelnemen, had niemand van zijn 82 tegenstanders door dat hij tegen een machine speelde.

In deze studie deed Cicero mee met veertig spellen in de zogeheten blitz-competitie. Hij eindigde in de toptien en scoorde twee maal zo veel als het gemiddelde. In hun artikel laten de onderzoekers in het midden wat het belang van hun studie kan zijn. Maar met hun herkomst lichten ze een tipje van de sluier op: ze zijn bijna allemaal gelieerd aan Meta, het moederbedrijf van Facebook. Als ze een voorbeeld geven hoe Cicero een tegenstander weet te overtuigen om zijn aanvalsplan te laten varen en de zijde van de computer te kiezen, laten ze aan de lezer weinig ruimte voor verbeelding over.

Lees ook:

Computer waar wereldkampioen go van verloor verpletterd door eigen opvolger

Een nieuwe go-computer heeft het moeilijkste bordspel ter wereld geleerd zonder hulp van de mens. En wint alles.