NOS Nieuws

Zelflerend computerprogramma kan beste Stratego-spelers aan

Een dochterbedrijf van Google heeft een zelflerend computerprogramma ontwikkeld dat het tegen de beste Stratego-spelers ter wereld kan opnemen. Het programma DeepNash haalde een top 3-plaats op de ranglijst van Gravon, een van de grootste online platforms voor Stratego-spelers.

"Heel interessant", zegt drievoudig wereldkampioen Stratego Vincent de Boer. Hij werkte zelf mee aan het ontwikkelen van het programma. Toch heeft het hem verrast dat het nu al gelukt is om zo'n goed presterend programma te maken. "Omdat het voor computers moeilijk is. Je moet inschatten wanneer een mens bluft, je moet in het hoofd van de tegenstander komen."

Stratego is een bordspel waarbij twee legers strijd leveren. Het bord is het slagveld. De stukken, veertig voor elk leger, stellen militaire rangen voor, bommen, een spion en een vlag. Wie de vlag van de tegenstander verovert, wint. Net als bij schaken of go moeten spelers vooruit denken. Dat is bij Stratego nog veel moeilijker dan bij schaken of go, omdat er steeds veel meer vervolgstappen mogelijk zijn.

Daar komt nog wat bij. Anders dan bij schaken of go maken Stratego-spelers zelf een opstelling en kan een tegenstander niet zien hoe de vijand zijn stukken opstelt. Daar komt hij gaandeweg achter door stukken van de tegenstander aan te vallen.

Deelnemers aan het Open WK Stratego in 2002 in Rotterdam

Voor specialisten in kunstmatige intelligentie (AI) was het maken van een programma om Stratego te spelen een uitdaging. Voorgangers van DeepNash bleken alleen in staat om recreatieve spelers te verslaan, niet om van wereldtoppers te winnen.

Google-dochterbedrijf DeepMind benaderde De Boer, omdat hij Stratego-expert én AI-onderzoeker is. Dat kwam van pas bij het analyseren van problemen en het zoeken naar verbeteringen als er iets niet goed ging.

In april van dit jaar nam het programma het twee weken lang op tegen Stratego-spelers op Gravon. Deepnash won 84 procent van de 'veldslagen' die meetellen voor de ranking. Deepmind gaat door met het onderzoek om DeepNash nog beter te maken. "We weten wat voor stappen nog gezet moeten worden", zegt De Boer.

Diplomacy

Eind vorig jaar schreef Science over Cicero, een AI-computerprogramma van Meta speciaal geschreven om aan het bordspel Diplomacy mee te doen. Bij dit spel moeten spelers met elkaar onderhandelen om te kunnen winnen. De makers gaven Cicero daarom een dialoog-module mee.

Cicero verbeterde zichzelf door online wedstrijden te spelen op een speciale Diplomacy-website. Na veertig deelnames stond het programma in de top-10 van best presterende deelnemers. "Ook een mooie prestatie", zegt De Boer. Wat Diplomacy makkelijker maakt, is dat er minder zetten en minder mogelijkheden zijn. Wat het moeilijker maakt is dat je met gesproken taal te maken hebt."

Deel artikel:

Advertentie via Ster.nl