splitsteal

De spanning is te snijden. Het zijn de laatste drie minuten van het Britse programma Golden Balls, en de twee overgebleven kandidaten strijden om het geldbedrag dat tijdens het spel bijeen is geschraapt. Beiden hebben ze twee opties: ze kunnen delen (‘split‘) of stelen (‘steal‘). Kiezen ze allebei voor de laatste optie dan gaan ze met niets naar huis; kiezen ze voor de eerste optie dan wordt het geld eerlijk over de twee verdeeld. Maar kiest er één voor steal en de ander voor split dan gaat de dief er met de volledige buit vandoor.

Het spel is verwant aan het Prisoner’s Dilemma (waar Charlotte onlangs al over schreef), met één toevoeging: de kandidaten krijgen de kans te overleggen voor ze (blind) hun uiteindelijke keus maken. En dan gebeurt er iets bijzonders. In plaats van de ander van zijn betrouwbaarheid te overtuigen zegt één van de kandidaten glashard dat hij gaat stelen, en is daar niet vanaf te brengen. Hij vraagt de ander om split te kiezen. “Maar,” zo zegt hij, “na de show zal ik het geld met je delen. Beloofd.” Zijn tegenspeler is volledig van zijn stuk gebracht, en doet uiteindelijk verbouwereerd wat hem wordt gevraagd. Dan blijkt de kandidaat een leugenaar: ook hij heeft split gekozen. Ze gaan beiden met een flinke prijs naar huis.


(Het overleg begint op 2:35.)

Dit voorbeeld illustreert, waarschijnlijk onbedoeld, iets belangrijks over het Prisoner’s Dilemma: communicatie verandert de zaak. En laat dat nou precies de conclusie zijn die getrokken werd in een recente Nature publicatie over dit onderwerp.

Het dilemma
Het Prisoner’s Dilemma wordt vaak gebruikt als simulatie van sociale interacties, die zo worden vereenvoudigd tot een binaire keuze: samenwerking (delen), of je eigen hachje redden (stelen). Niet alleen zegt je keuze in het spel wat over jouw eigen instelling — ben je te vertrouwen, of verraad je als je de kans krijgt? — maar ook geeft het aan in hoeverre je argwaan koestert tegenover je tegenspeler. Onderzoek met dit spel wordt dan ook gemakkelijk vertaald naar de samenleving (zo zouden gevangenen bijvoorbeeld vriendelijker zijn dan studenten, al heeft Charlotte daar zo haar twijfels over).

Wat de beste keuze is in het spel, hangt van een aantal factoren af. Het maakt bijvoorbeeld nogal wat uit als je je tegenspeler nog eens tegen zal komen in de toekomst, of als je hem in het verleden al eens voor je hebt gehad. Voor zo’n herhaald Prisoner’s Dilemma — bestaande uit meerdere interactierondes — werd jarenlang gedacht dat een ‘Tit for Tat‘ strategie uiteindelijk het beste was voor alle betrokkenen. Hierbij volgen de deelnemers slechts één simpele regel: altijd samenwerken, tenzij de tegenpartij dat tijdens de vorige ronde niet heeft gedaan. De strategie heeft wel nadelen: zo kan een spel in een death-spiral belanden, waarin de twee deelnemers alleen nog maar verraden. Maar kleine variaties op de strategie — ‘Tit for Tat with forgiveness‘, bijvoorbeeld — doorbreken dit soort vicieuze cirkels.

Afpersing
Tit for Tat werd al geopperd in 1979, maar nog steeds blijft het Prisoner’s Dilemma vol verrassingen. Vorig jaar werd de wereld opgeschrikt door een hele nieuwe tactiek: de Amerikaanse wetenschappers William Press en Freeman Dyson lieten zien dat er manieren bestaan om, met slechts beperkte informatie over zijn keuzes in het verleden, de score van je tegenstander onder controle te houden. Hiermee win je niet altijd — het gedrag van de tegenstander heeft nog wel invloed op jouw score — maar zo kan je hem wel onder druk zetten (hier kan je deze strategie aan het werk zien, en zelf tegen de computer een spelletje spelen).

Ineens veranderde de essentie van het Prisoner’s Dilemma, en de boodschap die het uitdroeg ook: waar succesvolle strategieën voor de lange termijn voorheen veelal een optimistisch thema hadden — samenwerken is uiteindelijk in iedereens voordeel — was het nu alsnog een oefening in afpersing geworden.

Evolutie
Gelukkig kunnen de optimisten inmiddels weer opgelucht ademhalen, want ook deze boodschap is inmiddels achterhaald. Vorige week publiceerden Christoph Adami en Arend Hintze in Nature dat de afpers-strategie van Press en Dyson toch niet houdbaar is op de lange termijn. Adami en Hintze lieten het namelijk niet bij enkele spelers, maar simuleerden hoe strategieën zouden evolueren over tijd. Zo zagen ze dat, in een wereld waar veel afpersers rondlopen, er vanzelf manieren komen om elkaar te herkennen, en zodoende de strategie aan te passen: afperser tegen afperser heeft namelijk weinig zin. En voor je het weet ben je weer aan het samenwerken, afperser of niet.

En daar kwam de communicatie om de hoek kijken. Voor een succesvolle aanpassing op andermans strategie is namelijk meer informatie nodig dan alleen het gedrag van een tegenstander in de afgelopen paar rondes. Herkenning van je mede-afperser is cruciaal, en zorgt uiteindelijk voor samenwerking. En herkenning kan alleen door informatieoverdracht.

Net als bij Golden Balls blijkt communicatie dus een game changer. Maar, benadrukken de wetenschappers, ook als er in het spel informatie beschikbaar is over de strategie en geschiedenis van je tegenstander zijn er geen garanties. Spelers kunnen zich voordoen als afperser, en zo hun tegenstander voor de gek houden: hoe goed de communicatie ook is, er zijn altijd omwegen te vinden.

Wijze woorden. Daar zal niemand die de Golden Balls aflevering heeft gezien het mee oneens zijn.

 

Voor de liefhebber: hier staat nog een leuke (en diepgaande) analyse van het Golden Balls spel.

Edit 12/08/2013. En door Erasmus promovendus Dennie van Dolder werd ik op nog meer artikelen over Golden Balls gewezen: een wetenschappelijk (peer reviewed, Engelstalig) artikel uit zijn vakgroep is hier te downloaden, en verder hier en hier beschreven (in het Nederlands).