Prisoner's dilemma

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Het prisoner's dilemma (in het Nederlands ook wel vertaald als dilemma van de gevangene) is een begrip uit de speltheorie als voorbeeld van de relatieve voordelen van samenwerken en niet samenwerken.

Formulering[bewerken]

Meestal luidt de formulering ongeveer als volgt:

Er is een ernstig misdrijf gepleegd. Twee gewapende mannen worden gepakt en het lijkt erop dat het de daders zijn, maar het bewijs ontbreekt. Ze worden apart in de cel gezet en kunnen niet met elkaar communiceren. De openbaar aanklager doet elke verdachte het volgende voorstel:
  1. Als jullie allebei blijven zwijgen, kan ik jullie niet veel maken. Je krijgt dan alleen een geldboete wegens wapenbezit zonder vergunning.
  2. Als er één bekent is de zaak rond. Degene die bekent zal ik laten gaan omdat hij zo goed heeft meegewerkt. Degene die niet bekent kan minstens tien jaar gevangenisstraf verwachten.
  3. Als jullie allebei bekennen, krijgen jullie allebei vijf jaar.

De vraag is: wat kan een gevangene het beste doen (optimale strategie)?

De kern van het dilemma is dat het voor beide verdachten samen weliswaar beter is om te zwijgen, maar dat elke verdachte alleen aan zijn eigen voordeel denkt. Ongeacht wat de ander doet, is het voor elke verdachte beter om te bekennen. Immers: als de ander zou zwijgen, heeft bekennen het grootste voordeel, en als de ander bekent, heeft bekennen ook het grootste voordeel. Onderstaande tabel geeft de gedachtegang van elk van de verdachten weer:

Ik zwijg Ik beken
Hij zwijgt Ik krijg een geldboete Ik ben vrij
Hij bekent Ik krijg tien jaar Ik krijg vijf jaar

Speltheoretisch bezien is het voornaamste kenmerk van dit spel dat het een niet-nulsomspel is: de gezamenlijke straf is, afgezien van de geldboete, nul of tien jaar. Vergelijkbare situaties komen in het dagelijks leven vaak voor. Is het in dergelijke situaties beter om samen te werken met de ander, of om voor de snelle winst te gaan? Als men voorziet dat een dergelijke situatie met dezelfde partijen vaker zal voorkomen, is het beter om samen te werken (en beiden te zwijgen in het voorbeeld). Is de ontmoeting eenmalig, dan kan dit anders liggen.

In het algemeen spreekt men in het prisoner's dilemma van 'samenwerken' en 'deserteren' (Engels: cooperation en defection). In het klassieke dilemma is het samenwerken dus zwijgen (want als beide spelers dat doen, komen ze er gezamenlijk het beste vanaf) en deserteren is bekennen: men kiest dan voor het eigen hachje.

Voorbeelden[bewerken]

Vervoer[bewerken]

Stel, velen gaan op hetzelfde moment naar hun werk en men kan de bus nemen of de auto. Reizen met de bus duurt tien minuten langer doordat men eerst naar de bushalte moet lopen en doordat de bus een omweg maakt en bij verschillende haltes moet stoppen. Als echter meer mensen de auto nemen ontstaat er een file, en daar heeft de bus ook last van.

Ik neem de bus Ik neem de auto
De meesten nemen de bus 20 minuten 10 minuten
De meesten nemen de auto 130 minuten 120 minuten

Het resultaat is vergelijkbaar met dat uit het dilemma van de gevangene. Wat de anderen ook doen, het is voor de betrokkene zelf altijd beter om de auto te nemen, ook al is er een duidelijke aansporing om collectief het openbaar vervoer te nemen.

Adverteren[bewerken]

Een ander vergelijkbaar voorbeeld is het dorp met twee supermarkten. Elke winkel heeft de helft van het dorp als klant. Een winkel kan meer klandizie krijgen door te adverteren. Dat kost geld, maar daar staat de klandizie tegenover. Dat gaat ten koste van de concurrent, want de bewoners doen niet méér boodschappen. Het eindresultaat zal zijn dat beide winkels advertentiekosten maken, zonder dat ze meer klandizie krijgen: een situatie vergelijkbaar met een wapenwedloop. De matrix lijkt een nulsomspel te beschrijven (immers, beide spelers verdelen een markt die niet groter of kleiner wordt: wat de een wint, verliest de ander). Het is echter geen nulsomspel wanneer de advertentiekosten worden meegerekend. In dat geval is er een gezamenlijk voordeel te behalen door allebei niet te adverteren, en ontstaat weer een soort prisoner's dilemma.

Ik adverteer niet Ik adverteer
De concurrent adverteert niet 50% van het dorp komt bij mij 90% van het dorp komt bij mij
De concurrent adverteert 10% van het dorp komt bij mij 50% van het dorp komt bij mij

Mededinging vs. kartelvorming[bewerken]

Een dergelijke situatie kan zich eveneens voordoen met betrekking tot de prijzen voor producten. Prijsafspraken zijn expliciet verboden op grond van het mededingingsrecht, bovendien zal ieder bedrijf een prikkel hebben 'vals te spelen' en de prijs te verlagen omdat de afspraken niet afdwingbaar zijn. Een dergelijke problematiek speelt binnen de OPEC, waar ieder land de neiging heeft de eigen productie te verhogen tot boven het quotum, terwijl het er belang bij heeft dat alle anderen zich wel aan hun quota houden. Het nadeel dat Irak hierdoor meende op te lopen door overproductie van Koeweit was een factor in het uitbreken van de Golfoorlog van 1990-1991.

Ik reken hoge prijzen Ik reken lage prijzen
Concurrent rekent hoge prijzen Hoge prijzen, hoge winsten Ik verwerf meer marktaandeel en heb hogere winst, concurrent heeft lagere winst
Concurrent rekent lage prijzen Ik verlies marktaandeel en heb lagere winst, concurrent heeft hoge winst Lage prijzen (prijzenoorlog), lage winsten

Varianten[bewerken]

Op het prisoner's dilemma bestaan meerdere varianten. Het dilemma krijgt in de ethiek veel aandacht omdat nogal wat maatschappelijke problemen overeenkomsten vertonen met het dilemma van de gevangene. Het gaat dan niet meer om twee personen die wel of niet samenwerken, maar om vele mensen. Evenmin is er sprake van een eenmalige keuze, maar dient er steeds opnieuw gekozen te worden. Men spreekt dan van een gegeneraliseerd dilemma van de gevangene, of speltheoretisch van een multiplayer, een repeated of (gecombineerd) een repeated multiplayer prisoner's dilemma. Belasting betalen of afval opruimen zijn voorbeelden van een dergelijke gegeneraliseerde situatie.

Multiplayer prisonner's dilemma[bewerken]

Wanneer men een spel met meer dan een speler speelt, spreekt men van een multiplayer prisonner's dilemma. Dit wordt vaak aangeduid als diner's dilemma, naar het veelgebruikte voorbeeld van een groep die gaat dineren. Hierin speelt een speler niet tegen een andere speler, maar tegen een groep als geheel.

Een groep van 10 personen gaat uit eten en besluit de rekening gelijkelijk te verdelen. Men kan kiezen uit 2 menu's: een duur menu van € 30 en een goedkoop menu van € 20. Iedereen zou, wanneer hij alleen was, een goedkoop menu kiezen om zo min mogelijk te hoeven betalen. Wanneer iedereen dit doet, kost het 200/10 = 20 euro per persoon, precies datgene dat eenieder had besteld. Als één persoon echter een duur menu kiest, krijgt hij een rekening van € 210/10 = € 21, terwijl hij toch voor € 30 heeft gegeten. Doet iedereen hetzelfde, dan bedraagt de rekening € 300/10 = € 30 per persoon. Iedereen betaalt precies voor zijn of haar bestelling, maar is alsnog duurder uit. Bestelt één persoon voor € 20 terwijl de rest bestelt voor € 30, betaalt hij ondanks zijn goedkope maaltijd € 29. Het is derhalve beter duur te bestellen, dan betaalt men weliswaar maximaal € 30 maar nooit meer dan de eigen maaltijd gekost heeft.

In het dagelijks leven komen multiplayer prisoner's dilemma's voor wanneer men kosten en lasten op een collectief kan afwentelen. Voor iedere deelnemer is er een prikkel om zoveel mogelijk van dit collectief te profiteren, maar wanneer iedereen dit doet, functioneert het collectief niet langer. Men spreekt hier ook wel van de tragedie van de meent (tragedy of the commons) en het dilemma van de collectieve actie (free-riders probleem). Voorbeelden zijn:

  • belastingen betalen en van openbare voorzieningen profiteren, waarbij een ieder zo min mogelijk wil betalen en zo veel mogelijk wil profiteren;
  • CO2-emissies, waarbij de landen gezamenlijk belang hebben bij emissievermindering, maar ieder land voor zichzelf zoveel mogelijk wil kunnen uitstoten;
  • de tegenstrijdige belangen tussen de OPEC als geheel en ieder lid afzonderlijk;
  • corruptie geeft voor enkelen voordeel, maar voor de samenleving als geheel nadeel;
  • een klassenopdracht met meerdere leerlingen, waarbij ieder zo min mogelijk wil uitvoeren, maar toch een hoog cijfer wil (free-riders probleem);
  • het gelijkelijk per appartement omslaan van energiekosten in een flatgebouw waardoor iedereen geneigd zal zijn veel energie te consumeren. Om dezelfde redenen kan het verleidelijk zijn in een studentenhuis voor een duur (lang of internationaal) telefoongesprek de telefoontikken niet te noteren;
  • de rommelige of zelfs extreem vieze gezamenlijke ruimtes in studentenhuizen; niemand wil schoonmaken, vooral niet wanneer de anderen het (ook) niet doen.

Repeated prisonner's dilemma[bewerken]

Wanneer een prisonner's dilemma-situatie herhaald wordt spreekt men van een repeated prisonner's dilemma. Hierbij dient men niet alleen rekening te houden met een enkel spel, maar ook met de strategie van spelers in vervolgsituaties. In het eerdergenoemde diner's dilemma kan een gast er weliswaar een keer mee wegkomen een dure maaltijd te bestellen en slechts € 21 te betalen, maar is de kans groot dat de groepsleden bij herhaling van het uitje ook dure maaltijden gaan bestellen.

Met name wanneer het aantal spelronden onbekend is, kan een coöperatieve strategie lucuratiever zijn. Een voorbeeld is een prisoner's dilemma tussen twee fabrikanten. Beiden maken meer winst wanneer ze een hoge prijs vragen, maar dan lopen ze ieder het risico dat de ander de prijs verlaagt en alle klanten wegkaapt. Zodoende zullen beide fabrikanten de prijs verlagen. Nu is het mogelijk dat ze met het verloop van tijd de reactie van de concurrent incalculeren en toch hun prijzen iets verhogen. Het prisoner's dilemma is nu een repeated prisonner's dilemma geworden en met meer dan 2 fabrikanten zelfs een repeated multiplayer prisonner's dilemma. Iedere fabrikant kan besluiten zich niet coöperatief op te stellen, maar weet ook dat er morgen een nieuwe dag is en dat de concurrent kan terugslaan met een eigen prijsverlaging waardoor een prijzenoorlog wordt ontketend. Een dergelijke prijzenoorlog is in niemands belang en daardoor kunnen fabrikanten besluiten een coöperatieve strategie te volgen waardoor ze hogere prijzen kunnen rekenen en meer winst kunnen maken. Een dergelijke strategie is, omdat er geen daadwerkelijke (hooguit een stilzwijgende) afspraak bestaat, niet verboden onder het mededingingsrecht.

Het doorbreken van een prisoner's dilemma[bewerken]

Er bestaan factoren die een prisoner's dilemma kunnen doorbreken of verzwakken. Sociale druk is hier een van; bij het voorgenoemd diner's dilemma zal iemand ervan kunnen worden weerhouden een dure maaltijd te kiezen doordat men zich schuldig voelt jegens de anderen, vooral wanneer dit vrienden of bekenden zijn. Zijn de tafelgenoten echter volslagen onbekenden, dan zal de verleiding groter zijn een egoïstische strategie te kiezen en een dure maaltijd te bestellen. Communicatie en afspraken tussen partijen kunnen eveneens een prisoner's dilemma doorbreken. Dergelijke afspraken moeten echter wel afdwingbaar zijn. Kartelafspraken zijn dat niet omdat ze illegaal zijn, ze zijn derhalve in veel gevallen niet effectief aangezien een karteldeelnemer ongestraft zijn medekartelgenoten kan verraden door onder de afgesproken prijs te verkopen.

Zie ook[bewerken]

Externe links[bewerken]