Il Dilemma del Prigioniero

di Cristina Scarcella

 

A tutti è capitato, e in genere accade spesso, di trovarsi di fronte ad un dilemma: una di quelle situazioni apparentemente insolubili in cui qualsiasi strategia ha i suoi pro e i suoi contro.

In questi casi qual è la cosa migliore da fare? Analizzare le possibilità e optare per la scelta che consenta di correre i minori rischi possibili e, allo stesso tempo, di garantire il risultato più alto. Il che spesso significa non ottenere il risultato migliore in assoluto, ma il migliore tra quelli che permettono di limitare i rischi.

Ma la maggior parte delle volte la partita è infinita, o perlomeno è finita tanto quanto lo può essere un essere umano. E allora il gioco si complica: le manches sono molte, ma a tutti non interessa vincere la battaglia, ma la guerra.

Può trattarsi davvero di una guerra dei nostri tempi o di una coppia di virus dispettosi o di una spericolata corsa in auto il sabato sera o di qualunque rapporto tra due persone.

Sì, perché il dilemma del prigioniero è tutto questo.

La chiave di volta “razionale” per risolvere tutti i dilemmi.

Che spesso nasconde una certa dose di “irrazionalità”…

1. Il dilemma del prigioniero

"Due sospettati, A e B, sono arrestati dalla polizia. La polizia non ha prove sufficienti per trovare il colpevole e, dopo aver rinchiuso i due prigionieri in due celle diverse, interroga entrambi offrendo loro le seguenti prospettive: se uno confessa (C) e l’altro non confessa (NC) chi non ha confessato sconterà 10 anni di detenzione mentre l’altro sarà libero; se entrambi non confesseranno, allora la polizia li condannerà ad un solo anno di carcere; se, invece, confesseranno entrambi la pena da scontare sarà pari a 5 anni di carcere. Ogni prigioniero può riflettere sulla strategia da scegliere tra, appunto, confessare o non confessare. In ogni caso, nessuno dei due prigionieri potrà conoscere la scelta fatta dall’altro prigioniero."

Quindi, la domanda che questo dilemma pone è la seguente: Cosa accadrà? Come si comporteranno i due prigionieri?”

Albert W.Tucker

Questa è la celeberrima forma, potremmo dire “forma base”, con cui è noto il Dilemma del prigioniero, studiato da Merrill Flood e Melvin Dresher al RAND nel 1950 e successivamente formalizzato da Albert W. Tucker, a cui dobbiamo anche il nome del dilemma, tramite la matrice dei payoff  (Poundstone, 1992).

Ma procediamo con ordine.

Il Dilemma del Prigioniero è un classico esempio della Teoria dei Giochi. Chiariamo, innanzitutto, cosa sia, in realtà, un gioco: la Teoria dei Giochi considera tali le situazioni in cui i giocatori prendono “decisioni strategiche”, cioè decisioni in cui ciascun giocatore tiene conto delle azioni e delle reazioni di ognuno degli altri.

Un primo distinguo è da operare tra “giochi cooperativi” e “giochi non-cooperativi”. Sono considerati “giochi cooperativi” quei giochi in cui i partecipanti possono accordarsi in modo tale da programmare strategie congiunte. Sono considerati, invece, “giochi non-cooperativi” quelli in cui non è possibile, da parte dei giocatori, accordarsi preventivamente per adottare la strategia più vantaggiosa per entrambi.

Il Dilemma del Prigioniero è un gioco NON-cooperativo, quindi, come già detto, i due prigionieri sono stati interrogati separatamente, non avendo potuto accordarsi preventivamente né potendo mai venire a conoscenza della strategia adottata dall’altro giocatore/prigioniero.   

Il modo più comodo per rappresentare il Dilemma del prigioniero è la “Matrice dei Payoff”, ovvero una matrice che rappresenta i payoff  generati dalle decisioni strategiche dei giocatori. I Payoff non solo altro che gli esiti del gioco e rappresentano i benefici che deriveranno all’uno e all’altro giocatore in funzione della giocata. Un importante obiettivo della Teoria dei Giochi è, ovviamente, la determinazione della strategia ottimale di ogni giocatore, ovvero di quella strategia che massimizza il suo payoff atteso.

Rappresentiamo la matrice dei payoff del dilemma del prigioniero:

prigioniero A/ prigioniero B

Confessa

Non confessa

Confessa

-5,-5

0,-10

Non confessa

-10,0

-1,-1

Come evidenziato dalla matrice, i prigionieri in questione sono di fronte ad un dilemma. Se entrambi fossero in grado di concordare di non confessare (in un modo che sia vincolante), allora ciascuno verrebbe condannato ad 1 solo anno di carcere. Ma essi non possono comunicare e , anche se potessero farlo, potrebbero fidarsi l’uno dell’altro?

Il primo ad essere interrogato è il prigioniero A (i cui payoff sono indicati per primi ed in rosso). Trattandosi di un gioco non-cooperativo, per ogni prigioniero è “meglio” confessare perché, indipendentemente dalla scelta dell’altro giocatore, il suo payoff è più alto confessando. Infatti, indipendentemente dalla giocata di A, per B sarà più conveniente confessare. Esaminiamo il perché: se A avesse confessato (C), a B converrebbe confessare (C) perché in questo modo sconterebbero entrambi 5 anni di carcere; se A non avesse confessato (NC), a B converrebbe a maggior ragione confessare (C) perché così facendo lui sarebbe libero, mentre A sconterebbe 10 anni di carcere.

L’equilibrio del gioco è posto dunque in C-C: i due prigionieri sconteranno entrambi 5 anni di carcere. Questa situazione di equilibrio è detta “pareto-inefficiente” perché, pur essendo quella razionale, essa non rappresenta la migliore delle situazioni possibili.

Secondo la Teoria dei Giochi, la scelta di confessare (C) operata dai due prigionieri alla luce del precedente ragionamento è detta “strategia dominante”: essa è infatti definita come la strategia ottimale indipendentemente da ciò che fa l’avversario. 

Tuttavia, appare evidente come in realtà sarebbe molto più conveniente per entrambi i prigionieri non confessare (NC-NC), poiché così facendo sconterebbero entrambi soltanto 1 anno di detenzione. Ma questa giocata non sarà mai possibile!

Infatti essa risulta estremamente rischiosa, poiché se l’avversario confessasse (come è razionale che faccia) allora chi non ha confessato sconterebbe ben 10 anni di carcere, mentre l’avversario sarebbe libero.

L’unica variante che renderebbe vantaggioso per entrambi NC è che si tratti di un gioco cooperativo, ovvero che i due giocatori abbiano la possibilità di accordarsi preventivamente sulla strategia da adottare. Ma anche in questo caso, anzi, soprattutto in questo caso, la tentazione di non cooperare (e dunque di confessare) sarebbe ancora maggiore, poiché così facendo (certi del fatto che l’avversario cooperante giocherà NC) il prigioniero “leale” starà in carcere 10 anni, mentre il prigioniero “traditore” (che non ha rispettato l’accordo preventivo) sarà immediatamente libero.

Giunti a questo punto è opportuno formulare in modo generale la “regola” perché si possa affermare di trovarsi davanti ad un dilemma del prigioniero:

prigioniero A/ prigioniero B

Confessa

Non confessa

Confessa

q,q

r,s

Non confessa

s,r

p,p

In generale il gioco viene espresso mediante i rispettivi guadagni degli opponenti (e non mediante le rispettive “punizioni” espresse in anni di carcerazione e pertanto indicate con segno negativo, come supposto finora), con quattro numeri r, p, q, s:

  • r è il guadagno (alto) che ottiene il traditore in una delle situazioni NC-C o C-NC; in altre parole, r è il premio per il tradimento
  • p rappresenta il guadagno, uguale per entrambi, della situazione NC-NC di reciproca cooperazione
  • q è il guadagno, uguale per entrambi, della situazione C-C
  • s rappresenta il guadagno (basso o nullo) di chi ha cooperato mentre l'altro tradisce; s rappresenta la punizione per l'ingenuo.
John Nash

I numeri devono essere in ordine decrescente: r > p > q > s.

E' ovvio, come già dimostrato, che se si gioca una singola partita la strategia ottimale per entrambi è optare per la strategia dominante e dunque confessare.

La situazione di equilibrio posta in C-C appena descritta è detta “Equilibrio in strategie dominanti”.

E’ utile sottolineare come l’equilibrio in strategia dominanti sia un caso particolare dell’Equilibrio di Nash (dal nome del matematico John Nash, premio Nobel, che per primo spiegò questo concetto nel 1951).

Confrontiamo per chiarezza i due concetti di equilibrio:

Eq.Strategie dominanti:

  • Io faccio meglio che posso indipendentemente da ciò che fai tu.
  • Tu fai meglio che puoi indipendentemente da ciò che faccio io.

Equilibrio di Nash

  • Io faccio meglio che posso dato ciò che fai tu.
  • Tu fai meglio che puoi dato ciò che faccio io.  

 

2. Il paradosso

Il dilemma del prigioniero ha causato interesse come esempio di gioco in cui l'assioma di razionalità pare apparentemente fallire, prescrivendo un'azione che procura più danno ad entrambi i contendenti della scelta alternativa NC-NC. Gli studiosi di teoria dei giochi fanno notare che chi la pensa in questo modo probabilmente si immagina un gioco diverso, in cui la vittoria viene valutata sulla somma degli anni di carcere.

Ovvero il gioco:

prigioniero A/ prigioniero B

Confessa

Non confessa

Confessa

5+5

0+10

Non confessa

10+0

1+1

È facile vedere che questo nuovo gioco, semplificando le strategie dominanti, ha come equilibrio NC-NC, ovvero la scelta che conduce al miglior risultato possibile per entrambi.

Questa seconda formulazione (sommando gli anni di carcere) prevede che il prigioniero debba preferire il danno minore per la coppia ma non è questo il suo obiettivo nella formulazione originaria. In quella si suppone sia interessato solo ai rischi che corre personalmente.

A questo punto ci si potrebbe domandare:

  • "È possibile che non esista nessuna conclusione logica che permetta al prigioniero di sperare di rimanere in prigione un solo anno o addirittura nessuno?"
  • "È possibile che la logica non giunga a nessun'altra soluzione oltre alla accettazione di venire condannati a 5 anni senza alcuna speranza?"

Una possibile soluzione è la seguente, ma richiede un paio di precisazioni e non è universalmente accettata):

a) Si deve dare per scontato che tutti i personaggi abbiano una capacità logica pressoché perfetta. Questo non vuol dire che debbano essere buoni, altruisti o altro, ma solo che tutti capiscano il gioco allo stesso modo, e non facciano alcun errore;

b) Dato il punto a) è facile capire che tutti prenderanno la stessa decisione. Non può esistere uno che fa il furbo a scapito degli altri, perché questo automaticamente vorrebbe dire che anche gli altri faranno come lui. Solo il lettore "disattento" può pensare di far fare il furbo ad un solo personaggio.

A questo punto appare chiaro che, se uno dei prigionieri capisce che le conclusioni a cui arriva lui sono le stesse a cui arriva l'altro, scegliere NC è l'unica azione possibile.

Infatti se ci si convince che è impossibile che diano risposte diverse (vedi il punto b), allora il discorso egoista cade. Rimanendo solamente le possibilità C-C e NC-NC la scelta è a prova di dubbio.

3. Dilemma reiterato

Vincent Van Gogh,
La ronda dei prigionieri, 1890

Strategie e soluzioni

Molto più interessante è il caso del gioco ripetuto più volte. Si suppone che ad ogni ripetizione (prova), i giocatori facciano le loro scelte simultaneamente e, subito dopo una prova, ciascuno venga a conoscenza della scelta effettuata dall’altro.

Inoltre è necessario supporre che il numero delle partite non sia noto a priori. Il motivo di questa ipotesi è semplice. Se il numero delle partite fosse, diciamo, dieci, giunti alla nona partita, ci si troverebbe nella stessa condizione del gioco non iterato: si dovrebbe scegliere C o NC, ma già sappiamo che C-C è la scelta obbligata. Poiché la strategia della decima partita è fissata, abbiamo di fronte 9 partite e, continuando con questo "ragionamento del gambero", si prova che alla fine la strategia razionale è, per 10 volte, C-C, C-C, …

Se però (come nella vita) il gioco può durare a lungo e non si sa quando finisce, vi possono essere strategie più interessanti. Esaminiamo il perché.

Qualora venga disputato più volte, tra gli stessi giocatori, un gioco che non sia strettamente competitivo, la ripetizione del gioco fa emergere nuove ed interessanti considerazioni strategiche. Tale esempio è particolarmente interessante a causa della natura paradossale dell’unico equilibrio del gioco (giocato una singola volta), nel quale ciascuno dei due giocatori usa, com’è naturale, la sua strategia dominante, ma l’esito che si ottiene è peggiore per entrambi dell’esito che si avrebbe se entrambi usassero la loro strategia dominata (NC). L’obiettivo, giunti a questo punto, è individuare il modo per pervenire all’esito di collaborazione tra i due giocatori.

Fra tutti i meccanismi che possono portare alla collaborazione tra A e B, il più naturale è la ripetizione del gioco. Relazioni ripetute e reciproche tra i giocatori danno luogo a caratteristiche speciali del gioco. Nel dilemma del prigioniero ciò risiede nel fatto che ciascun giocatore teme che un caso di non cooperazione possa portare al collasso della cooperazione in futuro. Se il valore di una futura collaborazione è grande ed eccede ciò che si può guadagnare nel breve periodo non collaborando, allora l’interesse individuale a lungo termine dei giocatori può distoglierli automaticamente dal non collaborare, senza bisogno dell’intervento di terzi.

Se il Dilemma del prigioniero viene giocato tra due giocatori razionali A e B un numero finito n di volte, con n noto ad entrambi fin dall’inizio (ossia un numero fissato di volte), allora tale gioco ripetuto ammette un unico equilibrio perfetto nei sottogiochi  che prescrive a ciascun giocatore la scelta della strategia pura C-C in ogni stadio del gioco. E’ quello che scherzosamente abbiamo prima denominato “strategia del gambero”.

Nella ripetizione di un gioco in cui n non è conosciuto a priori, il carattere sequenziale della relazione reciproca tra i giocatori fa sì che essi possono adottare strategie contingenti, ossia strategie che indicano in ogni stadio del gioco una scelta che dipende dalla “storia precedente”, ossia dal comportamento che i giocatori hanno progettato per gli stadi precedenti.

La maggior parte delle strategie contingenti adottate sono dette “strategie del dito sul grilletto” (“trigger strategies”). Un giocatore usa una strategia del dito sul grilletto se egli si comporta in modo cooperativo (NonConfessa) finché l’avversario fa altrettanto, ma ad ogni defezione dell’avversario, egli fa seguire un periodo di “punizione” di lunghezza fissata, in cui gioca in modo non cooperativo (Confessa). Due delle più note “trigger strategies” sono la “strategia inflessibile” (“grim strategy”) e “tit-for-tat” (“occhio per occhio”).

La “grim strategy” ti impone di collaborare (NC) col tuo avversario fino a che egli/ella non devii dalla collaborazione; ma, allorché c’è stata una deviazione dell’avversario, tu lo punirai giocando C per il resto del gioco.

Tit-for-tat (TFT) non è così duramente vendicativa come la strategia grim ed è famosa per la sua capacità di risolvere il dilemma del prigioniero ripetuto, senza richiedere una punizione permanente. Giocare TFT significa collaborare (NC) con l’avversario se egli/ella coopera nel precedente stadio del dilemma del priogioniero ripetuto e non cooperare (C) se ella ha scelto C nel precedente stadio; ossia, la fase punitiva dura finché l’avversario continua a scegliere C.

I tornei di Axelrod: la strategia vincente

Vari studiosi hanno effettuato esperimenti in cui individui competono l’uno contro l’altro in giochi dello stesso tipo del dilemma del prigioniero. Tali esperimenti mostrano che la cooperazione può insorgere in tali giochi, anche in versioni ripetute di lunghezza finita e nota.

Robert Axelrod

Molti giocatori iniziano cooperando, e continuano così fino a che l’avversario coopera, almeno per un po’. Solo negli ultimi stadi di una ripetizione finita emergono deviazioni. Benché sia in contrasto con le conclusioni dell’analisi a ritroso, ciò può risultare proficuo se sostenuto per un ragionevole periodo di tempo. Tali comportamenti possono essere giustificati in vario modo, senza dover supporre che i giocatori siano irrazionali. Forse i giocatori non sono certi che la relazione reciproca terminerà nel momento stabilito. Oppure essi ritengono che la loro reputazione di cooperatori porterà loro vantaggi in futuro in giochi analoghi contro gli stessi o contro altri avversari. O forse essi ritengono possibile che l’avversario sia un cooperatore ingenuo e che essi rischino poco nel tentare una tale ipotesi per alcune partite.

Se la cosa ha successo, l’esperimento può condurre a guadagni più alti per un periodo di tempo abbastanza lungo. Sono state condotte anche sperimentazioni mediante simulazioni con l’uso di elaboratori. In tali sperimentazioni sono state poste una contro l’altra, nel dilemma del prigioniero ripetuto, varie strategie contingenti sia semplici che complesse La più nota di tali sperimentazioni è stata condotta da Robert Axelrod, dell’Università del Michigan.

Egli invitò, nel 1981, gli interessati a presentare programmi che specificassero una strategia per giocare il Dilemma del prigioniero ripetuto un numero finito ma alto di volte (200). Ci furono 14 adesioni. Axelrod fece giocare ciascuno dei 14 programmi contro ciascuno degli altri, per un tour di 200 ripetizioni, utilizzando come matrice dei payoff del gioco base la seguente:

prigioniero A/ prigioniero B

Confessa

Non confessa

Confessa

1,1

0,5

Non confessa

5,0

3,3

e prendendo come risultato di ogni incontro la somma dei punteggi ottenuti (nelle 200 ripetizioni).

Poi per ogni concorrente furono sommati i punteggi ottenuti contro ciascuno dei 13 avversari. Axelrod fu inizialmente sorpreso per il fatto che i programmi “buoni” si piazzavano ai primi posti: nessuno dei primi otto classificati era il primo a deviare dalla cooperazione.

La strategia vincente fu “Tit for Tat”, un programma semplicissimo, scritto con cinque “istruzioni” di Fortran dal teorico dei giochi canadese Anatol Rapoport. Programmi che erano impazienti di deviare ottennero presto il pagamento 5, ma poi dovettero sopportare la ripetizione di reciproche deviazioni e pagamenti miseri. D’altra parte, i programmi che erano sempre remissivi e cooperativi furono duramente maltrattati dai loro avversari.

Axelrod spiegò il successo di TFT in termini di quattro proprietà: “it is at once forgiving, nice, provocable, and clear”. Egli tradusse tali proprietà in quattro suggerimenti:

  • Non essere invidioso
  • Non essere il primo a deviare
  • Ricambia cooperazione e deviazione
  • Non essere troppo furbo

Axelrod, dopo avere presentato i risultati del primo torneo, ne organizzò un secondo, con un cambiamento delle regole. Questa volta ogni match non aveva una durata fissata. Invece, dopo ogni singola partita c’era una probabilità di 1/200 che il gioco finisse e una probabilità di 199/200 che il

match andasse avanti, con una durata media quindi, per ogni match, di 200 partite. Questa volta parteciparono 63 concorrenti e tutti erano a conoscenza del risultato del primo torneo. Eppure TFT di Rapoport vinse anche il secondo torneo. Egli non vinse tutti i singoli match, ma quando andò sotto, andò sotto di poco, mentre i programmi realizzati espressamente per batterlo si massacrarono tra di loro.

4. L’onnipresenza del dilemma

Il dilemma nella sua forma originaria (decisamente semplice) è molto utile per comprendere fino in fondo tutte le dinamiche relative alle strategie ed alla convenienza nell’optare per una strategia piuttosto che per un’altra, tuttavia esistono moltissimi esempi, nelle interazioni umane tanto quanto in natura, che rispettano la stessa matrice dei payoff.

Questo fa del dilemma del prigioniero un paradigma oggetto di interesse e studio da parte tanto delle scienze sociali (come economia, politica e sociologia) quanto delle scienze biologiche (come l’etologia o la biologia evolutiva). Molti processi naturali vengono spiegati per mezzo di modelli in cui gli esseri umani sono impegnati in giochi come il dilemma del prigioniero ripetuto. Questa vasta applicabilità del dilemma del prigioniero conferisce a questo gioco la sua sostanziale importanza.

Riportiamo di seguito una dissertazione più approfondita in merito alla presenza del dilemma del prigioniero all’interno di due scienze, l’una sociale (l’Economia) e l’altra biologica (la Biologia stessa)

Economia

In economia, i giocatori sono gli agenti economici (siano essi individuali o meno) e cioè consumatori, imprese, creditori, debitori, etc. Qui di seguito vengono riportati alcuni esempi di situazioni economiche rappresentabili mediante il Dilemma del prigioniero nelle quali la strategia corrisponde ad un particolare comportamento economico:

1) Dilemma del prigioniero tra due imprese

In questo caso cooperare significa fissare un prezzo alto e non cooperare fissare un prezzo basso. La

reciproca non cooperazione comporta un risultato peggiore rispetto alla reciproca cooperazione, in termini di minori profitti.

2) Dilemma del prigioniero tra impresa e consumatore

Per l'impresa cooperare significa offrire un prodotto di alta qualità mentre non cooperare offrirne uno di bassa qualità. Per il consumatore cooperare significa acquistare il prodotto mentre non cooperare non acquistarlo. Il consumatore, anticipando che la strategia debolmente dominante dell'impresa è quella di offrire un prodotto di bassa qualità, sceglie di non acquistarlo. Di conseguenza si determina una situazione Pareto-inefficiente.

3) Dilemma del prigioniero tra creditore e nuovo debitore

Per il creditore cooperare significa concedere il credito mentre non cooperare non concederlo. Per il nuovo debitore cooperare corrisponde alla restituzione del debito, mentre non cooperare alla mancata restituzione. Analoga. mente a quanto accade nel caso 2), il creditore anticipando che la strategia debolmente dominante del nuovo debitore è quella di non restituire il debito, non concede il credito richiestogli.

A differenza di quanto accade nel caso 1), nei casi 2) e 3) il Dilemma del prigioniero ha payoffs asimmetrici, in quanto a parità di coppie di strategie il payoff per i due giocatori non è eguale. Rispetto alla matrice dei payoffs presentata in precedenza, il Dilemma del prigioniero asimmetrico potrebbe avere, ad esempio, i seguenti payoffs

Consumatore-Creditore/

Impresa-Debitore

No restituzione

(=Non coopera)

Sì restituzione

(coopera)

No credito(=Non coopera)

0,0

7,-2

Sì credito(Coopera)

0,0

5,5

dove in corrispondenza di (NC, NC) la coppia di payoff è ora (0,0) in quanto nulla potrebbe essere considerata l'utilità associata ad una transazione economica che non ha luogo.

Da questa matrice si può notare che l'impresa (o debitore) ha una strate- gia debolmente dominante in quanto 7> 5 e 0 = 0, mentre il consumatore (o creditore) non ha una strategia dominante in quanto 5 > 0 ma 0> -2.

Utilizzando il procedimento di eliminazione iterata di strategie dominate, si ha che il consumatore (o creditore) anticipa il comportamento di non cooperazione dell'impresa (o debitore) in quanto sa che la cooperazione non è una strategia possibile per l'impresa (o debitore). Di conseguenza il consumatore(o creditore) sceglie di non cooperare.

In questo caso, la non cooperazione può essere interpretata come strategia di difesa, in quanto un giocatore [nel caso 2) il consumatore e nel caso 3) il creditore] non coopera in quanto anticipa la non cooperazione dell'altro giocatore [nel caso 2) l'impresa e nel caso 3) il debitore]. Più precisamente il consumatore o il creditore coopererebbe se l'impresa o il debitore cooperasse. Ma, mentre il consumatore (o il creditore) non ha una strategia dominante., l'impresa (o il debitore) ha la non cooperazione come strategia debolmente dominante.

Si è detto in precedenza che l'interesse sia degli economisti che dei politologi e dei filosofi si è concentrato sulla situazione Pareto-inefficiente determinata dal comportamento razionale degli agenti individuali, volto a massimizzare il proprio payoff. Ancora più interessante è apparso lo studio delle condizioni in grado di consentire l'emergenza della cooperazione tra gli agenti individuali allorché il gioco uniperiodale venga ripetuto un numero infinito di volte ed in ciascun periodo sia possibile osservare le azioni scelte dagli altri agenti nei periodi precedenti.

Biologia

I biologi Paul E. Turner dell’Università di Valencia e Lin Chao dell’Università della California hanno dimostrato che un virus, il fago φ6 , si comporta anch’esso secondo le regole del dilemma del prigioniero.

Un virus è una particella che vive sfruttando le funzioni vitali di una cellula ospite. Martin A. Nowak dell’Istituto di studi avanzati di Princeton e Karl Sigmund dell’Università di Vienna, nello stesso numero di Nature in cui era apparso l’articolo di Turner e Chao, affermavano che “Non c’è da stupirsi se anche i virus si sfruttano l’un l’altro”.

Quando molte varianti dello stesso virus infettano una cellula, questi competono con altri virus per le risorse loro necessarie a duplicare il menoma. Turner e Chao hanno lavorato sul φ6 e sul suo clone mutante φH2.

Le premesse sono due:

  • il fago φ6 produce una grande quantità di prodotti intracellulari necessari alla replicazione del suo cugino mutante φH2
  • il mutante φH2 vive meglio quando è raro.

Esperimenti che hanno interessato varie popolazioni miste hanno dimostrato che i virus cresciuti in situazioni in cui le infezioni multiple di cellule batteriche sono più probabili, inizialmente stanno meglio, ma poi degenerano.

Il virus egoista φH2, vivendo meglio “in solitudine”, si accaparra la maggior parte delle risorse disponibili, abbassando, però, allo stesso tempo, la potenziale capacità cooperativa di φ6 (che consiste nel riprodurre e generare prodotti per la replicazione che servono ad entrambi).

In termini evolutivi, il virus egoista, privando φ6 delle risorse necessarie, allo stesso tempo peggiora anche la sua condizione perché φ6 è indispensabile affinché φH2 stesso possa replicarsi (come sottolineato tra le premesse).

A questo punto eccoci di nuovo al dilemma!

Entrambi trarrebbero maggior vantaggio se cooperassero (esattamente come i due prigioniero che, così facendo, potrebbero scontare la pena più bassa possibile), infatti così facendo il generoso φ6 avrebbe le risorse che gli servono e, continuando a sopravvivere, garantirebbe anche la replicazione dell’egoista φH2.

Tuttavia φH2 vive meglio se solo e, temendo di non sopravvivere, preferisce sfruttare per sé tutte le risorse disponibili e dunque non cooperare.

Ancora una volta ci troviamo di fronte ad un equilibrio che sembra apparentemente irrazionale perché non consente ad entrambi di trarre il maggiore profitto possibile dalla situazione in corso.

Altri esempi di applicazioni del dilemma

In scienze politiche, per esempio, lo scenario del dilemma del prigioniero è spesso usato per illustrare il problema di due Stati impegnati in un conflitto armato. Entrambi saranno d’accordo nelle due possibili strategie a loro disposizione: incrementare la presenza militare o giungere ad un accordo. Se mai si optasse per l’accordo, nessuno dei due potrà mai avere la certezza che l’altro rispetti l’accordo stesso; per questa ragione la strategia dominante di entrambi sarà incrementare la presenza militare. Il paradosso è che si tratta della scelta razionale, che tuttavia produce un effetto apparentemente irrazionale.

Un altro interessante esempio si rifà alle ben note corse ciclistiche, prima tra tutte il Tour de France. Prendiamo in considerazione due ciclisti a metà percorso, mentre il gruppo è a grande distanza dietro di loro. I due ciclisti spesso lavorano insieme (mutua cooperazione) dividendo tra loro la fatica data dal trovarsi davanti, senza nessuno che li difenda dal vento. Se nessuno dei ciclisti fa la fatica di stare davanti, il gruppo li raggiungerà presto (mutua defezione). Una situazione frequente vede uno dei ciclisti fare tutto il duro lavoro da solo (coopera) e ciò, alla fine condurrà alla vittoria del secondo (tradisce) che ha avuto l’opportunità di sfruttare la scia apertagli dall’altro ciclista.    

Anche in atletica si verifica una situazione simile, ad esempio nelle grandi scuole di wrestling, in cui i partecipanti vogliono perdere peso così da poter competere contro avversari più leggeri. Facendo ciò, però, i partecipanti sono evidentemente non al massimo della loro forma fisica né atletica. Il paradosso è che loro finiranno per combattere comunque contro gli stessi avversari, perché anche questi avranno deciso di perdere peso (mutua defezione). Il risultato è un abbassamento del livello delle competizioni

La pubblicità è a volte citata come esempio del dilemma del prigioniero applicato alla vita reale. Quando negli Stati Uniti era legale la pubblicità delle sigarette, le case produttrici di sigarette dovevamo decidere quanto investire in pubblicità. L’efficacia della pubblicità di A era parzialmente determinata dalla pubblicità di B. Allo stesso modo, i profitti derivati a B dalla pubblicità influenzano i profitti di A. Se entrambi, A e B, decidessero di fare pubblicità durante un asso di tempo fissato, allora le pubblicità si annullerebbero reciprocamente, i ricavi rimarrebbero invariati e le spese, invece, aumenterebbero a causa dei costi sostenuti per l’attività pubblicitaria. Comunque se B scegliesse di non fare pubblicità, di conseguenza A potrebbe trarre grossi profitti dal fare pubblicità. Tuttavia, la quantità ottimale di pubblicità di una casa produttrice dipende da quanta ne fa l’altra. Poiché la strategia ottimale è vincolata alla “giocata” dell’avversario e non indipendente da questa, non esiste strategia dominante e dunque non si tratta di un dilemma del prigioniero. Spesso nelle pratiche economiche emerge un comportamento cooperativo.    

Una banale ma familiare serie di esempi del dilemma del prigioniero può essere constatata alla guida di un auto. Dalle violazioni del codice stradale alla guida imprudente, questi comportamenti avvantaggiano chi li adotta, ma peggiorano la situazione generale del traffico e la sicurezza di tutti.

William Poundstone in un suo libro sul dilemma del prigioniero, descrive un aspetto della quotidianità in Nuova Zelanda, dove i giornali si trovano in distributori lasciati aperti. Certo, sarebbe possibile che qualcuno prenda il giornale senza pagarlo (tradimento), ma succede davvero raramente, poiché riconoscono il danno derivante dal rubare il giornale (mutua tradimento). Quando il dilemma del prigioniero è simultaneo per tutti i giocatori (senza opportunità alcuna per nessun giocatore di influenzare la strategia dell’altro) questo pensiero diffuso è detto “magical thinking”     

Molti dilemmi del prigioniero reali coinvolgono molti giocatori: questo non è un problema perché, nella maggioranza dei casi, questi dilemmi del prigioniero più complessi possono essere ricondotti a giochi semplici con due giocatori.

Le immagini che illustrano questo documento sono fotogrammi del film Cube, 1977, regista il canadese Vincenzo Natali. Un film che è già diventato un “cult movie” e che è stato presentato in molte rassegne di cinema e matematica per le riflessioni che sollecita sui rapporti uomo – spazio.

La trama:

Sei persone che non si conoscono tra loro si svegliano in un ambiente misterioso, senza riuscire a capire perché si trovino lì né come ci siano arrivati. A poco a poco i sei si accorgono che la strana stanza in cui si trovano fa a sua volta parte di un cubo di dimensioni più grandi, all'interno del quale ci sono stanze cubiche una uguale all'altra. Il gruppo decide di cercare una via d'uscita, ma si scontra con una serie di trappole. La selezione arriva inesorabile, solo uno riesce a salvarsi e viene risparmiato dal terribile labirinto.

 

 

Bibliografia

 

Robert Axelrod, Giochi di reciprocità, Feltrinelli, 1985

 

Robert. S. Pindyck Daniel L. Rubinfeld, Microeconomia, cap 12-13, Zanichelli

 

Powers Richard, Il dilemma del prigioniero, Bollati Boringhieri, 1996

I “dilemmi” della vita in un romanzo che racconta la storia di una famiglia americana di provincia

 

Marek e Kaminski, Games Prisoners Play, Princeton University Press, 2004

 

Youssef Cohen, Radicals, Reformers, and Reactionaries: The Prisoner's Dilemma and the Collapse of Democracy in Latin America, University Of Chicago Press, 1994

 

Anatol Rapoport, Albert M. Chammah, Prisoner's Dilemma,  University of Michigan Press, 1965

 

Richard Dawkins, The Selfish Gene, Oxford University press, 1989

Un capitolo è dedicato alle implicazioni del Dilemma del Prigioniero nella biologia.

 

William Poundstone, Prisoner's dilemma: John von Neumann, game theory and the puzzle of the bomb, Anchor Books, 1993

 

Fostering Economic Policy Coordination in Latin America: The REDIMA Approach to Escaping the Prisoner's Dilemma
United Nations,  2005

 

Armando Massarenti, Strategie per cooperare, anzi per competere, Il Sole 24 ore, 1, 10, 2000.

http://www2.polito.it/didattica/polymath/htmlS/info/BIBLIOID/Axelrod.htm

 

Franco Carlini, L’altruismo conviene, Il Manifesto, 23/12/01

http://www.swif.uniba.it/lei/rassegna/011223c.htm

 

Un articolo di Giampietro Allasia e Umberto Cerruti

http://alpha01.dm.unito.it/personalpages/cerruti/doc-html/dilemma/dilemma.htm

 

Scoprire gli URP e la loro presentazione del Dilemma

http://www.urp.it/Sezione.jsp?idSezione=952&idSezioneRif=949

http://www.urp.it/Sezione.jsp?idSezione=949&idSezioneRif=38

 

Il Dilemma interattivo

http://www.dm.unito.it/personalpages/cerruti/Az1/dilframes.html

 

The ethical spectacle, Vol. I, No. 9 September 1995, dedicato al Prisoner’s Dilemma. Il Dilemma del Prigioniero nell’amore, nella politica, nel cinema e molto altro

http://www.spectacle.org/995/index.html

 

Prisoner’s Dilemma sulla Stanford Enciclopedia of Philosophy

http://plato.stanford.edu/entries/prisoner-dilemma/

 

Prisoner’s Dilemma in Mathworld

http://mathworld.wolfram.com/PrisonersDilemma.html

 

Prisoner’s Dilemma da giocare in classe

http://www.indiana.edu/~econed/pdffiles/summer00/Holt.pdf

 

Frattali e Dilemma del Prigioniero

http://classes.yale.edu/fractals/Panorama/SocialSciences/PrisDil/PrisDil.html

 

Prisoner’s Dilemma sulla Wikipedia

http://it.wikipedia.org/wiki/Dilemma_del_prigioniero

http://en.wikipedia.org/wiki/Prisoner%27s_dilemma

 

Il Dilemma del Prigioniero da giocare contro il computer

http://www.princeton.edu/~mdaniels/PD/PD.html

http://serendip.brynmawr.edu/playground/pd.html

 

 

Il dilemma del prigioniero

dal 21/06/2007 al 07/07/2007

al Teatro: Arsenale, via C. Correnti, 11 MILANO

Autore: Riccardo Mini

Regia: Valentina Colorni

Artisti: Maria Eugenia D'Aquino, Riccardo Maria Magherini

 

Per 'Linguaggi di Scienze' una trasposizione matematica per il dilemma del prigioniero all’interno del Progetto Teatro in Matematica.

Mettete insieme un'attrice, una regista, un drammaturgo e un matematico: il risultato di una delle equazioni possibili è un'ulteriore conferma che Arte e Scienza non viaggiano su binari separati. Il Progetto Teatro in Matematica nasce al Teatro Arsenale nel 2002 da una felice intuizione di Maria Eugenia D'Aquino che, con Valentina Colorni, Riccardo Mini e il Prof. Alberto Colorni, ha dato il via a un'originale iniziativa, unica nel suo genere: esplorare teatralmente formule e teoremi che ci hanno terrorizzato sui banchi di scuola, cercando di farli vivere come i versi di una poesia o le battute di un copione e rivelando la loro stretta relazione con la vita di tutti i giorni. In scena, la matematica perde la dimensione di scienza austera e accessibile solo a pochi iniziati. Il titolo dello spettacolo s'ispira ad una delle più famose formulazioni di questa scienza affascinante, la 'teoria dei giochi' nata dalla mente di Von Neumann e Morgenstern, e approfondita da John Forbes Nash jr, a cui è stato dedicato il film A Beautiful Mind.

NOTE:
Lo spettacolo Faust unitamente allo spettacolo Il dilemma del prigioniero, faranno parte di un progetto più ampio, in via di definizione, sull’intersezione tra Teatro e Scienza, promosso dal Teatro Arsenale e dall’Osservatorio Astronomico di Brera, che prevede incontri, workshop, iniziative speciali sulla divulgazione scientifica che verrà annunciato e divulgato all’inizio del 2007.

 

Informazioni Tel. 028375896 Sito: http://www.teatroarsenale.org