28 de março de 2006

Dilema do Prisioneiro

Numa tarde em que comecei com o Nietzsche, passei para o Adam Smith e acabei no John Nash descobri um problema muito interessante, chamado O Dilema do Prisioneiro.

Este problema exemplifica o Equilibrio de Nash, que, talvez, explicarei noutro post.

O Dilema do Prisioneiro consiste no seguinte:

Duas pessoas, A e B, são capturadas pela policia. Não interessa a culpabilidade deles. A policia interroga cada um deles em salas separadas, ou seja, A e B não têm contacto um com o outro.

A policia oferece o mesmo acordo a ambos:
  • Se o prisioneiro acusar o outro e este ficar calado, então o traidor vai em liberdade e o silencioso leva 10 anos.
  • Se ambos ficarem silencioso, então levam ambos 6 meses.
  • Se ambos acusam o outro, então levam ambos 2 anos
A tabela seguinte exemplifica melhor:



















Prisioneiro B fica silenciosoPrisioneiro B acusa
Prisioneiro A fica silenciosoAmbos levam 6 mesesPrisioneiro A leva 10 anos; Prisioneiro B é libertado
Prisioneiro A acusaPrisioneiro B leva 10 anos; Prisioneiro A é libertadoAmbos levam 2 anos

O problema é que um prisioneiro não sabe o que o outro fez, podendo tar a obter uma pena consoante a decisão do outro priosioneiro. E agora?

Usando o prisioneiro A como exemplo.

O prisioneiro A pode pensar que o B fez o acordo que melhor lhe favorece, que é denuncia-lo, e então a melhor situação é denuncia-lo também levando 2 anos.

Mas por outro lado se o prisioneiro B ficou silencioso, então se A o acusar leva a pena máxima, e se cooperar com B levam ambos a pena minima.

Com estas opções, a melhor opção para ambos é ficarem calados. Jogaram em equipa.

Vendo esta situação como um jogo, a situação win-win é ficarem ambos silenciosos. Claro que se pode afirmar que é possivel sair livre, mas é necessário arriscar. Se correr mal somos castigados com a pena máxima.

Uma variação deste dilema, é efectua-lo com várias iterações. Cada prisioneiro então podia ponderar a sua decisão consoante a decisão da iteração anterior. (Isto parece-me uma fonte com memória :D). Claramente que passado algumas iterações, a melhor solução será ambos os prisioneiros ficarem silenciosos.

3 comentários:

Anónimo disse...

Essa das iterações veio do processo RUP, não? hehe. Mas sim, isso é mesmo uma fonte com memória. :>

Quanto a vocês não sei, mas eu acusava! A diferença de 6 meses para 10 anos é muito maior que a diferença de 0 para 2 anos. (Pensando no prisioneiro A, façam o módulo da diferença entre as duas colunas de cada linha)

Static disse...

Pah dependendo se os prisioneiros se conheciam bem ou não

Conhecem-se bem : Usando a bse de confiança que os tem mantido unidos ambos se calam sabendo que se um acusar 10 anos mais tarde o outro voltaria (para o matar sclr) acabando por se calarem os 2 e levarem 6 meses. Não dizer nada seria a opção que eu tomava

Conhecem-se mal : Foram apanhados pelo acaso perto um do outro. Não sabendo o que o outro responde seria preferivel arriscar tentando sair em liberdade ou apanhar 2 anos dependendo da decisão do outro. Acusar para mim seria a opção que eu tomava

Anónimo disse...

eu axo bastante interessante estes comentários anteriores isto é até parece ke são verdadeiros casinistas(pessoas ke amam o risco e ke correm riscos desnecessarios),no entanto, não são são pessoas adversas ao risco ou seja kerem ter o resultado menor (claro que estando a contar que o agente a kem estão lutar é parvo) que é 0 (melhor payoff) anos mas claro ke o outro poderá falar e aí terão 2 anos(pior payoff) pois n querem correr o risco do outro poder falar. CLaro se fosse uma pessoa indiferente ao risco (e se acreditasse ke outro tlvz n falasse e fossem ambos agentes racionais)a melhor resposta seria TAREM CALADOS porque só apanhariam 6 meses cada tendo em conta ke é o melhor payoff ( pois o outro é 2 que é muito pior) e claro é melhor estrátegia (cm melhor payoff) tendo em conta estratégia do adversário(defenição de equilíbrio de nash) no entanto a resposta mais possível de acontecer é os dois falarem cm foi comprovado pelos post em cima, e em varios casos de Polícia, e tb eu tlvz o escolhesse essa estratégia, apesar de ser uma decisão irracional. Com isto concluo ke a Nós SOciedades Somos uma Cambada de Idiotas.

Share