본문 바로가기

환경, 기술

죄수의 딜레마

죄수의 딜레마

 

 

죄수의 딜레마(prisoner's dilemma, PD)란 게임 이론의 유명한 사례로, 2명이 참가하는 비제로섬 게임 (non zero-sum game)의 일종이다. 이 게임은 용의자의 딜레마 또는 수인의 번민(囚人煩悶)이라고도 부른다.

협력할 경우 서로에게 가장 이익이 되는 상황일 때 개인적인 욕심으로 서로에게 불리한 상황을 선택하는 문제를 보여주고 있지만 이후 이러한 딜레마의 '반복되는 죄수의 딜레마'로 지속적으로 일어날 경우 긍정적인 협동이 가장 최선의 선택지가 된다는 시회행동의 전략적 진화를 보여준다.

 

(게임 이론: 게임 이론(game theory)상호 의존적인 의사 결정에 관한 이론이다. 개인 또는 기업이 어떠한 행위를 했을 때, 그 결과가 게임에서와 같이 자신뿐만 아니라 다른 참가자의 행동에 의해서도 결정되는 상황에서, 자신의 최대 이익에 부합하는 행동을 추구한다는 수학적 이론이다. 게임 이론은 사회 과학, 특히 경제학에서 활용되는 응용 수학의 한 분야이며, 생물학, 정치학, 컴퓨터 공학, 철학에서도 많이 사용된다. 게임이론은 참가자들이 상호작용하면서 변화해 가는 상황을 이해하는 데 도움을 주고, 그 상호작용이 어떻게 전개될 것인지, 매 순간 어떻게 행동하는 것이 더 이득이 되는지를 수학적으로 분석해 준다.

게임이론에서 넌 제로섬 게임(Non Zero-sum game)은 비()제로섬 게임으로도 불린다. 최근에는 윈윈전략으로 이해되기도 한다. 가정되는 상황하에서 상호 의존적 관계를 유지하는한 사람들은 어느한쪽이 보다 큰 이득을 얻게 되더라도 다른 쪽도 역시 여전히 이득을 볼수있는 경우나 또는 어느한쪽이 이득을 얻게 되더라도 다른 쪽은 큰 손해를 입게되지 않는 경우를 말한다. 이러한 넌제로섬 게임은 서로의 이익이 보장되는 경우 상대방이 선택을 바꾸지 않는한 자신의 선택을 바꾸지 않는 내쉬 균형(Nash equilibrium)이 유지된다고 볼 수 있다.)

 

 


예를 들어보자면 다음의 상황이 주어졌다고 가정해보자. 두 명의 용의자가 체포되어 서로 다른 취조실에서 격리되어 심문을 받고 있다. 이들은 자백여부에 따라 다음의 선택이 가능하다.

구 분

죄수 A

침묵

자백

죄수 B

침묵

모두 6개월 복역

A 석방, B 10년 복역

자백

A 10년 복역, B 석방

모두 5년 복역

- 둘 중 하나가 배신하여 죄를 자백하면 자백한 사람은 석방되고 나머지 한 명이 10년을 복역해야 한다.

- 둘 모두 서로를 배신하여 죄를 자백하면 둘 모두 5년을 복역한다.

- 둘 모두 죄를 자백하지 않으면 둘 모두 6개월을 복역한다.

 

죄수A의 선택

- 죄수B가 침묵할 것으로 생각되는 경우 자백을 하는 것이 유리하다.

- 죄수B가 자백할 것으로 생각되는 경우 자백이 유리하다.

- 따라서 죄수A는 죄수B가 어떤 선택을 하든지 자백을 선택해야 한다.

죄수B의 선택

- 죄수A와 동일한 상황이므로, 마찬가지로 죄수A가 어떤 선택을 하든지 자백이 유리하다.

 

이 게임의 죄수는 상대방의 결과는 고려하지 않고 자신의 이익만을 최대화한다는 가정 하에 움직이게 된다. 이때 언제나 침묵보다는 자백(배신)을 통해 더 많은 이익을 얻으므로 모든 참가자가 자백을 택하는 상태가 내쉬 균형이 된다. 참가자 입장에서는 상대방의 선택에 상관없이 자백을 하는 쪽이 언제나 이익이므로 합리적인 참가자라면 자백을 택한다. 결국 결과는 둘 모두 5년을 복역하는 것이고, 이는 둘 모두가 자백하지 않고 6개월을 복역하는 것보다 나쁜 결과가 된다.

 

 

자유주의 시장 경제 VS 죄수의 딜레마 게임

'죄수의 딜레마 게임'은 정부의 존재 이유를 정당화하는 이론적 근거의 하나로 사용되기도 하지만 한편으로는 '협동'이라는 사회적 진화가능성을 설명할수있는 이론으로 제시되기도 한다. 아담 스미스 등의 자유주의 시장 경제 이론에 따르면, 각 행위자들이 자신의 이익을 극대화하기 위해 행동하는 경우 비록 정부의 역할이 없더라도 시장이라는 보이지 않는 손에 의해 균형이 달성되어 사회적으로 가장 바람직한 결과가 나오게 된다. 하지만 죄수의 딜레마 게임에 따르면, 각 행위자들이 자신의 이익을 극대화하기 위해 행동하는 경우 모든 사람들에게 최악의 결과가 생긴다. 이러한 결과는 게임 참여자 중 어느 누구도 원하지 않았던 결과이며, 행위자들끼리 자발적인 의사소통과 약속 등의 방법을 통해서는 결코 해결할 수 없다. 결국 정부 또는 국가라는 외부의 행위자가 개입하여 법률, 제도, 세금 등의 방법으로 각 행위자의 행동을 강제해야만 사회적으로 바람직한 결과가 도출될 수 있다는 이론이다.

 

 

반복되는 죄수의 딜레마

'반복되는 죄수의 딜레마'(Iterated Prisoner's Dilemma)는 아주 단순한 메커니즘을 갖는 팃포탯 전략의 실험을 통해서 죄수의 딜레마가 지속적으로 반복되는 경우 최적의 선택은 결국 협동이라는 양상의 사회행동임을 연구발표한 바 있다.


 

국제정치학에서의 응용

신자유주의, 특히 신자유제도주의론자들은 이 죄수의 딜레마를 이용해 여러 경우의 국제 관계에서 나타나는 문제들을 이론적으로 정형화시키려 노력해왔다. 특히 이 죄수의 딜레마를 이용한 해석은, 특히 비합리적으로 보이는 문제들이 어째서 합리적으로 설명될 수 있느냐에 초점을 맞춰왔다. 예를 들어, 왜 개별 국가들이 세계적인 환경을 해치고, 자원을 남획하며, 분쟁 지역에 무기를 판매하는가에 대한 설명의 준거로 활용되어 왔다. 상위 정부가 없는 개별국가간의 국제체제에서 상대 국가의 전략이 항상 협동적으로 나올 것으로 기대할 수 없기 때문에, 개별국가들은 각자 자신의 이익을 추구하게 된다. 신자유 제도주의자들은 이 결과 국가들은 협동의 필요성을 절감하게 되고, 협동에 대한 확신을 얻을 수 있게 하기 위해, 개별국가에 우선하는 국제 레짐의 등장을 필요로 하게 될 것이라 전망하고 있다.