본문 바로가기

독서/사회

<협력의 진화> 로버트 액설로드 Robert Axelrod / 이기적 개인의 팃포탯 전략

 

서부전선의 참호전

참호전이 처음 발생한 것이 언제인지 정확하게 모르지만, 전쟁의 역사에서 참호전이 가장 주목을 받았던 때는 1차 세계대전 당시 서부전선에서였던 것 같다. 참호전은 전쟁을 최악의 지지부진한 상황으로 몰고 갔고, 참호 속의 군인들 역시 큰 고통을 받았다. 참호는 방어를 위해서 땅을 파서 구축해 놓은 진지이다. 방어에는 굉장히 수월하지만 당시에는 마땅히 공격할만한 수단이 없었기 때문에 양군이 모두 참호를 파고 버티기 시작하면 전쟁은 끝도 없이 늘어지게 마련이었다. 군인들은 비가 오면 빠질 곳이 없는 물이 허리까지 차오른 참호 속에서 버텨야 했다. 겨울에는 얼음과 눈에 노출되어 생지옥을 경험해야 했다. 최악의 고통, 끝없을 것 같은 대치, 상대방을 죽이지 않으면 내가 죽는 극한의 전쟁상황에서도 협력이 발생했다.

 

후방에 있는 지휘관은 계속해서 진격을 요구하고 공격할 것을 명령한다. 참호 밖을 나서는 순간, 적으로부터 총알이 쏟아진다. 참호밖으로 나갈 수는 없다. 포를 이용해서 공격을 해야 한다. 양쪽이 모두 같은 상황이다. 하지만 대치의 양상은 예상과 달랐다. 적군이 심각하게 피해를 당할 곳에는 포를 쏘지 않는다. 게다가 항상 같은 곳을 향해 포를 쏜다. 포를 쏘는 시각이 일정해서 상대방이 포를 쏘면 시계를 맞춰도 될 정도로 일정하게 공격을 한다. 심지어는 상대방이 포를 쏘면 약간 떨어진 곳에서 구경하기까지 한다. 간혹 상대방이 피해를 주면 몇 배로 되갚는다. 대치하는 상황이지만 암묵적으로 합의를 한 것이나 마찬가지이고, 서로 상대방에게 큰 피해를 주지 않기 위해서 노력한다. 참호전에서 살아남기 위한 방법이었다. 어째서 이런 상황이 발생했을까?

1차 세계대전 당시 참호의 모습. 참호는 방어를 위해서 땅을 파고 만들어 놓은 진지이다. 참호를 파 놓으면 수비는 용이하지만 당시의 무기체계로서는 공격하는 것이 어려웠기 때문에 대치상황이 발생할 수밖에 없었다.

이기적인 개인의 선택, 죄수의 딜레마

죄수의 딜레마는 게임 이론에서 어렵지 않게 이해할 수 있는 가장 유명한 딜레마이다. 죄수의 딜레마에 따르면 이기적인 게임참가자는 항상 상대방을 배신하는 것이 유리하다. 둘다 협력을 했을 경우에 양쪽에 더 유리한 결과를 얻을 수 있지만 고전경제학에서 규정했듯이 인간의 이기심은 그런 결과를 허락하지 않는다. 이래서는 협력이 발생할 수 있는 여지가 없다. 배신이 최선의 전략이기 때문이다. 하지만 실제사회에서는 협력이 이루어진다. 이 책은 이기적인 개인들이 모여 있는 사회에서 어떻게 협력이 발생하는지 규명하고 있다.

죄수의 딜레마. 어떤 경우에도 상대를 배신하는 것이 나에게는 유리하다. 따라서 양쪽이 모두 상대를 배신하는 선택을 하게 된다. 하지만 이 결과는 양쪽이 모두 상대에게 협력하는 것보다 항상 좋지 않은 결과를 얻게 되는데, 그것을 알고 있어도 협력을 선택할 수는 없다. 상대방의 배신에 의한 피해가 크기 때문이다. 여기서 딜레마가 발생한다.

최적의 전략을 찾기 위한 대회

죄수의 딜레마는 일회성 게임에서 일어나는 딜레마를 다루고 있은데, 저자인 로버트 액설로드는 연속된 죄수의 딜레마 게임에서 최선의 전략이 무엇인지 확인하고 싶었다. 저명한 심리학자, 경제학자, 수학자, 정치학자들을 초대하여 게임의 룰을 설명하고 참가를 요청했다. 게임참가자의 전략은 프로그래밍의 형태로 제출하며, 리그전의 방식으로 모든 참가자와 1대1로 겨룬다.

점수 획득규칙
1. 내가 협력하고 상대방도 협력하면 3점을 얻는다. 상호협력에 대한 보상 R : Reward for mutual cooperation
2. 내가 배반하고 상대방이 협력하면 5점을 얻는다. 배반의 유혹 T: Temptation to defeat
3. 내가 협력하고 상대방이 배반하면 점수를 얻지 못한다. 머저리의 빈손 S : Sucker's payoff
4. 내가 배반하고 상대방도 배반하면 1점을 얻는다. 상호배반에 대한 처벌 P : Punishment for mutual defection
이 게임을 계속해서 진행하는 것이다.

1차 대회에는 14명이 참가했고, 각 참가자들마다 200회의 게임을 반복했다. 1차 대회의 결과를 알린 후 펼쳐진 2차 대회에는 63명이 참가했다. 각 참가자는 상대방의 협력과 배반에 대해서 어떻게 대응하면 최선의 결과를 얻어낼 수 있을지 연구를 해서 최선의 전략을 제출했다.

로버트 액설로드 Robert Axelrod (1943 ~ ) 미시간 대학교 정치학과 교수. 게임이론, 인공지능, 진화생물학, 수학적 모델링, 복잡성 이론의 세계적 권위자

용서하지 않는 신사 : 팃포탯 전략 Tit for Tat

1차 대회의 승자는 팃포탯이었다. 팃포탯은 정말 간단한 전략이다. 첫번째 게임에서는 반드시 상대방에게 협력한다. 다음 게임부터는 상대방이 협력하면 협력하고, 상대방이 배반하면 배반한다. 끝. 1차 대회가 끝나고 그 결과가 알려지자 많은 전문가들이 흥미를 느꼈던 것 같다. 액설로드 교수가 모집한 2차 대회에는 4배가 넘는 63명이 참가했다. 모든 참가자에게 1차 대회의 모든 진행상황과 결과를 통보했고, 2차 대회 참가자들은 1차대회를 면밀히 검토해서 자신의 전략을 짜냈다. 그 결과, 우승자는 또다시 팃포탯이었다. 팃포탯은 너무나 간단한 전략이기 때문에 분석하기 쉬웠고, 약점을 찾기도 쉬웠다. 하지만 또다시 승리했다.

 

팃포탯은 신사적이다. 상대방이 이전 게임에서 협력을 하면 반드시 다음 게임에서 협력으로 보답을 한다. 반면에 용서를 모른다. 상대방이 이전 게임에서 배반을 하면 반드시 다음 게임에서 배반을 해서 복수를 한다. '눈에는 눈, 이에는 이'라는 원칙을 노골적으로 드러내는 전략이다. 이 전략은 1:1로 싸울 때는 절대로 상대방보다 좋은 점수를 얻을 수 없다. 가장 좋은 결과는 상대방과 같은 점수를 받는 것이다. 하지만 이런 다양한 전략이 난무할 때는 게임에서는 얘기가 다르다. 종합적으로 봤을 때는 가장 좋은 점수를 받을 수 있는 유력한 전략이다. 저자는 두 번의 대회의 결과를 받아 들고 협력이 발생하는 원리를 설명해 나간다.

팃포탯은 연속적인 죄수의 딜레마 게임에서 상대방이 나에게 협력하면 다음 게임에서 나도 협력을 하고, 상대방이 나를 배반하면 다음 게임에서 나도 배반을 하는 단순한 전략이다.

팃포탯 VS 올디 all D

로버트 액설로드는 2회의 대회 결과를 손에 쥐고 여러가지 전략을 시뮬레이션해서 논리를 발전시켜 나간다. 점수가 높은 전략은 다른 전략이 따라 해서 점점 그 비중이 높아진다. 점수가 낮은 전략은 탈락해서 게임에서 탈락한다. 결국 게임은 유력한 단일전략이 지배하게 되고 다른 전략이 침범하지 못해서 안정적인 단계에 접어들게 된다. 이 때 가장 안정적인 전략이 팃포탯과 무조건 배신을 하는 올디 전략이다. 책에서 저자는 팃포탯 전략이 올디 전략보다 우월하다는 것을 밝힘으로써 이기적인 개인이 모여 있는 사회에서 모두가 자신의 이익만을 생각하는 사회에서 결국 협력이 발생할 수밖에 없는 이유를 설명한다.

 

이것을 사회에 맞도록 풀어 설명하면, 이기적인 사람들은 결국 자신의 이익만을 위해서 행동을 하게 된다. 하지만 오로지 자신의 이익만을 위해서 다른 사람의 이익에 반하는 선택만을 하게 되면 다른 사람과 협력하는 것보다 이익이 줄어 들게 된다. 따라서 다른 사람과 협력을 할 수밖에 없게 된다. 전략을 바꾸는 것이다. 단, 다른 사람이 나를 배반할 때는 가차없이 그에 상응하는 복수를 해 줘야 한다. 그렇지 않으면 다른 사람에게 이용만 당하는 얼간이가 되어 버리기 때문이다.

경제학에서 사회학으로.. 생물학까지..

게임 이론은 경제학에서 발생한 이론이다. 죄수의 딜레마는 유명한 존 내쉬가 내쉬균형을 통해 노벨경제학상을 받은 것으로도 유명한 이론이다. 로버트 액설로드는 죄수의 딜레마에서 가장 유력한 전략이 팃포탯이라는 것을 밝힌 후에 이기적인 개인이 판치는 사회에서 어떻게 협력이 발생할 수 있는지를 밝혀 낸다. 그 후 이 이론을 토대로 사회학 뿐만 아니라 자의식이 없을 것이라고 생각하는 생물의 진화 과정까지 설명을 한다. 책의 마지막에서는 게임에 참가한 개인으로서 게임에 참가하는 전략이 어떠해야 하는지 설명하고, 집단을 리드하는 리더가 게임의 룰을 어떻게 조정해야 하는지까지 설명하고 있다.

게임을 통해 인간의 전략을 설명하던 로버트 액설로드는 박테리아까지 그 영역을 넓혀서 협력이 발생하는 원리를 밝히고 있다.

우리 사회의 모습은?

책을 읽은 후에 우리 사회는 게임의 법칙이 제대로 통하는 사회인지 한 번 생각해 보지 않을 수 없었다. 팃포탯 전략은 협력에 대해서는 협력으로 보답하고, 배반에 대해서는 배반으로 응징하라고 가르치고 있다. 하지만 현대사회는 사적 복수가 허용되지 않는다. 사적 복수가 허용되는 순간 끝없는 복수만이 반복되는 올디 사회가 될 가능성이 너무 크기 때문이다. 내가 받은 배반을 내가 복수할 수 없다면 다른 누군가가 대신 복수를 해 줘야 한다. 공적으로 폭력을 사용할 수 있는 권력은 국가밖에 없다. 과연 우리 사회는 다른 사람을 배반한 사람에게 복수를 제대로 해 주고 있나? 현대 사회에서 배반은 법을 어기는 것을 말하고, 복수 및 응징은 법에 의한 처벌을 받는 것을 말한다.

 

힘이 약한 개인은 법을 어기면 당연하게 처벌을 받는다. 소시민은 법을 굉장히 무서워하고 경찰서에 들어가는 것도 편치 않다. 하지만 재벌이나 권력자같은 기득권자들은 숱한 사람을 배반하고 살아도 응징을 제대로 받지 않는다. 배반에 대한 응징을 제대로 받지 않고 있다. 팃포탯 전략은 우리에게 배반을 한 대상에게는 즉시 단호하게 응징을 가해야 한다고 설명하고 있다. 그래야만 호혜주의에 의한 안정된 사회가 지속된다고 한다. 우리 사회가 정말 그런 사회일까? 난 그다지 확신이 들지는 않는다.

과연 우리 사회는 게임의 룰이 지켜지고 있는 사회일까?

 

★★★★★

분량이 많은 책은 아니다. 부록 빼고 서문 빼고 나면 약 200페이지가 조금 넘는 분량이다. 이해하기 어려운 책도 아니다. (생물학을 다룬 5장은 바로 이해가 되지는 않았다.) 약간 어려울 것 같은 편견을 깨고 책을 읽으면 굉장히 흥미진진하게 읽을 수 있다. 책을 제대로 이해하고 다른 사회, 경제 관련 책들과 함께 읽으면 사회를 이해하는데 정말 큰 도움이 될 것 같다.

 

강하게 추천한다.