2019.12.03 (화)

  • 맑음동두천 -7.2℃
  • 맑음강릉 -1.9℃
  • 맑음서울 -4.7℃
  • 맑음대전 -2.1℃
  • 맑음대구 0.3℃
  • 맑음울산 -0.8℃
  • 흐림광주 1.9℃
  • 맑음부산 0.4℃
  • 구름많음고창 1.5℃
  • 흐림제주 8.6℃
  • 구름조금강화 -5.3℃
  • 맑음보은 -4.5℃
  • 맑음금산 -3.0℃
  • 구름많음강진군 3.4℃
  • 맑음경주시 0.3℃
  • 맑음거제 0.9℃
기상청 제공

정치

[Tit for Tat] 협력의 조건은 배반에 대한 즉각적인 응징

1차 세계대전 당시 서부 전선의 여러 곳에서, 적군끼리 공격을 자제하는 모습이 역력하였습니다. 심지어 독일군들이 영국군의 소총 사정거리 내에서 태연하게 걸어 다녔고, 영국군들은 그것을 보고도 신경을 쓰지 않을 정도였습니다.
 
치열한 전투가 벌어지는 전선에서 어떻게 적군끼리 ‘공존공영’이 가능 했을까요?



◆협력의 조건은 배반에 대한 즉각적인 응징


미국의 정치학자 로버트 액설로드는 그 이유를 상호작용의 계속성에서 찾습니다.


당시 공존이 가능했던 전선은 참호전에서 서로 오랜 기간 대치하고 있던 영토들이었습니다.  


참호전의 소부대 병력은 상당한 기간 동안 어쩔 수 없이 얼굴을 맞대고 상호작용을 해야 했습니다. 이들은 서로의 관계가 오래 지속될 것을 알고 있었습니다.


상호작용의 지속은 협력에는 협력으로, 배반에는 배반으로 갚는 신사적인 호혜주의(눈에는 눈, 이에는 이 :Tit for Tat)가 유지된다는 뜻입니다.


만약 상호작용이 곧 끝날 것 같다면 협력 대신 배반이 정답입니다. (죄수의 딜레마 게임에서 둘 다 배반하면 둘 다 1의 수익을 얻습니다.  또한 내가 배반하고 상대가 협력하면 자신은 5의 수익을, 상대는 0의 수익을 얻습니다. 때문에 나는 어떤 경우에든 배반의 의사결정을 내립니다.)


하지만 player들이 다시 만날 가능성이 높아진다면, 협력이 최적 의사결정이 됩니다. 이는 배반에 대한 즉각적인 응징이 협력을 야기해서입니다. 


앞의 참호전에서, 적대적인 두 진영 간 협력이 가능했던 이유는 최전선에서 같은 부대들이 오랜 기간 마주보고 있는 상황에서, 한쪽이 약속을 깨뜨리는 배반을 저지르면 다른 쪽이 즉각 보복을 했기 때문입니다.  


이처럼  관계가 지속적으로 상호작용하는 환경에서, 협력에는 협력으로 대응하고 배반에는 배반으로 대응하는 호혜주의가 행동의 기준이 됩니다. 그리고 이러한 호혜주의가 협력의 조건으로 자리합니다.


그런데 배반을 응징하는 대응이 어떻게 협력을 가져올 수 있을까요? 액설로드는 이렇게 설명합니다.


“만일 상대방이 주제넘게 배반했는데도 반응을 자제했다면 상대방에게 잘못된 신호를 보낼 위험이 있다. 배반에 대한 응징을 오래 내버려 두면 둘수록, 상대는 배반을 하는 게 이득이라고 결론 내릴 가능성이 높아진다. 그리고 이런 양상이 굳어질수록 나중에 깨뜨리기는 더욱 힘들어진다. 배반에 대한 응징은 빠를수록 좋다는 의미다.”(엑설로드)


팃포탯이 협력을 추동하는 장점은 고대사회의 탈리오(talio) 원칙에서도 발견됩니다. 


고대 이스라엘 사회, 중세유럽등에서는 살인자에 대해서는 반드시 사적으로 피의 보복을 하는 것을 원칙으로 하였습니다. 이유는 同害보복관습인 탈리오가 중앙 권위체가 없는 시절에 공동체가 배반의 늪에 빠지지 않고 상생의 협력을 이끌어 내는 효력을 발휘했기 때문입니다. 


이처럼 상대의 도발에 대한 즉각적 응징이 상대의 추가 도발의 오판을 억제하여 협력을 이끄는 동인이 된다는 겁니다.


게다가 배반에 대한 응징은 협력의 생태계를 조성하는데도 기여합니다.


이기주의에 휩싸여 배반만 하는 자(국가)는 누구나 꺼리는 상대가 되어 자연스레 사회적(국제적) 제재를 받아 주변의 도움을 받을 기회를 잃게 됩니다. (안성조) 결국 협력이 자신의 이익이 된다는 믿음을 가지는 자들만이 생존하게 되어, 생태계에는  상호적 이타성이 창발되게 됩니다.



◆ 배반의 생태계에서 플레이어의 수익을 가져오는 최고의 전략은 팃포탯


배반에 배반으로 대응하는 팃포탯이 주목되는 또 다른 이유는 이 전략이 플레이어에게 최적의 수익을 가져온다는 점입니다. 실증적으로 팃포탯은 반복적 죄수의 딜레마 게임에서 최적의 전략으로 꼽히고 있습니다.


액설로드는 죄수의 딜레마 게임에서 가장 효과적인 전략이 무엇인지, 즉 게임 참여자가 가장 큰 보상을 얻을 수 있는 전략이 무엇인지를 알아내기 위해 죄수의 딜레마 컴퓨터 게임을 두 차례 실시하였습니다.


1차대회에서 총14개의 전략적 프로그램이 심리학, 경제학, 수학, 사회학 다섯 분야에서 출품되었는데, 이 대회의 우승자는 팃포탯 (Tit For Tat)이었습니다.


앞에서 언급되었듯이 팃포탯의 전략은  맨 처음에는 일단 협력으로 시작하고 그 다음부터는 상대의 선택을 따라 합니다. 상대가 협력하면 자신도 협력하고, 상대가 배반하면 자신도 배반한다는 것입니다.


달리말해 상대의 배반에 즉각적이고 일관되게 보복하여, 배반을 절대 눈감아 주지 않습니다. 


2차대회에서도 팃포탯이 다시 승리하였습니다. 1차대회에 참가했던 게임이론가들을 비롯해 6개 국가에서 총 62개의 프로그램이 참가했는데, 팃포탯은 배반에 곧바로 배반하는 규칙을 충실히 따라, 배반을 보류하여 상대에게 이용당하는 약점을 사전에 차단하였습니다.


결국 배반의 생태계에서 플레이어의 수익을 가져오는 최고의 전략은  호혜주의, 즉 협력이든 배반이든 그대로 되갚는 것입니다.



◆팃포탯의 목표는 공존공영


일본정부가 8월2일 한국을 수출심사 우대 대상인 화이트리스트에서 제외하는 개정안을 처리할 가능성이 높다는 전망이 나오는 가운데,  일본의 이 같은 추가 보복에 어떻게 대응해야 하는지, 협력을 이끄는 전략은 무엇이 되어야 하는지에 대한 해답을 액설로드의 실험은  제시합니다.


죄수의 딜레마 상황에서 협력을 유도하는 전략은 상대방의 배반을 반드시 응징하는 것입니다.


이에 비추어, 일본이 자유무역의 원칙을 거스르고 한국을 다시 배반하게 된다면, 한국의 전략은 그 배반을 되갚는 것입니다.


때문에 화이트리스트 제외가 결정된다면, 일본의 배반에 대한 정부와 민간의 실질적이고 거친 응징이 기대됩니다. 


 그런데 팃포탯 전략을 수행하는데 있어 주의할 점은 이 전략의 목표를 명확히 이해하는 것입니다.


팃포탯은 일본을 패배시키는데 목표를 두고 있지 않습니다. 축구나 체스는 한쪽만 이기고 한쪽은 지는 제로섬게임인 반면, 팃포탯은 궁극적으로 양쪽 모두에게 이득이 되도록 전략을 설정하는 것입니다.
 
즉 일본에게서 협력을 이끌어내어 共存共榮을 이루겠다는 것이 팃포탯의 목표가 됩니다.


결국 한국과 일본 간의 일련의 대응과 맞대응은 비제로섬 게임이며, 그 전략으로 꼽히는 팃포탯은 배타적 경쟁이 아닌 相互協力을 유도하고자 하는 전략임을 명백히 할 필요가 있다는 지적이 나오고 있습니다.


<참고문헌>

로버트 액셀로드, 이경식옮김,『협력의 진화 』

안성조, "팃포탯과 탈리오"