1. 모델과 현실
게임 이론의 현실 적용에 관한 논의를 보다 더 일반적으로 하자면 모델에 대한 기본적인 이해가 먼저 얘기되어야 한다. 모델은 주지하다시피 현실이 아니다. 인과관계를 분석하는 사회과학의 대부분의 연구가 현실을 이해하고, 설명하고, 예측하는 데 그 목적을 두고 있음은 자명하지만, 이론적 연구든 경험적 연구든, 연구는 현실 그 자체와는 다름을 일단 인정해야 한다. 따라서 필자는 "현실" 그 자체와 "재구성된 현실 (Reconstructed Reality)"을 구분해야 한다는 입장을 견지한다. 예를 들어서, 북한 경제의 저성장을 어떤 연구자가 분석한다면 그 가능성에 영향을 미치는 무수히도 많은 요소(국내 정치, 국제정치구조, 남한의 제반 상황, 미국의 제반 상황, 북한의 경제적 상황, 군비, 북한 지도자의 전쟁수행 의지, 날씨, 지도자의 인격, 북한 주민의 관습, 사상, 기타 등등)를 모두 포함하여 어떤 연구결과를 내어놓지는 못하는 것이다. 따라서 그 연구자는 자신이 판단하건대 북한 경제의 저성장에 가장 중요한 영향을 미치는 몇 가지를 중점적으로 분석하는 것이다. 이것은 정치학의 여러 다양한 방법론을 막론하고 일반적으로 나타나는 현상으로서, 역사적 연구, 통계학적 연구, 순수 이론적 연구, 실증 이론적 연구, 정치 사상적 연구 등에 공히 드러나고 있다.
따라서 사회과학적 연구는 연구대상이 되는 "현실"에서 중요하다고 간주되는 요소들을 추출, 재구성하여 그 "현실"을 이해하고자 하는 것이지, 인과관계가 개입된 "현실" 그 자체를 그대로 기술하는 것이 아니고, 기술할 수도 없는 것이다. 그렇다면 사회과학에서는 "모형화 (modeling)"가 피할 수 없는 양상으로 나타난다고 볼 수 있다. 이 양상은 심지어는 사회과학과 인문학이 혼합된 역사 기술적인 방법을 채택하고 있는 연구에도 나타나고 있는 것이다. 즉, 토인비가 설명한 일차 세계대전과 테일러가 설명한 일차 세계대전은 "현실"은 하나이지만, "재구성된 현실"은 당연히 동일한 것이 될 수 없는 것이다.
2. 게임이론과 모형화
게임이론은 "모형화"가 가장 심하게 나타나는 사회과학적 연구방법이라고 흔히 평가된다. 많은 "전통주의자들(역사적historical, 기술적descriptive 연구방법을 채택하고 있는 학자들)"이 게임이론 혹은 "합리적 선택이론 (Rational Choice Theory: 게임 이론, 사회적 선택 이론, 그리고 공간모형 이론 --- 이 세 분과의 차이에 대해서는 이 문단 뒤의 설명을 참조)"이 현실을 "과도하게 단순화시킨다(too much simplification)"는 비판을 흔히 하는 것을 보면 금방 알 수 있다. 그런데 "과도한 단순화"를 결정하는 잣대는 단순화시켰다는 그 사실 하나로 판가름할 수는 없고 그 단순화가 연구 목적에 부합하는지, 또 적절하게 해당되는 현실을 이해하고 설명하는데 도움을 주는지 등을 감안하여 결정하는 것이 되어야지 A라는 연구가 B라는 연구보다 더 현실을 단순화시켰다고 해서 "과도한 단순화"라고 부를 수는 없다. 왜냐하면 단순화시키지 않는 사회과학적 연구는 없기 때문이고, "과도하다"고 지칭하려면 그 단순화가 연구 목적에 맞지 않다든지 연구의 적실성이 단순화 그 자체 때문에 낮아졌다든지 등의 객관적인 사유가 있어야 하기 때문이다.
[투표자의 선호도를 감안하여 투표행위를 분석하는 것은 "게임이론"으로 분류하지 않는다. 정치적 선택에 관한 분석 방법론 중에 "합리적 선택 이론 (Rational Choice Theory 혹은 Analysis)"이라는 것이 있는데, 크게 세 분과가 있다. 그 중 하나가 게임이론이고, 그 다음이 공공선택 혹은 사회적 선택 이론 (Public Choice; Social Choice)이며 나머지 하나가 공간모형론 (Spatial Modeling)이다.
게임이론은 행위자간의 "전략적 상호작용"을 주로 다루는데, 주로 상대방 행위자가 분명히 드러나는 상황을 분석한다. 남북간 협상이 한 예가 될 수 있다. 그런데 투표행위는 개인의 선호도에 입각해서 전체 사회의 선택(예를 들어서 대통령 뽑기)을 이끌어내는 과정의 일부이므로 상대방 행위자가 직접적으로 드러난 전략적 상호작용의 상황이라고는 볼 수 없다. "개인들의 선호와 선택이 모여서 어떻게 한 사회(국가, 집단, 가족 등)의 선택으로 결정되는가"라는 문제를 분석하는 것은 공공선택론 혹은 사회적 선택론에서 주로 하는 것이다. 물론 게임과 사회적 선택이 같이 연관된 정치적 선택도 있다.
공간모형론은 이슈 영역(일반적으로 표현한다면 n 차원)에서 행위자들이 어떤 위치(position)를 잡는가 혹은 잡을 것인가를 주로 분석한다. 대표적인 예가 Duncan Black의 "중간 투표자 정리 (Median Voter Theorem)"인데, 이 정리에 따르면 두 정당이 하나의 이슈 영역에서 어떤 위치를 잡아야 보다 많은 표를 얻을 것인가에 대한 답으로 "중간 투표자의 위치"를 주어진 조건하에서 (이슈 영역 하나, 정당 둘, 투표자의 선호도는 single-peaked) 제시한다. 이 정리를 이용하여 양당제 하에서 정당의 정책이 "중간으로 모이는" 현상을 설명하기도 한다. 즉, 미국의 공화당과 민주당의 정강, 정책이 구체적 사안에서는 입장 차이를 보이지만 큰 틀로서는 별 차이가 없는 보수정당인데, 이 현상의 대표적인 이유가 정당들이 보다 많은 표를 긁어모으려고 "중간 위치"를 잡는 "합리적 계산"의 결과라는 것이다.]
과학으로서 사회과학을 평가하자면, 궁극적으로는 일반화된 지식을 축적하는 것이 그 목적이므로 연구 과제의 필수적이고 중요한 요소들을 보다 더 단순한 모델에 넣어서 분석할 수 있다면 경제적이고 명확해서 오히려 더 좋다고 주장할 수도 있다. 따라서 단순화된 모델이 과도한지 적절한지는 "단순화의 정도"만 기준으로 해서 평가할 수는 없고 그 "단순화"가 무엇을 보여주는지를 참조하여 평가해주는 것이 옳다.
게임이론이 주로 분석하는 행위자들 사이의 "전략적 상호작용 (strategic interaction)"은 매우 다양하게 나타난다. 따라서 "죄수의 딜레마 게임"을 현실을 이해하거나 설명하는데 유용한가를 검토하려면 그 게임이 상정하고 있는 전략적 상호작용이 현실에 존재할 수 있는지를 따져보아야 한다. 이 때 "죄수의 딜레마 게임"과 "현실"을 일대 일로 대응시켜서 평가할 수는 없고 "재구성된 현실"로서 그 적실성이 있는지에 초점을 맞추어야 함은 당연하다. 즉, "현실"의 어떤 복잡다단한 전략적 상호작용을 구성하고 있는 필수적인 요소들이 그 모델에 제대로 구현되고 있는지를 따져보는 것이 객관적인 평가방법이지 "현실" 자체를 그대로 잘 기술했는지를 꼼꼼히 확인하는 것은 올바른 방법이 아니다. 일대 일 대응 방식으로 모델을 평가하면 모든 모델이 현실과는 다르다는 판정을 받게 되고 "용도폐기"되는 운명에 처할 수밖에 없을 것이다. 따라서 특정 모델의 적실성은 다른 모델과 비교하여 상대적으로 그 모델이 이끌어내는 일반화된 지식이 얼마나 대상 현실을 더 잘 이해하고 설명하느냐를 기준으로 평가를 해주는 것이 좋다.
[그런데, 정치학의 각 방법론이 제시하는 모델들은 고유의 특성을 가지고 있으므로 상호 비교하기가 매우 힘든 경우가 있다. 예를 들어서, 전쟁을 연구한다고 할 때 역사 기술적인 방법을 동원하는 학자들은 문서나 여타 기록들을 참조하여 모델을 설정하며, 통계학적 방법론에서는 데이터(hard data)가 주로 동원되며, 예의 합리적 선택이론에서는 연역적인 인과관계를 내포하고 있는 형식 모형(formal model)을 주로 원용한다. 물론 총체적으로 어떤 방법론이나 패러다임이 더 유용한 연구결과를 생산해내느냐는 척도에 따라서 "일세를 풍미하는" 방법론이 나오기도 하지만 (자연과학에서는 그런 방법론이 존재했던 것으로 간주됨), 인간의 행위와 상호관계를 분석하는 사회과학에서는 그런 방법론이 잘 형성되지 않는 특징이 있다. 따라서 어떤 방법론을 채택하느냐는 것은 연구자의 성향이나 기호에 의해서 좌우되며 특정 연구결과를 평가할 때는 같은 방법론을 사용하고 있는 다른 연구와 비교하여 평가해주는 것이 가장 객관적이다. 그렇다고 해서 방법론 사이의 비교가 전혀 생기지 않는 것은 아니고, 같은 "현실"을 다른 두 방법론의 입장에서 연구한 결과가 있다면 일정한 평가기준(예를 들어서 논리적 일관성, 일반화의 정도, 유용한 가설의 수, 경험적 검증 등등)을 세워서, 그 기준에 의하여 상호 비교할 수는 있을 것이다.]
3. 재구성된 현실로서의 "죄수의 딜레마 게임"
"죄수의 딜레마 게임"이 현실을 설명, 이해, 예측하는데 유용한가를 검토하려면 그 게임이 분석하고자하는 "현실"의 근본적인 요소들을 어떻게 재구성했으며, 그 재구성은 타당한지, 그 모델의 분석을 통한 설명이 현실에서 적실성이 있는지를 평가해야만 한다. 따라서 그 모델에 대한 구체적인 지식을 바탕으로 하여 "현실적" 유효성을 따져 보아야 할 것이다. "죄수의 딜레마 게임"이 상정하고 있는 "재구성된 현실"은 다음과 같은 기본 요소들로 구성된다.
1) 행위자(actor)들은 합리적(rational)이다. 여기서 "합리적"이란 용어는 크게 두 가지로 정의된다. 첫째, 각 행위자는 모델에서 주어지는 결과들(outcomes)에 대한 선호도(preference ordering)를 가진다. 즉, 사과, 감, 귤 중 한 가지를 먹는 결과가 있다고 한다면 행위자가 어떤 과일을 가장 좋아하고 싫어하는지, 혹은 좋고 싫음이 없는지(indifference) 등을 가늠한다는 것이다. 또한 행위자의 선호도는 "전이적(transitive --- 만약 A >= B 이고 B >= C 이면, A >= C)"이다. 둘째, 각 행위자는 자신의 선호도와 상대방의 행위(action)를 감안하여 결과에 대한 자신의 효용을 극대화하는 (utility maximization: 이기적 행위자) 쪽으로 행위를 선택한다. 이때 극대화한다고 해서 항상 최선의 결과를 가져오는 대안(alternatives 혹은 행위action: 예를 들어서 사과를 먹겠다고 의사표시를 하는 것)을 선택하는 것이 아니고 상대방과의 전략적 상호작용(상대방의 전략도 감안)을 염두에 두고 최선이 가능하면 최선 쪽으로, 그것이 여의치 않으면 차선 등의 순으로 대안을 선택한다.
2) 두 행위자들(A와 B)은 상호 의사소통(communication)을 할 수 없다 (혹은 "하지 않는다," 혹은 "하여도 게임에 아무런 영향을 미치지 않는다"). 이것은 "비협력 게임 (Non-cooperative Game)"에 필수적으로 들어가는 가정이다. "죄수의 딜레마 게임"에서 각 죄수를 각기 다른 방에 수용하며 취조도 따로 한다는 게임구조가 바로 이 가정을 반영한다. 행위자도 두 명으로 한정된다.
3) 각 행위자가 선택할 수 있는 대안(alternative)은 배신(자백)과 협력(입을 다물음) 둘 뿐이다. 물론, 현실적으로는 일부 자백과 같은 다른 대안도 생각할 수 있지만 그렇게 되면 모델을 설정하기가 거의 불가능하기 때문에 (10% 자백, 20% 자백, .....) 모든 경우를 포괄하기 위해서 자백-묵비 식으로 단순화시킨다.
4) 이 게임의 결과는 모두 네 가지이며 각 결과에 대한 몫(혹은 보수: payoff)은 다음과 같다 (A의 경우를 상정함).
상호협력 (모두 협력의 대안을 선택) - 보상(R: Reward)
상호배신 (모두 배신의 대안을 선택) - 벌(P: Punishment)
A가 당함 (A/협력, B/배신) - A 물먹음 (S: Sucker's Payoff)
A가 B를 등쳐먹음 (A/배신, B/협력) - A 등침 (T: Temptation)
5) 각 행위자는 다음과 같은 선호도를 가진다.
T > R > P > S (T > R > S > P 가 되면 "비겁자 게임(Chicken Game)"이 된다.)
6) 각 행위자는 상대방의 대안 선택을 미리 알 수가 없다 (simultaneous choice of alternatives). 물론 시간적으로는 A가 먼저 선택하고 B가 그 다음에 선택하는 식으로 현실에서는 이루어지겠지만, 상대방의 선택을 알 수만 없다면 "동시"에 선택하는 것과 마찬가지이다. 따라서 "죄수의 딜레마 게임"은 "동시 게임(simultaneous game)"의 한 종류이다.
7) 각 행위자의 전략(strategy)은 배신을 택할 것인지, 협력을 택할 것인지 (pure strategy) 혹은 두 대안에 일정한 확률(0과 1 사이)을 주어서 섞을 것인지(mixed strategy)를 결정하는 것이다.
8) 각 행위자는 이러한 게임의 구조와 상대방의 선호도를 알고 있으며, 상대방이 게임의 구조와 자신의 선호도를 알고 있다는 것도 안다 (the assumption of common knowledge).
4. "죄수의 딜레마" 게임의 분석: "내쉬 균형"과 "상호 이익의 딜레마"
앞에서 기술한 기본 가정을 내포한 "죄수의 딜레마 게임"의 해를 구하는 대표적인 방법으로 "내쉬 균형 (Nash Equilibrium)"이 있다. 그 균형의 정의를 형식적으로 나타내지 않고 말로 표현하면 다음과 같다.
정의 --- "내쉬 균형 전략": "내쉬 균형 전략"의 필요충분 조건은 게임의 어떤 결과("내쉬 균형 결과")를 구성하는 상대방의 전략이 주어졌다고 가정했을 때 그 결과를 구성하는 자신의 전략을 바꾸더라도 자신의 몫을 증가시킬 수 없으며, 이것은 그 결과를 구성하는 모든 행위자의 전략에 적용되어야 하는 것이다.
예를 들어서, A가 배신을 선택하고 B가 협력을 선택하면 해당되는 결과는 A의 입장에서는 "T: A가 B를 등침 (B의 입장에서는 S: B가 물먹음)"이 된다. 이 결과가 "내쉬 균형 결과"인지를 확인하려면, B의 전략(협력)이 주어졌다고 가정하고, A의 전략(배신)을 바꾸어서 A의 몫이 증가하는지를 확인하고, 또한 A의 전략(배신)을 주어졌다고 가정하고, B의 전략(협력)을 다른 전략(배신)으로 바꾸어서 B의 몫이 증가하는지를 확인하여, 두 경우 모두 몫이 증가하지 않으면 그 결과가 "내쉬 균형 결과"가 되고 각각의 전략이 "내쉬 균형 전략"이 되는 것이다. 그런데 이 예의 결과는 "내쉬 균형"이 될 수 없다. 왜냐하면 B가 협력에서 배신으로 전략을 바꾸면 B는 S 대신 P의 몫을 가지므로 B의 몫이 증가하게 되는 것이다 (T > R > P > S).
이런 식으로 네 결과를 모두 확인해보면 "죄수의 딜레마 게임"의 유일한 "내쉬 균형 결과"는 상호 배신임을 알 수 있다. 그런데 상호 배신은 상호 협력이라는 결과와 비교하면 두 행위자 모두에게 더 적은 몫을 주므로 (R > P) "파레토 열등한 (Pareto-inferior)" 결과가 된다. 따라서 합리적 행위(이기주의)에 입각한 예의 전략적 상호 작용 때문에 모든 사회 구성원(두 행위자)이 상호 협력하는 더 좋은 결과가 있음에도 불구하고 서로 배신하는 딜레마에 빠지게 된다.
이러한 딜레마를 국제정치에 응용한 것이 바로 "안보의 딜레마(Dilemma of Security)"이다. 미국과 소련의 핵무장 경쟁의 예를 보자면, 각국에 가장 바람직한 결과는 자국이 핵무기를 더 많이 보유하고 (배신) 상대국이 핵무장을 더 이상 하지 않는 것이며 (협력), 차선은 양국이 공히 핵무장을 더 이상 하지 않는 것으로 볼 수 있는데 (상호 협력: 군비경쟁을 하지 않고 그 비용을 다른 분야에 투자한다고 상정해볼 것), 양국에게 공히 더 좋은 상호 협력의 차선으로 가는 것이 아니라 각국이 핵무장을 더 많이 하는 상호 배신의 방향으로 간다는 것이다. 이것은 결국 국가의 존망이 걸린 안보라는 중요한 이슈에서 이기적인 미, 소 양국이 서로 믿지 못한다는 전략적 상호작용의 기본구도 때문에 딜레마가 발생하는 것이다.
이 딜레마를 흔히 "공동 이익의 딜레마(Dilemma of Common Interests)"라고 부르며 공동선을 위한 "협동(collaboration)"을 성취하여 그 문제를 해결할 수 있다고 국제정치이론에서는 설명한다. "협동"을 추구한 미, 소 양국의 예로서는 SALT와 START 등의 군비 감축 협상을 들 수 있다. 즉, "상호 의사소통을 하지 않는다(혹은 하지 않는 것과 마찬가지다)"는 "죄수의 딜레마 게임"의 기본 가정을 깨어서 대화를 통하여 파레토 열등의 균형 결과에서 탈피하겠다는 시도라고 할 수 있다. 그런데, 상호 협력이 "내쉬 균형 결과"가 아니므로 각국은 언제든지 협동의 약속을 깨고 "남을 등쳐먹는" 결과를 추구할 유인이 항상 남아 있다는 것이 그 다음의 문제로 부상된다. 미국 의회가 SALT를 비준하기를 꺼려했던 것도 SALT라는 "협동"의 기제는 언제든지 상대방이 "물을 먹일 수도 있다"는 것을 염두에 둔 것으로 해석할 수 있다. 즉, "협동"은 그 약속을 이탈하는 배신자를 처벌할 수 있는 방법이 현실적으로 동원될 수 있어야지만 그 실효성이 있는 것이지 그런 "보복 기제"가 여의치 않을 때는 깨어지기가 쉽다는 것이다. 역사상 군비 감축의 약속이 잘 지켜지지 않았다는 것을 보면 얼마나 안보의 영역에서 "협동"이 어려운가를 잘 알 수 있다.
5. DJP 연합의 딜레마 (틀린 예측의 예)
지금 현재 (1997년 8월) 국내 정치에서 논의되고 있는 DJP 연합도 어떤 측면에서는 "공동 이익의 딜레마"에 빠져 있는 것으로 해석할 수 있고, 따라서 그에 준한 예측도 할 수 있다. 앞의 "죄수의 딜레마 게임"의 기본 가정을 그대로 대입하여 DJP 연합의 게임 구도를 설명해 보기로 하자.
1) DJ와 JP는 정치적 행위에서 자신의 이익을 추구하는 합리적 행위자이다. 정치인들은 특히 권력에 관한 이슈가 걸리면 전형적으로 이기적인 행위자가 될 수밖에 없고, 따라서 자신의 이익을 챙기기 위해서 자신의 선호도와 상대방의 반응을 고려하여 열심히 계산한다고 전혀 무리 없이 가정할 수 있다.
2) DJ와 JP가 권력 이슈에 관해서는 상호 믿을 수 없다는 점에서 "비협력 게임(의사소통의 역할이 거의 없는 게임)"에 준한다고 간주할 수 있다. 이론에서와 같이 완벽한 "비협력 게임"은 물론 아니더라도 정치적인 약속이 이행된다는 기대보다는 의심하는 양상이 훨씬 강하게 드러나므로 기본적으로는 "비협력 게임"으로 보는 것이 타당하다.
3) 일단 DJ와 JP가 후보 단일화에 관심이 있다는 것은 의문의 여지가 없으므로 어느 쪽 위주로 단일화 할 것인지를 기준으로 하여 각 행위자의 대안을 설정해볼 수 있다. DJ와 JP가 취할 수 있는 대안으로는 후보 단일화를 위해서 양보하는 것과 양보하지 않는 것으로 단순화시켜서 분석할 수 있다. DJ의 양보와 JP의 양보는 내용상으로는 다를 것이다. JP는 자신의 평소 주장인 내각제를 관철하거나 자신의 지분을 확실히 챙긴다는 가정하의 양보가 될 것이고, DJ는 당연히 가능한 한 JP의 이권이나 지분을 줄인다는 가정하의 양보가 될 것이다. 이런 식으로 대안을 더 세분화시킬 수도 있겠지만 (상대방의 입장을 얼마나 받아들이느냐는 기준을 하나 더 적용하여), 그렇게 되면 "분석의 경제성"이 떨어지므로 양보와 비양보로 단순화시키는 것은 무리도 없고 효율적이다. 비양보의 경우에는 상대방이 단일 후보가 되는 것을 반대하며 자신은 후보로 출마하는 경우이다.
4) 이 게임의 결과는 다음과 같은 네 가지이다. 몫은 DJ의 예를 든다.
DJP 연합에 의한 단일후보화 (상호 양보: Reward)
JP 일방적 양보 (DJ 비양보, JP 양보: Temptation)
DJ 일방적 양보 (DJ 양보, JP 비양보: Sucker's)
각자 출마 (상호 비양보: Punishment)
5) 각 행위자는 [T > R > P > S]의 선호도를 가진다. DJ와 JP의 입장을 감안하면 이 선호도가 적절하다는 것을 잘 알 수 있다. DJ는 JP가 자신의 손을 일방적으로 들어준다면 대통령이 될 가능성이 클 뿐만 아니라 만약 대통령이 된다 하더라도 JP에게 약속한 지분이 없으므로 JP의 일방적 양보를 당연히 가장 선호할 것이다. 단일화가 되지 않더라도 자신의 당선 가능성이 많다고 보는 DJ의 입장에서는 일방적 양보는 최악의 결과일 것이고, DJP 연합을 추구하는 국민회의의 최근 움직임을 감안한다면 각자 출마보다는 DJP 연합을 더 선호하는 것임을 알 수 있다. 물론 DJ의 입장에서는 각종 여론 조사에서 JP보다는 크게 앞서고 있으므로 당연히 연합이 된다면 DJ가 대선 후보가 될 것으로 기대하고 있을 것이다.
JP의 DJP 연합에 대한 입장은 크게 두 가지로 볼 수 있다. 하나의 시나리오는 협상에 들어가서 DJ로 단일화되기보다는 JP로 단일화되는 것이 정권교체의 확률을 높일 수 있다는 점을 강변할 수 있을 것이다. 즉, DJ를 비토 하는 유권자들의 숫자가 상대적으로 많을 수 있으므로 여-야의 양분된 구도 하에서는 오히려 JP가 여권 후보를 꺾을 가능성이 많다고 설명할 수 있을 것이다. 그러나 이 주장은 DJ의 입장에서는 받아들여지지 않을 것이다. 왜냐하면 JP의 주장을 뒷받침할 수 있는 객관적인 자료가 없기 때문이다. 현행 대선제도의 결함으로 인하여 여-야가 양분된 가운데서 유권자의 지지도를 검증 받은 적이 없는 것을 우리는 주지해야 한다. 또한 DJ 지지도가 JP 보다는 훨씬 높으므로 그러한 추측에 의한 주장이 먹혀들 가능성은 전무하다고 보아도 무리가 없을 것이다.
또 하나의 시나리오는 JP가 DJ를 야권 단일 후보로 추인 해주면서 내각제 약속이라든지 차기 정권에서의 지분에 대한 확실한 약속을 받아내는 것이다. 현실적으로 DJP 연합이 이루어진다면 이 방식으로 이루어질 가능성이 크고, 이것을 염두에 두고 JP의 입장에서는 대통령이 될 가능성이 없는 "각자 출마"보다는 DJP 연합을 더 선호한다고 가정하는 것이 전혀 무리가 없다. 물론 여권과의 다른 협상에 의해서 여권으로부터 어떤 차기 정권에서의 위상을 약속 받고 DJP 연합보다는 각자 출마를 더 선호하는 식이 될 수도 있겠지만 일단 이 게임에서는 그 가능성은 배제한다. 만약 그런 식의 야합이 이루어진다면, 그것은 일종의 공작이기 때문에 JP로서도 선뜻 모험을 하지는 않으려고 할 것이다. 따라서 JP의 선호도도 [T > R > P > S]로 가정하는 것이 합당하다.
6) 각 행위자는 게임이 진행되고 있는 중간에는 상대방이 어떤 전략을 결국 채택할지 추측은 할 수 있어도 확신은 하지 못한다. 따라서 DJP 연합 게임은 "동시 게임 (Simultaneous Game)"으로 볼 수 있다.
7) 대선 후보 단일화에 대한 DJP 연합 게임은 일 회로 끝나며, 이전에 유사한 게임이 없었기 때문에 각 행위자는 양보 혹은 비양보의 "순수 전략(pure strategy)"을 택한다.
8) 이러한 전략적 상호작용의 게임 구도는 언론 보도를 참조한다면 DJ나 JP가 공히 잘 알고 있다고 가정할 수 있다 (the assumption of common knowledge).
이상에서 DJP 연합 게임이 "죄수의 딜레마"와 매우 유사하다는 것을 확인하였다. 이 게임의 균형 결과를 원용하여 DJP 연합을 예측하면, DJP 연합은 그 게임 구도를 깨지 않는 한 이루어지기 힘든 것으로 예측할 수 있다. 게임 구도를 깨는 방법은 여러 가지가 있을 수 있다.
일단 협상을 통해서 (비협력 게임을 협력 게임으로 바꾸려는 시도) 파레토 최적의 (Pareto-efficient) 결과로 가는 "협동(collaboration)"을 추구할 수 있다. 신한국당의 대선 후보가 결정되자마자 국민회의에서 자민련 측에 협상을 제안한 것이 대표적 예가 될 것이다. 선호도를 설명하는 5) 항에서 이미 설명했듯이 "협동"이 된다면 JP의 요구사항을 DJ가 받아들이고 JP는 DJ로의 후보 단일화를 인정하는 식이 될 것이다.
이 경우의 문제점은 과연 JP의 요구사항이 장차 실행되도록 "협동"을 강제할 수 있는 기제가 있느냐라는 것이다. JP는 이미 삼당 합당시 YS와 노태우로부터 내각제에 관한 각서까지 받아가면서 약속을 따내었지만 결국은 그 약속이 이행되지 않는 것을 속수무책으로 지켜본 뼈아픈 경험이 있다. 또 권력의 속성을 이해한다면 정치권에서 권력배분에 관한 각서 정도를 뒤집는 것은 간단하게 할 수 있다는 것을 우리는 잘 알고 있다. "화장실 갈 때와 나올 때의 입장이 달라지는 것"과 비슷한 얘기가 될 것이다. 또 "국민이 원하지 않아서" 등의 적당한 명분을 찾는 agenda 설정만 한다면 내각제를 죽이는 것은 권력을 쥔 측에서는 별로 어려운 일이 아닐 것이다. 지분을 약속 받는 문제도 어떤 식으로 지분을 할당받을 것인지도 문제이지만 약속을 받더라도 과연 이해관계가 첨예하게 부닥치는 정치세계에서 어떻게 그것을 이행할 것인지도 큰 문제가 될 것이다. 지분에 관한 약속 이행의 정도도 나중에는 시빗거리가 될 수 있는데, DJ측은 분명히 약속을 이행했다고 주장하고 JP는 불만족스럽게 생각할 가능성도 많은 것이다. 따라서 JP의 입장에서는 과거의 경험도 고려하고, 정치세계의 변함없는 속성도 참조하여 어떤 종류의 약속이행도 어려울 것이라고 판단할 가능성이 크다. 이런 이유 때문에 필자는 DJP 연합의 "협동" 기제는 성사되기가 힘든 것으로 예측한다.
딜레마 구도를 깨는 다른 방법들은 다음과 같이 요약할 수 있다.
1) 행위자가 비합리적 행위자(선호도를 무시한다든지, 자신의 효용 극대화를 추구하지 않는 행위자)로 바뀌는 경우
2) 행위자의 선호도가 바뀌는 경우 (예를 들어서, 두 행위자가 R > T > P > S 식의 선호도를 가지는 경우)
3) 전혀 다른 전략적 상호작용이 개입되는 경우 (신한국당이 개입하는 경우를 상정할 수 있음)
4) 행위자가 없어지는 경우 (극단적인 경우지만 두 행위자 중 한 명이 갑자기 자연사나 사고사할 경우에는 게임 자체가 원인무효가 됨)
[사회과학에서 미래에 대한 예측은 이론상으로는 100%의 확실성을 가진 결론일지라도 항상 확률적으로 표현하는 것이 옳다. 왜냐하면 인간은 자유의지를 가지고 있고, 또한 모델이 다루지 못하는 "작은" 요소들에 의해서 의외로 "큰" 사건이 벌어질 수도 있기 때문이다. 그런 "작은" 요소들까지 모두 모델에 포함할 수 없는 것은 불문가지이다. 과학적 예측은 일반화에 입각하며 (무당이나 점쟁이의 예측은 직관에 입각한다고 볼 수 있음; 물론 어떤 이는 고유의 모델과 일반화된 지식이 있다고 주장하는 경우도 있겠지만) 그러한 일반화를 위해서는 단순화가 필요불가결하기 때문이다. 역사가 열려 있느냐 닫혀 있느냐에 대한 입장 차이도 있을 수 있는데, 인간의 행위에 대한 과학적 예측은 확률 개념을 개입시켜서 path-dependent하게 하는 것이
방법론적으로 합당하다. 즉, A라는 조건 집합이 충족되면 C라는 결과가 예견되고, B라는 조건 집합이 충족되면 D라는 결과가 예견된다는 식이 적절하다. 따라서 자본주의 다음에는 공산주의가 온다는 식의 "닫힌 역사적 해석"은 인간의 자유의지에 의해서 역사가 어느 방향으로 튈지 모른다는 "열린 해석"과 대별된다. 자유 민주주의 이념은 지적 상대주의를 취하고 있기 때문에 "열린 해석" 편에 서 있다.]
6. "반복된 죄수의 딜레마 게임"과 팃포탯 (Tit-for-Tat) 전략
지금까지 일회에 그치는 (single-shot) "죄수의 딜레마 게임"의 이론적 분석을 현실의 국제정치적 예와 국내정치적 예에 적용시키는 시도를 해 보았다. "죄수의 딜레마"에 준하는 전략적 상호작용은 무정부(anarchy)적인 국제관계에서 전형적으로 나타난다고 할 수 있다. 즉, 국내정부와 같은 상위의 권위체가 없는 국제관계에서는 국가라는 행위자가 상대방을 믿지 못하는 상태에서 자신의 이익의 극대화를 위한 전략을 선택할 가능성이 많기 때문이다. 따라서 국제정치학에서는 그 게임을 이용하여 국가간의 경쟁과 분쟁관계를 설명하곤 한다. 그 대표적인 예가 앞에서 언급한 "안보 딜레마"이다.
그런데, 국제관계를 살펴보면 반드시 분쟁만 있는 것이 아니고 나름대로 평화를 유지하면서 "협력"하는 측면이 많은 것도 사실이다. 그 협력관계가 어떤 패권국의 주도에 의하여 이루어지면 "패권적 질서 (hegemonic order: 예를 들어서 Pax Romana, Pax Americana)"라고 부른다. 한편 무정부상태라는 국제관계의 기본속성을 바탕에 깔고 패권국이 없어도 국가간 협력관계는 가능하다고 주장하는 학자들이 흔히 원용하는 것이 "반복된 죄수의 딜레마 게임 (Iterated PD Game, IPD로 약칭)"의 분석이다. 그 게임을 분석한 대표적인 연구가 Axelrod의 "협력의 진화 (The Evolution of Cooperation)"이다. IPD는 일회용 PD 게임을 여러 회 반복한다는 차이만 있고 각 게임구조 자체는 원래 PD 게임과 동일하다. 또한 행위자는 전에 있었던 게임의 결과는 당연히 기억하는 것으로 가정한다.
Axelrod는 두 번에 걸친 IPD 게임 토너먼트에서 심리학자인 라퍼포트가 제출한 "Tit-for-Tat 전략 (눈에는 눈 귀에는 귀 전략, 혹은 보상보복전략: TFT로 약칭)"이 우승한 것을 이론적으로 분석하여 이기적 행위자 사이에 상호 의사교환이 없이도 협력을 이룩할 수 있는 조건을 밝혀 내었다. 토너먼트 방식은 참가한 전략들을 모두 일대 일로 일정한 횟수 동안 컴퓨터 시뮬레이션으로 붙여서 가장 많은 점수를 받는 전략이 우승하게끔 되어 있었다. TFT는 일단 첫 회에는 상대방에게 협력하고 그 다음부터는 이전 게임에서 상대방이 협력하면 그 다음 게임에서 협력하고, 이전 게임에서 배신하면 그 다음 게임에서 배신하는 식의 매우 간단한 전략이다. 한 번만 하는 PD 게임의 분석을 감안한다면, TFT를 제외한 모든 전략이 언제나 배신하는 전략(All Defect: AD로 약칭)을 제출했다면 TFT가 우승할 수는 없었을 것이다.
왜냐하면 첫 회에는 TFT가 S의 몫을, AD는 T의 몫을 받는 한편 두 번째 게임부터는 양쪽 모두 P를 공히 받을 것이기 때문이다. 그러나 두 토너먼트 모두 다양한 전략들이 제출되었기 때문에 TFT가 상대적으로 많은 평균 점수를 받아서 우승한 것이다.
TFT가 우승할 수 있었던 가장 중요한 조건이 바로 "미래에 대한 충분한 기대 (enough shadow of future)"이다. PD 게임이 일회로 끝난다면 앞에서 분석한 바와 같이 무조건 배신하는 것이 유일한 균형 전략이 된다. 언제나 배신하는 전략인 AD는 따라서 어떠한 전략에 대해서도 일대 일로 경합하면 상대방과 같거나 더 많은 몫을 챙겨올 수 있다. 그러나 만약 IPD가 진행되는 와중에 어떤 두 전략 사이에 협력의 기제가 자연적으로 발생한다면 협력 이후에는 그 두 전략이 R의 몫을 챙겨올 것이므로 AD 보다 더 많은 몫을 챙길 수 있다는 점을 주목해야 한다. 그러므로 게임이 어느 정도는 계속 진행되어야만 TFT가 균형 전략이 될 수 있는
가능성이 생기는 것이다. Axelrod의 연구에서 "미래의 그림자 (shadow of future)"는 미래의 몫에 대한 할인계수로 표시된다. 즉, 할인계수가 0이면 게임이 한 번으로 끝나는 것으로 상정할 수 있다 (예를 들어서 두 번째 게임에서 R의 몫을 받을 수 있다고 하여도 할인계수를 곱하면 결국 아무 것도 받지 못하는 것과 같다). 할인계수가 높으면 높을수록 "미래에 대한 기대"는 크다고 할 수 있고, 게임이 계속 진행될 가능성도 높다는 것을 의미한다.
그러면, TFT의 어떤 특성이 균형 전략을 구성할 수 있도록 해주는가를 알아보자. 먼저, TFT는 상대방이 금방 그 전략의 속성을 알아낼 수 있다(simple)는 특징이 있다. 즉, 상대방의 전략을 그대로 따라서 하기 때문에 몇 번만 게임을 해보면 자신이 협력을 하면 TFT는 그 다음 게임에서 자동적으로 협력한다는 것을 깨닫을 수 있는 것이다. 그렇다면 상대방이 굳이 배신을 선택하여 R대신 P의 몫을 받을 이유가 없어지는 것이다. 둘째, TFT는 신사적이다(nice). 이 속성은 TFT가 첫 번째 게임에서는 무조건 협력하는 것을 두고 일컫는 것이다. 상대방에게 호감을 주어서 장차 협력의 가능성이 있다는 것을 첫 수에 보여준다는 것이다. 셋째, TFT는 관대하다(generous). 상대방이 중간에 기만(배신)하더라도 TFT는 그 이후 게임에서 용서하기도 한다. 단, TFT의 관대함은 무조건적인 관대함이 아니고 상대방이 다시 협력을 한다는 조건이 붙는다. 즉, 배신을 한 상대방이 다시 협력의 수를 보여주어야만 그 다음 게임에서 용서하고 다시 협력한다는 것이다. 어떤 전략은 이런 속성이 전혀 없는 것도 있는데, 대표적인 것이 AD이고 다른 예로는 상대방이 한 번만 배신하면 그 다음부터는 게임이 끝날 때까지 계속 배신을 선택하는 전략도 있다. 이런 전략들은 상대방으로 하여금 협력의 믿음을 주기에는 미흡한 점이 많다. 넷째, TFT는 나약하지 않다(being provoked). TFT의 속성상 상대방이 기만하면 그 다음 게임에서는 반드시 협력하지 않음(보복함)으로써 상대방에게 "쓴 맛"을 안겨준다는 점에서 TFT는 나약하지 않은 것이다. 이기주의자들이 모여 사는 세상에서 언제나 협력하는 식의 전략은 상대방에게 착취당하기 알맞은 것이다.
앞에서 요약한 속성들 때문에 "충분한 미래에 대한 기대"가 있는 상황에서 TFT와 마주치는 행위자는 TFT를 배신하여 단기적인 이익을 노리기보다는 일정한 시간이 지난 후에 상호 협력하여 장기적인 이익을 추구한다는 것이 Axelrod의 IPD 게임에 대한 분석의 중요한 결론이다. 이 이외에도 Axelrod는 TFT가 "전략적으로 안정적(strategically stable)"이라는 점도 강조한다. 어떤 사회 구성원이 모두 TFT를 채택하여 상호협력을 구성하고 있다고 하자. 만약 AD라는 신참 구성원이 그 사회에 들어온다면 AD는 첫 번째 조우에서는 최선의 몫인 T를 확보할 수 있겠지만 그 다음 조우부터는 P의 몫을 가지게 될 것이다. 그렇지만 원래 사회 구성원들 사이에는 계속 R의 몫이 주어지기 때문에 AD는 쉽사리 자신의 전략을 퍼뜨릴(그 사회를 "침범invade"할) 수가 없다. 따라서 AD는 금방 자신의 전략을 포기하고 TFT를 채택하여 더 많은 몫을 얻으려고 할 것이므로 TFT는 "전략적으로 안정적"이라고 Axelrod는 정의한다.
Axelrod는 또한 소수의 TFT 행위자가 AD로 점철된 사회를 "침범(신 전략이 기존의 전략보다 더 많은 몫을 챙길 수 있는 경우)"할 수 있음도 보여준다. 그 반대의 경우로서 AD를 채택하고 있는 집단이 TFT 사회를 "침범"하려면 상대적으로 더 많은 수의 AD 행위자가 필요함을 보여줌으로서 TFT는 대화가 없는 (혹은 대화가 무용한) 이기주의자들 사이에서 상호 협력과 신뢰를 이끌어낼 수 있는 매우 유용한 전략으로서 Axelrod는 이론적 설명을 하고 있다.
7. "반복 게임"의 응용
IPD를 현실 문제에 대표적으로 적용하는 학자들이 국제정치의 "신자유주의 학자들(Neo-Liberalists: Keohane과 Nye 등이 대표적)"이다. 그들은 패권국이 없어도 (after hegemony: 패권적 질서는 "현실주의 학자들(Realists)"이 주로 주장한 것임) 이기적인 국가들 사이의 협력은 가능하다라고 주장하면서, 그 이론적인 기반으로 Axelrod의 IPD 분석을 제시하였다. 그들은 특히 국제정치경제 분야에서 미국 중심의 패권적 질서가 1970년대 초반에 무너졌음에도 불구하고 국제 협력이 유지되었음을 주목한다. 주지하다시피 제 2차 세계대전 이후의 국제경제 질서는 브레튼 우즈 체제(Bretton Woods System: 금본위제인 미국달러를 기축통화로 하면서 고정환율을 채택한 자유무역 체제)라는 미국 중심의 질서를 유지해오다가, 미국이 1970년대 초반에 금본위제를 포기하면서 고정환율 제도가 무너지고 변동환율제를 각국이 채택하게 되었다. 그 당시 대부분의 국가들이 기존의 국제경제질서가 무너져 혼란기를 겪게되는 것이 아닌가라는 우려가 있었지만 선진국들 중심으로 다시 협력 체제(예를 들어서 플라자 협정)를 구성했던 것이다. 이러한 중요한 역사적 예를 분석하면서 "신자유주의 학자들"은 서로 믿지 못하는 이기적인 국가들 사이에 협력이 발생했다는 것을 IPD를 원용하여 이론적으로 뒷받침했던 것이다.
필자의 수필 "사회개선의 조그만 성냥불 "이라는 제언에 나오는 처방전도 Axelrod의 이론을 원용한 것이다. 즉, 게임 이론의 분석 결과를 현실에 적용시키려는 시도를 보여준 것이다. 필자의 제언이 그 이론을 제대로 적용시키고 있는지 아닌지를 평가하려면 Axelrod가 구상한 모델(일단 PD 게임, 그 다음 IPD 게임)이 우리 나라의 어떤 현실적 상황과 얼마나 맞아떨어지는가를 살펴보아야 한다.
필자가 관찰해본 결과, 우리 나라에는 남을 "기만하려는" 풍조가 많이 퍼져 있다는 점을 포착할 수 있었다. 한보 청문회를 보면서 대부분의 정치인들이 부패되었음을 느꼈던 것이 행위자를 "이기주의자"로 간주한 결정적인 계기가 되었다 (물론 부패하지 않은 이기주의자도 가능함). 또 주위에서 듣고 경험한 바로는 "세상에 믿을 놈 없다"라는 분위기가 우리 사회 전반에 만연되어 있었고, 단기적으로 내 이익만 챙기지 않으면 오히려 자신이 손해를 본다는 일종의 "강박관념"에 많은 사람들이 사로잡혀 있는 것으로 판단하였다.
예를 들어서, 무슨 방법을 동원해서도 서울대에 들어가면 장차 앞길이 훤히 열린다든지, 무조건 고시에 붙고 보자 등의 사고 방식이 그런 상념을 대표적으로 대변하고 있다. 그렇다면 남이야 어떻게 되든지 일단 자신의 이익을 챙기는 게임 이론의 이기적 행위자와 딱 맞아떨어지는 것이다. 물론 현실에서는 다양한 상황이 전개되고 또 그 상황에서 나타나는 행위자의 반응도 각양각색이지만 매우 중요한 사안(특히 돈과 권력 문제)이 걸리면 서로 믿지 못하고 일단은 자신의 이익을 챙겨야 하는 그런 전략적 상호작용에 걸려 있는 것으로 단순화시킬 수 있다고 필자는 보았다. 교수와 학생 사이에도 충분한 신뢰관계가 형성되어 있지 않은 점을 참조하면 (필자는 초등, 중등, 고등 교육에서 이미 제대로된 신뢰관계를 형성할 수 없는 기제가 작용하는 것으로 판단하고 있음 --- 대표적 근거: 돈 봉투, 입시지옥, 그리고 내신성적) 사회의 전반적인 "불신 분위기"를 짐작하고도 남는다. 따라서 첨예한 이익이 걸린 상황과 상호 의사교환이 무용한 (서로 믿지 못하는) 상황하의 이기주의적 행위자를 상정한 것은 전혀 무리가 없다고 간주하였다.
그 다음, 전략적 상호작용이 반드시 두 행위자 사이에만 일어나는 것은 아니지만 분석의 편의상 현실을 단순화시켜서 일단 두 행위자의 상호 관계를 분석한 다음 현실에 그 결과를 원용할 수 있다. "성냥불" 수필은 매우 간략하고 일반적으로 작성되었으므로 구체적인 전략적 상호작용에 대한 설명은 없다. 여기서는 먼저 "정치자금"에 얽힌 상호작용의 예를 들어서 검토해보기로 하자. 사례를 구체화시키기 위해서 어떤 국회의원 선거구에서 두 정치인이 출마했다고 하자. 정치자금 상으로 두 정치인은 크게 나누어서 법이 허용하는 한도 내에서 선거자금을 모아서 쓸 수 있는 대안과 그 이상을 쓰는 대안이 있다고 단순화시킬 수 있다. 우리 나라의 예와 같이 법정 상한액 이상을 선거비용으로 사용하더라도 벌을 받지 않는 경우가 대부분이고 법정 한도액 이하를 쓰면 선거에서 질 가능성이 크다면 각 후보에게 가장 좋은 결과는 자신이 한도액 이상을 모금하여 쓰고 상대방 후보는 한도액 내에서 쓰는 것이 된다 (자신은 배신, 상대방은 협력: 몫은 T). 비슷한 방법으로 각 후보에게 주어지는 선호도는 다음과 같이 나타낼 수 있을 것이다.
T > R (상호 한도액 내에서 지출) > P (상호 한도액 이상 지출) > S (자신이 한도액 내에서 상대방이 한도액 이상 지출)
위와 같은 선호도를 두 행위자가 공히 가진다면 그 전략적 상호작용은 PD 게임에 준하는 것이다. 우리 나라의 많은 부패현상이 위와 같은 상황하에서 벌어지고 있다고 필자는 평가하였다. 일회용 게임으로서 이 문제를 해결하기 위해서 동원될 수 있는 방법은 이미 설명하였다 (대표적인 방법은 P를 S보다 낮추는 것: 한도액 이상 지출하면 무조건 실형 선고 --> 게임 구조가 바뀜). 이와 같은 상호작용의 구도는 그 자체로서는 대부분의 정치인들 각각에게는 "충분한 미래에 대한 기대"를 제공하지 못하므로 (차 차기는 없다는 식의 인식: 게임이 여러 회 반복되지 않는다는 인식) Axelrod의 TFT 처방을 적용시키기는 어려울 것이다. 따라서 이런 경우에는 제도적 장치를 강제적으로 적용시킴으로서 상호협력을 이끌어내는 처방이 주효할 것이다.
그러나 제도적 장치를 강제적으로 적용시킬 수 있는 힘을 가진 행위자 숫자는 매우 한정되어 있다. 상기한 예의 경우, 우선 생각할 수 있는 제도적 장치는 현실적인 정치자금법이나 선거법을 마련하고 행정부에서 법대로 집행하며 법을 어기는 정치인들은 사법부에서 단죄하는 장치를 생각할 수 있을 것이다. 첫 번째 단계를 검토해보면 법은 우선적으로 국회의원들이 제정하는 것인데, 부패된 사회의 국회의원들 자체가 법 제정에 있어서 "죄수의 딜레마 상황"에 빠져있을 가능성이 많다. 즉, "고양이 목에 누가 방울을 달겠는가"라는 집단행동(collective action)의 문제가 구조적으로 내재되어 있는 국회라면 대부분의 행위자가 상대방의 "협력"에 무임승차(free-riding)하려는 성향을 보일 것이다. 따라서 필자는 우리 나라와 같이 정치가 부패된 사회의 정치자금법이나 선거법은 극단적인 경우에는 국회에서 주도하는 것 보다 대통령이 주도하여 국민투표를 통하여 승인을 받는 것이 유용하다고 보는 편이다.
[필자는 "떡값"을 못 받게 규정하는 정치자금법보다는, "떡값"을 받도록 규정하는 정치자금법이 우리 나라에 시급하다고 판단한다. "떡값"의 속성상 아무리 받지 못하게 규정해도 뒷거래가 가능하기 때문이다. 따라서 오히려 현실적인 처방은 "떡값"을 받게 하고 실제 영수증 처리를 하도록 규정하며, 그 사용처도 실제 영수증을 검토하여 수입과 지출의 투명성이 확보되도록 정치자금법을 고쳐야 한다고 주장해왔다. 만약 감사나 사정의 과정에서 단 돈 만 원이라도 정치자금이나 "떡값(광범위하게는 이것도 정치자금)"을 수수하고 영수증을 발부하지 않았다든지, 지출을 했는데 영수증이 없다든지라면 그 정치인은 무조건 사법 처리되도록 하는 것이 옳다고 본다.]
"반복된 죄수의 딜레마 게임(IPD)"의 상황에 처해 있는 예로서 부조리의 시정을 원하는 우리 나라 엘리트들의 행위 유형을 들 수 있다 (여기서 엘리트는 어떤 조직에서 중요한 결정에 실질적인 영향력을 행사하는 행위자로 일단 정의한다 --- 예를 들어서 기업의 중간관리자 이상, 관료는 서기관 이상 등등의 기준을 적용할 수 있을 것이다). 일단 우리 나라의 엘리트들이 돈과 권력 문제에 있어서 합리적 행위자라는 가정은 무리 없이 할 수 있다. 현실을 단순화시키기 위해서 두 엘리트가 우리 나라의 부패상을 잘 알고 있고 그 시정을 추구하고자 하며, 다음과 같은 대안, 결과, 그리고 선호도를 가지고 있다고 모델을 설정해보자.
(대안) 부조리의 시정을 시도함 vs. 부조리를 방조함
(결과)
일방적 방조 (T: 자신은 방조, 상대방은 시정을 시도
==> 상대방이 당함)
사회개선 시도 합의 (R: 부조리 시정을 시도함을 합의)
상호방조 (P: 상호 편하게 살기로 함)
일방적 시정 시도 (S: 자신은 시정을 시도, 상대방은 방조
==> 자신이 당함)
(선호도) T > R > P > S ==> "죄수의 딜레마"의 전략적 상호작용
물론 이 모델은 사회개선은 두 엘리트가 공히 협력하여야 이루어질 가능성이 있는 것으로 가정하고 있는데, 우리의 실정을 감안하면 전혀 무리가 없다. 물론, 최고 권력자가 일시적으로 혁명적 변화나 개혁적 변화를 시도하는 것은 위의 게임 모델로서 설명할 수 없다. 이 모델은 그런 혁명적 변화나 개혁적 변화가 아닌 경우의 사회개선에 대한 우리 나라 엘리트들의 상호작용을 적절하게 재구성한 것이기 때문이다.
필자가 만나본 대부분의 엘리트들은 우리 사회에 부패가 만연되어 있고 그 시정이 시급함에는 이견이 없었다. 그럼에도 불구하고 부정부패나 불친절의 사회상을 조금씩이라도 고치자고 어떤 엘리트가 주장하면 상대방은 실제 행동으로 옮기는 점에 있어서는 대부분 부정적이었다. 옳고 바르게 살자고 주장하면 "잘못하다가는 네 목이 날아갈 수 있어"라는 말을 많이 듣는 상황인 것이다. 즉, "사회개선의 집단행동"은 상대방의 협조를 요하는데 상대방을 잘못 믿으면 오히려 큰 손해를 볼 수 있는 "집단행동의 딜레마"에 준하는 전략적 상호작용을 많은 엘리트들이 그리고 있는 것으로 필자는 파악하였다.
다음 단계로 이런 전략적 상호작용이 계속 반복되는 것인지 아닌지를 검토해야 하고, 행위자들이 "미래에 대한 충분한 기대"를 가지고 있는 것인지도 따져봐야 한다. 우리 나라의 부패 구조가 어제오늘 일이 아니었음을 감안한다면 그러한 게임이 여러 번 반복되었음을 간접적으로 확인할 수 있다. 문제는 엘리트들이 어느 정도의 할인계수를 미래에 받을 몫에 부여하였는지가 관건이 된다. 필자가 판단하기로는 현실적인 부정부패에 대해서 그 시정의 필요성을 느끼고 있는 많은 엘리트들도 주로 단기적인 이익에만 관심이 있고, 그 자식이나 손자에게 어떤 세상을 물려줄 것인지에 대한 의식이 부족했거나 사회개선에 대해서 "자포자기" 상태였음을 감안한다면 "미래의 몫에 대한 충분한 기대"가 없었던 것으로 보인다. 이런 상황하에서는 대부분의 행위자들이 일회용 "죄수의 딜레마" 게임의 균형전략인 "부조리를 방조함 (IPD에서는 AD 전략)"을 선택하는 것이 합리적 선택이다. 따라서 IPD의 구조를 가진 것은 맞지만 많은 엘리트들이 "편하게 사는" 균형전략을 택했기 때문에 우리 나라의 부패가 잘 청산되지 않는 일면이 있었다는 하나의 설명도 가능하다.
필자의 수필인 "사회개선의 조그만 성냥불"에서는 행위자들이 TFT 전략을 택하여 장기적으로 또 점진적으로 사회개선을 이룰 수도 있음을 주장하고 있다. 그런데 Axelrod의 연구에 의하면 유아독존 식으로 그 전략을 사용하면 상호협력을 이룩할 수 없고 일정한 수의 행위자가 TFT를 채택해야지만 AD가 판을 치는 세상을 좋은 의미로 "침범"할 수가 있다는 것을 알 수 있다. 따라서 필자는 TFT를 채택하는 개인주의적인 운동을 제안하여 부정부패 척결의 필요성을 느끼고 있는 엘리트들이 보다 많이 호응해줄 것을 희망하였고, 그 방식으로 "착하고 바르게 사는 것"을 제시했던 것이다. 여기서 "착하게" 산다는 것은 IPD의 첫 게임에서 "협력"을 선택하는 것을 암시하고 있다. "착하게" 산다는 것은 자기 능력을 넘어서서 남을 도와주라는 뜻이 아니고 (예를 들어서, 친척이 돈을 빌려 달라고 할 때 여유가 없으면서도 은행의 융자를 얻어주는 식의 행위는 착하기보다는 "바보 같은" 행위로 간주된다) 능력 한도 내에서 남을 도와주면서 자신이 행복감을 느끼는 것으로 정의된다. 특히 서로 잘 알지 못하는 상황에서 일단 "협력"의 대안을 선택할 것을 권하는 것으로 해석할 수 있다. "바르게 산다"는 것은 건전한 상식과 이성에 입각해서 옳은 것은 옳다고 하고 틀린 것은 틀렸다고 당당하게 얘기하는 것으로 정의된다.
그런데 여기에서 우리가 조심해서 검토해야 하는 것이 미래의 몫에 대한 기대가 높다고 하더라도 R이 충분히 크거나 혹은 P가 충분히 작지 않으면 TFT를 선택해도 별 소용이 없게 된다는 것이다 (이 점도 Axelrod의 분석에 포함되어 있다). 즉, 협력의 보상이 충분하지 않거나 배신에 대한 보복이 모자라면 (예컨대 R = P+e) 아무리 TFT를 선택하는 행위자가 많더라도, 또 미래에 대한 충분한 기대가 있더라도 상호협력(사회개선의 시도)을 이끌어내기가 어려워지는 것이다. 왜냐하면 첫 번째 게임에서 배신하는 전략(부조리 방조)이 충분히 큰 몫을 행위자에게 가져다준다면, 한 번의 T 값이 여러 회에 걸친 R 값의 합보다 더 클 수 있기 때문이다.
8. 인간의 행위와 제도적 장치
논의가 여기까지 진행되면 "닭(인간의 행위)이 먼저냐, 달걀(제도)이 먼저냐"라는 그 다음 질문에 당도하게 된다. 즉, R 값이 현재상태에서는 충분히 크지 않기 때문에 당분간은 TFT를 채택해서는 안되고 AD를 선택해서 "부조리를 방조할 수밖에 없고, R 값이 제도적으로 올라가면 그 때 TFT를 선택하면 된다"라고 주장하는 입장이 등장할 수 있다. 이런 주장을 하는 사람들은 선호도에 있어서 R이 P에 근접해 있고 T는 R보다 상당히 큰 값을 가지고 있다고 생각하는 행위자들이다. 따라서 이런 부류의 사람들이 대다수인 사회에서는 제도적으로 R과 P 값의 차이는 벌이고 T와 R 값의 차이는 줄이는 방안이 도입되면 TFT에 의한 상호협력을 이끌어내기가 쉬울 것이다.
그러나 우리 나라의 실정을 감안한다면 제도가 나빠서 상호불신과 부조리가 팽배해 있는 부분도 많지만, 제도가 제대로 되어 있어도 잘 지켜지지 않거나 제도를 강제하기 힘든 상황도 널려 있는 것으로 보인다. 정치자금법이나 선거법의 예를 보자면 법 자체는 "검은 돈"에 대해서 상당히 엄격한 규제를 명시하고 있음에도 불구하고 정치인들이 잘 지키지 않는 문제가 있다. "떡값"의 경우에는 잘 추적하기 어려운 문제도 있다. 제도는 인간의 머리로 만들어내는 것이기 때문에 항상 허점을 가지고 있고 인간은 그 허점을 이용하여 자신의 편협한 이익을 챙기려는 경향이 있는 것은 주지의 사실이다. 결국은 제도도 중요하지만 인간의 행위 양식 (개인 사이의 충돌도 포함) 자체도 중요할 수밖에 없다. 또한 제도를 만들기 위한 사전 준비 작업으로서 인간이 움직여야 하는 측면도 있는 것이다. 예컨대 많은 엘리트들이 "나는 R 값이 상당히 큰 선호도를 가지고 있어"라고 생각하면서 TFT 전략을 선택하게 되고 자신들의 장기적 이익을 더욱 더 보장받기 위해서 좀더 나은 제도를 요구할 수도 있을 것이다.
요약하자면, 상기한 사회개선 게임의 딜레마를 풀기 위해서는 부패를 시정하려는 행위자에게 충분한 보상을 주거나 혹은 이에 비협조적인 행위자에게 손실을 주는 "제도적 개선"이 일부 필요하고, 행위자들이 사회개선의 장기적 이익을 제대로 인식하여 예의 보상보복전략(TFT)을 택하는 것이 한 방법이 될 수 있음을 알 수 있다. 필자의 주장은 "제도적 개선"이 불충분하거나 점진적으로 이루어지는 와중에도 사회개선을 촉진하는 방향으로 엘리트들이 움직일 필요가 있다는 것이다. 특히 현실 권력에 직접 참여하고 있지 않는 지식인이나 사회지도층들도 앞장서서 권력 엘리트들에게 단기적인 편협한 이익을 추구할 것이 아니라 장기적으로 누적되는 몫을 추구하도록 촉구하고 자신들도 또한 모범을 보일 필요가 있다는 것이다.
일단 엘리트 중 이미 선호도가 TFT에 충분히 기대를 걸 수 있는 이들이 먼저 앞장서서 상호간의 "협동"을 이룩하고 점차 TFT를 채택하는 엘리트들이 많아지도록 유도할 수 있을 것이다. 또한 장기적으로는 부패된 사회에서 이익을 추구하는 것이 명확한 한계를 가지고 있고, 장차 제도적 장치에 의해서 부조리에 휩쓸리면 결국은 손해를 본다는 점을 더욱 많은 엘리트들이 인식하도록 그들을 설득할 수도 있을 것이다. 필자가 파악하기로는 사회개혁의 시동력이 될 수 있는 엘리트들이 이러한 장기적 계산을 하지 않으려거나, 미래에 대한 충분한 기대가 없다고 생각하는 경향이 있는 것으로 보인다. 이것은 일종의 편의주의와 패배주의로서 한 사회의 발전을 위해서 전혀 바람직하지 않은 것이다.
필자는 그런 편의주의나 패배주의는 그릇된 역사의식에 기반하고 있는 것으로 평가한다. 현 사회가 문제점이 많다면 그 사회를 후손들에게 물려주지 않을 노력을 경주하여야 하는데 게임이 마치 자기 대에서 끝나는 것으로 간주하고 부조리에 편승하거나 묵인하는 단세포적인 반응인 것이다. 우리 사회가 더욱 발전된 모습을 보일 때 그런 단세포적인 행위자들은 앞장서서 부정을 저지르는 이들과 함께 결국은 도태될 것이다. 그렇게 되지 않으면 우리 사회는 희망이 없는 사회가 될 수밖에 없다. 어쩌면 우리 사회 자체가 망하는 지경에 이를지도 모른다. 사회 전체가 망하면 엘리트의 이익은 당연히 없어지는 것과 마찬가지이다. 따라서 사회를 개선하는 작업은 "이타적"인 행위를 요하는 것이 아니고 각자의 "이기심"에 의한 기준에서도 필요하다는 사실을 널리 각성시켜야 한다고 본다.
그러나 현재와 같이 이미 딜레마 상황에 빠져있을 때는 그 딜레마를 깨기가 매우 힘든 것이 사실이다. 누구든지 어느 집단이든지 먼저 시작해야지만 이론에서 논의되었듯이 부패의 전략(AD)이 판을 치고 있는 상황을 "침범"할 수 있는데 그 시작이 무척 어려운 것이다. 게임 외적 상황으로 AD를 채택하고 있는 행위자들이나 혹은 아예 사회개선을 선호하지 않는 (P > R) 이들이 "착하고 바르게" 살고자 하는 행위자의 기를 꺾으려는 경우를 생각해 볼 수 있다. 예를 들어서 선생님들이 돈 봉투를 받는 경우를 살펴보면, 신참 선생님이 돈 봉투를 받지 않으려고 해도 주위의 선생님들이 "혼자서만 잘난 척 하는 것"이라고 핀잔을 준다든지, 교장 선생님이 불이익을 줄 수 있음을 내비치면서 은근히 상납을 요구한다든지 하여 결국은 돈 봉투를 받게되는 식이다. 이런 구도를 깨어야 한다는 것이 필자의 주장이다. 이 구도를 깨기 위해서 초기에는 사회개선을 향하는 "돈키호테"와 같은 행위들을 최소한 좌절시키지 말고 격려해줄 수 있어야 한다. 우리 사회가 부조리의 나락에서 빠져나오자고 주장하는데도 불구하고 오히려 그 시도를 도와주지는 못할 망정 좌절시키려는 태도는 같이 망하자는 것과 마찬가지이다. 물론 제도개선에도 힘을 쏟아야겠지만, 결국 인간의 행위도 제도와 더불어서 같이 나아가야 함을 잊어서는 안되겠다.
9. "성냥불"과 사회개선
다른 조건이 비슷하다면 TFT를 채택하는 엘리트의 숫자가 커질수록 사회개선의 가능성이 높아지므로 필자는 그에 준해서 후진양성에 힘쓰고자 한다. 즉 앞으로 엘리트가 될 가능성이 큰 필자의 학생들이 후일 사회에 진출하여 TFT에 준하여 "착하고 바르게" 살도록 그 불씨를 살려놓자는 것이다. 그 불씨들이 "사회개선의 성냥불"이며 먼 훗날 "들불"을 일으킬 행위자들이 되어야 한다는 것이다. 이런 작업은 단 시일에 될 수 있는 것이 아니고 적어도 몇 십 년의 장기적인 안목으로 추진되어야 할 것이다. 그 중간에 "성냥불"의 숫자도 늘어날 것이고, 또 그들이 충분히 보상을 받는 제도적 개선도 덩달아서 이루어질 것으로 필자는 추정하고 있다.
TFT 전략을 응용하여 광의로 해석하면 우리 사회의 문제가 있는 여러 분야에 이용할 수도 있다. 상대방이 좋은 방향으로 나에게 협조하려 하면 상(보상)을 주고, 나를 기만하려면 협조하지 않거나 벌(보복)을 주는 식으로 TFT를 해석할 수도 있다. 우리 사회에 전반적으로 문제가 되어 있는 서비스 업계의 불친절은 어떻게 보면 우리들 자신들이 그 만큼 보상보복을 하지 않았기 때문에 고질적인 문제로 남아 있는 측면이 있다. 외국의 경우 팁을 주는 제도가 전형적인 TFT이다. 즉, 서비스가 좋으면 팁을 많이 주고 서비스가 나쁘면 극단적인 경우에는 팁을 주지 않는 식의 보상보복이 제도화되어 있는 것이다.
우리 나라의 실정을 감안하면 외국과 같이 팁 제도를 도입하기는 당분간 어려울 것으로 보인다 (일부 고급 식당에 도입된 팁 제도는 전혀 보상보복의 역할을 못하고 있다). 팁 제도가 없다고 해서 서비스 업계의 불친절을 시정하지 못하는 것은 아니다. 우리 나라 사람들은 어떤 불이익을 당해도 귀찮아서 말을 잘 하지 않으려는 경우가 허다하다. 필자가 직접 경험한 예를 들자면, 사회 지도층 급의 지식인 약 10 명과 같이 저녁 식사를 하는데 종업원이 매우 불친절해도 아무도 시정을 요구하는 이가 없어서 깜짝 놀란 적이 있다. 결국은 필자가 그 종업원의 잘못을 지적하고 시정할 것을 요구했는데, 같이 있었던 몇 몇 분들로부터 "우리 나라는 다 그래, 혹은 아직 우리 나라에 적응이 덜 됐군"이라는 얘기를 필자는 들었던 것이다. 이런 식으로 "포기"한다면 서비스업의 불친절은 시정하기가 어려워진다.
잘못된 서비스는 벌을 주고 잘된 서비스는 상을 주는 식의 전략이 일반화되어야 손님과 종업원의 협력관계가 촉진될 것이다. 필자는 가끔 고객카드제를 이용하여 서비스가 좋은 종업원은 우수 고객으로 추천하고, 서비스가 두드러지게 나쁜 종업원의 경우는 시정을 요구하는 식의 "보상보복"을 해왔다. 즉, 잘된 부분은 보다 더 확대시키고 잘못된 부분은 축소시키는 그런 관행이 굳어져야지만 서비스 업계의 불친절 문제는 근본적인 시정이 이루어질 것이다. 이를 위해서는 보다 더 많은 시민들이 "입을 열" 필요가 있다 (보상의 경우와는 달리 시정을 요구할 때는 싸움이 되지 않도록 특별히 조심해야 함은 물론이다).
교수라는 직업도 일종의 서비스업임을 감안한다면 학생들에 의한 "보상보복"도 교수의 서비스 질을 높이기 위한 부분적인 방안으로 대두될 수 있다. 지금 현재 학생들에 의한 교수평가를 실시하지 않는 학교들이 많음을 감안한다면, 또한 교수-학생의 특수한 관계를 감안한다면(학점과 학위와 연관된 권력관계), 학생들의 입장에서는 "보상"이 더 적절한 전략이 될 것이다. 즉, 상대적으로 비교하여 보다 더 나은 서비스를 제공하는 교수가 있다면 그 교수를 고무시키는 방안을 찾아보는 것도 한 방법이다. 우리 나라에도 장기적으로는 미국과 같이 학생들이 서비스가 좋지 않은 경우에는 부분적으로 (학생의 평가에 의한 보상보복은 부분적일 수밖에 없음) 벌을 줄 수 있는 제도도 확립될 것으로 필자는 예상하고 있다.
결론적으로 TFT 전략은 이기주의라는 게임 구도 자체가 변하지 않아도 (제도적 개선이 미비하거나 진행중이더라도) "상호협동"의 딜레마를 깰 수 있는 유효한 방법임이 이론적으로 뒷받침되어 있고, 앞에서 논의한 바와 같이 우리 사회의 개선을 위해서 채택할만한 충분한 가치가 있는 전략이다. 그 전략이 현실에서 사회개선의 효과를 나타내기 위해서는 일정한 수의 착하고 바르게 사는 "성냥불(TFT 행위자)"들이 부패한 현 사회를 후손에게 물려주지 않겠다는 의식을 가짐과 동시에 장기적으로는 부패한 사람들보다 더 많은 이익을 가질 것이라는 (혹은, 부패한 사람들이 결국 손해를 볼 것이라는) 미래에 대한 충분한 기대를 가지고 있어야 한다. 필자는 장차 그런 "성냥불"들이 대접받는 시대가 반드시 도래한다고 믿는 편이다. 왜냐하면 부정으로 돈을 버는 행위자들은 갈수록 "당할" 가능성이 커지고 명분 싸움에서 밀릴 수밖에 없을 것이기 때문이다.
게임 이론의 현실 적용에 관한 논의를 보다 더 일반적으로 하자면 모델에 대한 기본적인 이해가 먼저 얘기되어야 한다. 모델은 주지하다시피 현실이 아니다. 인과관계를 분석하는 사회과학의 대부분의 연구가 현실을 이해하고, 설명하고, 예측하는 데 그 목적을 두고 있음은 자명하지만, 이론적 연구든 경험적 연구든, 연구는 현실 그 자체와는 다름을 일단 인정해야 한다. 따라서 필자는 "현실" 그 자체와 "재구성된 현실 (Reconstructed Reality)"을 구분해야 한다는 입장을 견지한다. 예를 들어서, 북한 경제의 저성장을 어떤 연구자가 분석한다면 그 가능성에 영향을 미치는 무수히도 많은 요소(국내 정치, 국제정치구조, 남한의 제반 상황, 미국의 제반 상황, 북한의 경제적 상황, 군비, 북한 지도자의 전쟁수행 의지, 날씨, 지도자의 인격, 북한 주민의 관습, 사상, 기타 등등)를 모두 포함하여 어떤 연구결과를 내어놓지는 못하는 것이다. 따라서 그 연구자는 자신이 판단하건대 북한 경제의 저성장에 가장 중요한 영향을 미치는 몇 가지를 중점적으로 분석하는 것이다. 이것은 정치학의 여러 다양한 방법론을 막론하고 일반적으로 나타나는 현상으로서, 역사적 연구, 통계학적 연구, 순수 이론적 연구, 실증 이론적 연구, 정치 사상적 연구 등에 공히 드러나고 있다.
따라서 사회과학적 연구는 연구대상이 되는 "현실"에서 중요하다고 간주되는 요소들을 추출, 재구성하여 그 "현실"을 이해하고자 하는 것이지, 인과관계가 개입된 "현실" 그 자체를 그대로 기술하는 것이 아니고, 기술할 수도 없는 것이다. 그렇다면 사회과학에서는 "모형화 (modeling)"가 피할 수 없는 양상으로 나타난다고 볼 수 있다. 이 양상은 심지어는 사회과학과 인문학이 혼합된 역사 기술적인 방법을 채택하고 있는 연구에도 나타나고 있는 것이다. 즉, 토인비가 설명한 일차 세계대전과 테일러가 설명한 일차 세계대전은 "현실"은 하나이지만, "재구성된 현실"은 당연히 동일한 것이 될 수 없는 것이다.
2. 게임이론과 모형화
게임이론은 "모형화"가 가장 심하게 나타나는 사회과학적 연구방법이라고 흔히 평가된다. 많은 "전통주의자들(역사적historical, 기술적descriptive 연구방법을 채택하고 있는 학자들)"이 게임이론 혹은 "합리적 선택이론 (Rational Choice Theory: 게임 이론, 사회적 선택 이론, 그리고 공간모형 이론 --- 이 세 분과의 차이에 대해서는 이 문단 뒤의 설명을 참조)"이 현실을 "과도하게 단순화시킨다(too much simplification)"는 비판을 흔히 하는 것을 보면 금방 알 수 있다. 그런데 "과도한 단순화"를 결정하는 잣대는 단순화시켰다는 그 사실 하나로 판가름할 수는 없고 그 단순화가 연구 목적에 부합하는지, 또 적절하게 해당되는 현실을 이해하고 설명하는데 도움을 주는지 등을 감안하여 결정하는 것이 되어야지 A라는 연구가 B라는 연구보다 더 현실을 단순화시켰다고 해서 "과도한 단순화"라고 부를 수는 없다. 왜냐하면 단순화시키지 않는 사회과학적 연구는 없기 때문이고, "과도하다"고 지칭하려면 그 단순화가 연구 목적에 맞지 않다든지 연구의 적실성이 단순화 그 자체 때문에 낮아졌다든지 등의 객관적인 사유가 있어야 하기 때문이다.
[투표자의 선호도를 감안하여 투표행위를 분석하는 것은 "게임이론"으로 분류하지 않는다. 정치적 선택에 관한 분석 방법론 중에 "합리적 선택 이론 (Rational Choice Theory 혹은 Analysis)"이라는 것이 있는데, 크게 세 분과가 있다. 그 중 하나가 게임이론이고, 그 다음이 공공선택 혹은 사회적 선택 이론 (Public Choice; Social Choice)이며 나머지 하나가 공간모형론 (Spatial Modeling)이다.
게임이론은 행위자간의 "전략적 상호작용"을 주로 다루는데, 주로 상대방 행위자가 분명히 드러나는 상황을 분석한다. 남북간 협상이 한 예가 될 수 있다. 그런데 투표행위는 개인의 선호도에 입각해서 전체 사회의 선택(예를 들어서 대통령 뽑기)을 이끌어내는 과정의 일부이므로 상대방 행위자가 직접적으로 드러난 전략적 상호작용의 상황이라고는 볼 수 없다. "개인들의 선호와 선택이 모여서 어떻게 한 사회(국가, 집단, 가족 등)의 선택으로 결정되는가"라는 문제를 분석하는 것은 공공선택론 혹은 사회적 선택론에서 주로 하는 것이다. 물론 게임과 사회적 선택이 같이 연관된 정치적 선택도 있다.
공간모형론은 이슈 영역(일반적으로 표현한다면 n 차원)에서 행위자들이 어떤 위치(position)를 잡는가 혹은 잡을 것인가를 주로 분석한다. 대표적인 예가 Duncan Black의 "중간 투표자 정리 (Median Voter Theorem)"인데, 이 정리에 따르면 두 정당이 하나의 이슈 영역에서 어떤 위치를 잡아야 보다 많은 표를 얻을 것인가에 대한 답으로 "중간 투표자의 위치"를 주어진 조건하에서 (이슈 영역 하나, 정당 둘, 투표자의 선호도는 single-peaked) 제시한다. 이 정리를 이용하여 양당제 하에서 정당의 정책이 "중간으로 모이는" 현상을 설명하기도 한다. 즉, 미국의 공화당과 민주당의 정강, 정책이 구체적 사안에서는 입장 차이를 보이지만 큰 틀로서는 별 차이가 없는 보수정당인데, 이 현상의 대표적인 이유가 정당들이 보다 많은 표를 긁어모으려고 "중간 위치"를 잡는 "합리적 계산"의 결과라는 것이다.]
과학으로서 사회과학을 평가하자면, 궁극적으로는 일반화된 지식을 축적하는 것이 그 목적이므로 연구 과제의 필수적이고 중요한 요소들을 보다 더 단순한 모델에 넣어서 분석할 수 있다면 경제적이고 명확해서 오히려 더 좋다고 주장할 수도 있다. 따라서 단순화된 모델이 과도한지 적절한지는 "단순화의 정도"만 기준으로 해서 평가할 수는 없고 그 "단순화"가 무엇을 보여주는지를 참조하여 평가해주는 것이 옳다.
게임이론이 주로 분석하는 행위자들 사이의 "전략적 상호작용 (strategic interaction)"은 매우 다양하게 나타난다. 따라서 "죄수의 딜레마 게임"을 현실을 이해하거나 설명하는데 유용한가를 검토하려면 그 게임이 상정하고 있는 전략적 상호작용이 현실에 존재할 수 있는지를 따져보아야 한다. 이 때 "죄수의 딜레마 게임"과 "현실"을 일대 일로 대응시켜서 평가할 수는 없고 "재구성된 현실"로서 그 적실성이 있는지에 초점을 맞추어야 함은 당연하다. 즉, "현실"의 어떤 복잡다단한 전략적 상호작용을 구성하고 있는 필수적인 요소들이 그 모델에 제대로 구현되고 있는지를 따져보는 것이 객관적인 평가방법이지 "현실" 자체를 그대로 잘 기술했는지를 꼼꼼히 확인하는 것은 올바른 방법이 아니다. 일대 일 대응 방식으로 모델을 평가하면 모든 모델이 현실과는 다르다는 판정을 받게 되고 "용도폐기"되는 운명에 처할 수밖에 없을 것이다. 따라서 특정 모델의 적실성은 다른 모델과 비교하여 상대적으로 그 모델이 이끌어내는 일반화된 지식이 얼마나 대상 현실을 더 잘 이해하고 설명하느냐를 기준으로 평가를 해주는 것이 좋다.
[그런데, 정치학의 각 방법론이 제시하는 모델들은 고유의 특성을 가지고 있으므로 상호 비교하기가 매우 힘든 경우가 있다. 예를 들어서, 전쟁을 연구한다고 할 때 역사 기술적인 방법을 동원하는 학자들은 문서나 여타 기록들을 참조하여 모델을 설정하며, 통계학적 방법론에서는 데이터(hard data)가 주로 동원되며, 예의 합리적 선택이론에서는 연역적인 인과관계를 내포하고 있는 형식 모형(formal model)을 주로 원용한다. 물론 총체적으로 어떤 방법론이나 패러다임이 더 유용한 연구결과를 생산해내느냐는 척도에 따라서 "일세를 풍미하는" 방법론이 나오기도 하지만 (자연과학에서는 그런 방법론이 존재했던 것으로 간주됨), 인간의 행위와 상호관계를 분석하는 사회과학에서는 그런 방법론이 잘 형성되지 않는 특징이 있다. 따라서 어떤 방법론을 채택하느냐는 것은 연구자의 성향이나 기호에 의해서 좌우되며 특정 연구결과를 평가할 때는 같은 방법론을 사용하고 있는 다른 연구와 비교하여 평가해주는 것이 가장 객관적이다. 그렇다고 해서 방법론 사이의 비교가 전혀 생기지 않는 것은 아니고, 같은 "현실"을 다른 두 방법론의 입장에서 연구한 결과가 있다면 일정한 평가기준(예를 들어서 논리적 일관성, 일반화의 정도, 유용한 가설의 수, 경험적 검증 등등)을 세워서, 그 기준에 의하여 상호 비교할 수는 있을 것이다.]
3. 재구성된 현실로서의 "죄수의 딜레마 게임"
"죄수의 딜레마 게임"이 현실을 설명, 이해, 예측하는데 유용한가를 검토하려면 그 게임이 분석하고자하는 "현실"의 근본적인 요소들을 어떻게 재구성했으며, 그 재구성은 타당한지, 그 모델의 분석을 통한 설명이 현실에서 적실성이 있는지를 평가해야만 한다. 따라서 그 모델에 대한 구체적인 지식을 바탕으로 하여 "현실적" 유효성을 따져 보아야 할 것이다. "죄수의 딜레마 게임"이 상정하고 있는 "재구성된 현실"은 다음과 같은 기본 요소들로 구성된다.
1) 행위자(actor)들은 합리적(rational)이다. 여기서 "합리적"이란 용어는 크게 두 가지로 정의된다. 첫째, 각 행위자는 모델에서 주어지는 결과들(outcomes)에 대한 선호도(preference ordering)를 가진다. 즉, 사과, 감, 귤 중 한 가지를 먹는 결과가 있다고 한다면 행위자가 어떤 과일을 가장 좋아하고 싫어하는지, 혹은 좋고 싫음이 없는지(indifference) 등을 가늠한다는 것이다. 또한 행위자의 선호도는 "전이적(transitive --- 만약 A >= B 이고 B >= C 이면, A >= C)"이다. 둘째, 각 행위자는 자신의 선호도와 상대방의 행위(action)를 감안하여 결과에 대한 자신의 효용을 극대화하는 (utility maximization: 이기적 행위자) 쪽으로 행위를 선택한다. 이때 극대화한다고 해서 항상 최선의 결과를 가져오는 대안(alternatives 혹은 행위action: 예를 들어서 사과를 먹겠다고 의사표시를 하는 것)을 선택하는 것이 아니고 상대방과의 전략적 상호작용(상대방의 전략도 감안)을 염두에 두고 최선이 가능하면 최선 쪽으로, 그것이 여의치 않으면 차선 등의 순으로 대안을 선택한다.
2) 두 행위자들(A와 B)은 상호 의사소통(communication)을 할 수 없다 (혹은 "하지 않는다," 혹은 "하여도 게임에 아무런 영향을 미치지 않는다"). 이것은 "비협력 게임 (Non-cooperative Game)"에 필수적으로 들어가는 가정이다. "죄수의 딜레마 게임"에서 각 죄수를 각기 다른 방에 수용하며 취조도 따로 한다는 게임구조가 바로 이 가정을 반영한다. 행위자도 두 명으로 한정된다.
3) 각 행위자가 선택할 수 있는 대안(alternative)은 배신(자백)과 협력(입을 다물음) 둘 뿐이다. 물론, 현실적으로는 일부 자백과 같은 다른 대안도 생각할 수 있지만 그렇게 되면 모델을 설정하기가 거의 불가능하기 때문에 (10% 자백, 20% 자백, .....) 모든 경우를 포괄하기 위해서 자백-묵비 식으로 단순화시킨다.
4) 이 게임의 결과는 모두 네 가지이며 각 결과에 대한 몫(혹은 보수: payoff)은 다음과 같다 (A의 경우를 상정함).
상호협력 (모두 협력의 대안을 선택) - 보상(R: Reward)
상호배신 (모두 배신의 대안을 선택) - 벌(P: Punishment)
A가 당함 (A/협력, B/배신) - A 물먹음 (S: Sucker's Payoff)
A가 B를 등쳐먹음 (A/배신, B/협력) - A 등침 (T: Temptation)
5) 각 행위자는 다음과 같은 선호도를 가진다.
T > R > P > S (T > R > S > P 가 되면 "비겁자 게임(Chicken Game)"이 된다.)
6) 각 행위자는 상대방의 대안 선택을 미리 알 수가 없다 (simultaneous choice of alternatives). 물론 시간적으로는 A가 먼저 선택하고 B가 그 다음에 선택하는 식으로 현실에서는 이루어지겠지만, 상대방의 선택을 알 수만 없다면 "동시"에 선택하는 것과 마찬가지이다. 따라서 "죄수의 딜레마 게임"은 "동시 게임(simultaneous game)"의 한 종류이다.
7) 각 행위자의 전략(strategy)은 배신을 택할 것인지, 협력을 택할 것인지 (pure strategy) 혹은 두 대안에 일정한 확률(0과 1 사이)을 주어서 섞을 것인지(mixed strategy)를 결정하는 것이다.
8) 각 행위자는 이러한 게임의 구조와 상대방의 선호도를 알고 있으며, 상대방이 게임의 구조와 자신의 선호도를 알고 있다는 것도 안다 (the assumption of common knowledge).
4. "죄수의 딜레마" 게임의 분석: "내쉬 균형"과 "상호 이익의 딜레마"
앞에서 기술한 기본 가정을 내포한 "죄수의 딜레마 게임"의 해를 구하는 대표적인 방법으로 "내쉬 균형 (Nash Equilibrium)"이 있다. 그 균형의 정의를 형식적으로 나타내지 않고 말로 표현하면 다음과 같다.
정의 --- "내쉬 균형 전략": "내쉬 균형 전략"의 필요충분 조건은 게임의 어떤 결과("내쉬 균형 결과")를 구성하는 상대방의 전략이 주어졌다고 가정했을 때 그 결과를 구성하는 자신의 전략을 바꾸더라도 자신의 몫을 증가시킬 수 없으며, 이것은 그 결과를 구성하는 모든 행위자의 전략에 적용되어야 하는 것이다.
예를 들어서, A가 배신을 선택하고 B가 협력을 선택하면 해당되는 결과는 A의 입장에서는 "T: A가 B를 등침 (B의 입장에서는 S: B가 물먹음)"이 된다. 이 결과가 "내쉬 균형 결과"인지를 확인하려면, B의 전략(협력)이 주어졌다고 가정하고, A의 전략(배신)을 바꾸어서 A의 몫이 증가하는지를 확인하고, 또한 A의 전략(배신)을 주어졌다고 가정하고, B의 전략(협력)을 다른 전략(배신)으로 바꾸어서 B의 몫이 증가하는지를 확인하여, 두 경우 모두 몫이 증가하지 않으면 그 결과가 "내쉬 균형 결과"가 되고 각각의 전략이 "내쉬 균형 전략"이 되는 것이다. 그런데 이 예의 결과는 "내쉬 균형"이 될 수 없다. 왜냐하면 B가 협력에서 배신으로 전략을 바꾸면 B는 S 대신 P의 몫을 가지므로 B의 몫이 증가하게 되는 것이다 (T > R > P > S).
이런 식으로 네 결과를 모두 확인해보면 "죄수의 딜레마 게임"의 유일한 "내쉬 균형 결과"는 상호 배신임을 알 수 있다. 그런데 상호 배신은 상호 협력이라는 결과와 비교하면 두 행위자 모두에게 더 적은 몫을 주므로 (R > P) "파레토 열등한 (Pareto-inferior)" 결과가 된다. 따라서 합리적 행위(이기주의)에 입각한 예의 전략적 상호 작용 때문에 모든 사회 구성원(두 행위자)이 상호 협력하는 더 좋은 결과가 있음에도 불구하고 서로 배신하는 딜레마에 빠지게 된다.
이러한 딜레마를 국제정치에 응용한 것이 바로 "안보의 딜레마(Dilemma of Security)"이다. 미국과 소련의 핵무장 경쟁의 예를 보자면, 각국에 가장 바람직한 결과는 자국이 핵무기를 더 많이 보유하고 (배신) 상대국이 핵무장을 더 이상 하지 않는 것이며 (협력), 차선은 양국이 공히 핵무장을 더 이상 하지 않는 것으로 볼 수 있는데 (상호 협력: 군비경쟁을 하지 않고 그 비용을 다른 분야에 투자한다고 상정해볼 것), 양국에게 공히 더 좋은 상호 협력의 차선으로 가는 것이 아니라 각국이 핵무장을 더 많이 하는 상호 배신의 방향으로 간다는 것이다. 이것은 결국 국가의 존망이 걸린 안보라는 중요한 이슈에서 이기적인 미, 소 양국이 서로 믿지 못한다는 전략적 상호작용의 기본구도 때문에 딜레마가 발생하는 것이다.
이 딜레마를 흔히 "공동 이익의 딜레마(Dilemma of Common Interests)"라고 부르며 공동선을 위한 "협동(collaboration)"을 성취하여 그 문제를 해결할 수 있다고 국제정치이론에서는 설명한다. "협동"을 추구한 미, 소 양국의 예로서는 SALT와 START 등의 군비 감축 협상을 들 수 있다. 즉, "상호 의사소통을 하지 않는다(혹은 하지 않는 것과 마찬가지다)"는 "죄수의 딜레마 게임"의 기본 가정을 깨어서 대화를 통하여 파레토 열등의 균형 결과에서 탈피하겠다는 시도라고 할 수 있다. 그런데, 상호 협력이 "내쉬 균형 결과"가 아니므로 각국은 언제든지 협동의 약속을 깨고 "남을 등쳐먹는" 결과를 추구할 유인이 항상 남아 있다는 것이 그 다음의 문제로 부상된다. 미국 의회가 SALT를 비준하기를 꺼려했던 것도 SALT라는 "협동"의 기제는 언제든지 상대방이 "물을 먹일 수도 있다"는 것을 염두에 둔 것으로 해석할 수 있다. 즉, "협동"은 그 약속을 이탈하는 배신자를 처벌할 수 있는 방법이 현실적으로 동원될 수 있어야지만 그 실효성이 있는 것이지 그런 "보복 기제"가 여의치 않을 때는 깨어지기가 쉽다는 것이다. 역사상 군비 감축의 약속이 잘 지켜지지 않았다는 것을 보면 얼마나 안보의 영역에서 "협동"이 어려운가를 잘 알 수 있다.
5. DJP 연합의 딜레마 (틀린 예측의 예)
지금 현재 (1997년 8월) 국내 정치에서 논의되고 있는 DJP 연합도 어떤 측면에서는 "공동 이익의 딜레마"에 빠져 있는 것으로 해석할 수 있고, 따라서 그에 준한 예측도 할 수 있다. 앞의 "죄수의 딜레마 게임"의 기본 가정을 그대로 대입하여 DJP 연합의 게임 구도를 설명해 보기로 하자.
1) DJ와 JP는 정치적 행위에서 자신의 이익을 추구하는 합리적 행위자이다. 정치인들은 특히 권력에 관한 이슈가 걸리면 전형적으로 이기적인 행위자가 될 수밖에 없고, 따라서 자신의 이익을 챙기기 위해서 자신의 선호도와 상대방의 반응을 고려하여 열심히 계산한다고 전혀 무리 없이 가정할 수 있다.
2) DJ와 JP가 권력 이슈에 관해서는 상호 믿을 수 없다는 점에서 "비협력 게임(의사소통의 역할이 거의 없는 게임)"에 준한다고 간주할 수 있다. 이론에서와 같이 완벽한 "비협력 게임"은 물론 아니더라도 정치적인 약속이 이행된다는 기대보다는 의심하는 양상이 훨씬 강하게 드러나므로 기본적으로는 "비협력 게임"으로 보는 것이 타당하다.
3) 일단 DJ와 JP가 후보 단일화에 관심이 있다는 것은 의문의 여지가 없으므로 어느 쪽 위주로 단일화 할 것인지를 기준으로 하여 각 행위자의 대안을 설정해볼 수 있다. DJ와 JP가 취할 수 있는 대안으로는 후보 단일화를 위해서 양보하는 것과 양보하지 않는 것으로 단순화시켜서 분석할 수 있다. DJ의 양보와 JP의 양보는 내용상으로는 다를 것이다. JP는 자신의 평소 주장인 내각제를 관철하거나 자신의 지분을 확실히 챙긴다는 가정하의 양보가 될 것이고, DJ는 당연히 가능한 한 JP의 이권이나 지분을 줄인다는 가정하의 양보가 될 것이다. 이런 식으로 대안을 더 세분화시킬 수도 있겠지만 (상대방의 입장을 얼마나 받아들이느냐는 기준을 하나 더 적용하여), 그렇게 되면 "분석의 경제성"이 떨어지므로 양보와 비양보로 단순화시키는 것은 무리도 없고 효율적이다. 비양보의 경우에는 상대방이 단일 후보가 되는 것을 반대하며 자신은 후보로 출마하는 경우이다.
4) 이 게임의 결과는 다음과 같은 네 가지이다. 몫은 DJ의 예를 든다.
DJP 연합에 의한 단일후보화 (상호 양보: Reward)
JP 일방적 양보 (DJ 비양보, JP 양보: Temptation)
DJ 일방적 양보 (DJ 양보, JP 비양보: Sucker's)
각자 출마 (상호 비양보: Punishment)
5) 각 행위자는 [T > R > P > S]의 선호도를 가진다. DJ와 JP의 입장을 감안하면 이 선호도가 적절하다는 것을 잘 알 수 있다. DJ는 JP가 자신의 손을 일방적으로 들어준다면 대통령이 될 가능성이 클 뿐만 아니라 만약 대통령이 된다 하더라도 JP에게 약속한 지분이 없으므로 JP의 일방적 양보를 당연히 가장 선호할 것이다. 단일화가 되지 않더라도 자신의 당선 가능성이 많다고 보는 DJ의 입장에서는 일방적 양보는 최악의 결과일 것이고, DJP 연합을 추구하는 국민회의의 최근 움직임을 감안한다면 각자 출마보다는 DJP 연합을 더 선호하는 것임을 알 수 있다. 물론 DJ의 입장에서는 각종 여론 조사에서 JP보다는 크게 앞서고 있으므로 당연히 연합이 된다면 DJ가 대선 후보가 될 것으로 기대하고 있을 것이다.
JP의 DJP 연합에 대한 입장은 크게 두 가지로 볼 수 있다. 하나의 시나리오는 협상에 들어가서 DJ로 단일화되기보다는 JP로 단일화되는 것이 정권교체의 확률을 높일 수 있다는 점을 강변할 수 있을 것이다. 즉, DJ를 비토 하는 유권자들의 숫자가 상대적으로 많을 수 있으므로 여-야의 양분된 구도 하에서는 오히려 JP가 여권 후보를 꺾을 가능성이 많다고 설명할 수 있을 것이다. 그러나 이 주장은 DJ의 입장에서는 받아들여지지 않을 것이다. 왜냐하면 JP의 주장을 뒷받침할 수 있는 객관적인 자료가 없기 때문이다. 현행 대선제도의 결함으로 인하여 여-야가 양분된 가운데서 유권자의 지지도를 검증 받은 적이 없는 것을 우리는 주지해야 한다. 또한 DJ 지지도가 JP 보다는 훨씬 높으므로 그러한 추측에 의한 주장이 먹혀들 가능성은 전무하다고 보아도 무리가 없을 것이다.
또 하나의 시나리오는 JP가 DJ를 야권 단일 후보로 추인 해주면서 내각제 약속이라든지 차기 정권에서의 지분에 대한 확실한 약속을 받아내는 것이다. 현실적으로 DJP 연합이 이루어진다면 이 방식으로 이루어질 가능성이 크고, 이것을 염두에 두고 JP의 입장에서는 대통령이 될 가능성이 없는 "각자 출마"보다는 DJP 연합을 더 선호한다고 가정하는 것이 전혀 무리가 없다. 물론 여권과의 다른 협상에 의해서 여권으로부터 어떤 차기 정권에서의 위상을 약속 받고 DJP 연합보다는 각자 출마를 더 선호하는 식이 될 수도 있겠지만 일단 이 게임에서는 그 가능성은 배제한다. 만약 그런 식의 야합이 이루어진다면, 그것은 일종의 공작이기 때문에 JP로서도 선뜻 모험을 하지는 않으려고 할 것이다. 따라서 JP의 선호도도 [T > R > P > S]로 가정하는 것이 합당하다.
6) 각 행위자는 게임이 진행되고 있는 중간에는 상대방이 어떤 전략을 결국 채택할지 추측은 할 수 있어도 확신은 하지 못한다. 따라서 DJP 연합 게임은 "동시 게임 (Simultaneous Game)"으로 볼 수 있다.
7) 대선 후보 단일화에 대한 DJP 연합 게임은 일 회로 끝나며, 이전에 유사한 게임이 없었기 때문에 각 행위자는 양보 혹은 비양보의 "순수 전략(pure strategy)"을 택한다.
8) 이러한 전략적 상호작용의 게임 구도는 언론 보도를 참조한다면 DJ나 JP가 공히 잘 알고 있다고 가정할 수 있다 (the assumption of common knowledge).
이상에서 DJP 연합 게임이 "죄수의 딜레마"와 매우 유사하다는 것을 확인하였다. 이 게임의 균형 결과를 원용하여 DJP 연합을 예측하면, DJP 연합은 그 게임 구도를 깨지 않는 한 이루어지기 힘든 것으로 예측할 수 있다. 게임 구도를 깨는 방법은 여러 가지가 있을 수 있다.
일단 협상을 통해서 (비협력 게임을 협력 게임으로 바꾸려는 시도) 파레토 최적의 (Pareto-efficient) 결과로 가는 "협동(collaboration)"을 추구할 수 있다. 신한국당의 대선 후보가 결정되자마자 국민회의에서 자민련 측에 협상을 제안한 것이 대표적 예가 될 것이다. 선호도를 설명하는 5) 항에서 이미 설명했듯이 "협동"이 된다면 JP의 요구사항을 DJ가 받아들이고 JP는 DJ로의 후보 단일화를 인정하는 식이 될 것이다.
이 경우의 문제점은 과연 JP의 요구사항이 장차 실행되도록 "협동"을 강제할 수 있는 기제가 있느냐라는 것이다. JP는 이미 삼당 합당시 YS와 노태우로부터 내각제에 관한 각서까지 받아가면서 약속을 따내었지만 결국은 그 약속이 이행되지 않는 것을 속수무책으로 지켜본 뼈아픈 경험이 있다. 또 권력의 속성을 이해한다면 정치권에서 권력배분에 관한 각서 정도를 뒤집는 것은 간단하게 할 수 있다는 것을 우리는 잘 알고 있다. "화장실 갈 때와 나올 때의 입장이 달라지는 것"과 비슷한 얘기가 될 것이다. 또 "국민이 원하지 않아서" 등의 적당한 명분을 찾는 agenda 설정만 한다면 내각제를 죽이는 것은 권력을 쥔 측에서는 별로 어려운 일이 아닐 것이다. 지분을 약속 받는 문제도 어떤 식으로 지분을 할당받을 것인지도 문제이지만 약속을 받더라도 과연 이해관계가 첨예하게 부닥치는 정치세계에서 어떻게 그것을 이행할 것인지도 큰 문제가 될 것이다. 지분에 관한 약속 이행의 정도도 나중에는 시빗거리가 될 수 있는데, DJ측은 분명히 약속을 이행했다고 주장하고 JP는 불만족스럽게 생각할 가능성도 많은 것이다. 따라서 JP의 입장에서는 과거의 경험도 고려하고, 정치세계의 변함없는 속성도 참조하여 어떤 종류의 약속이행도 어려울 것이라고 판단할 가능성이 크다. 이런 이유 때문에 필자는 DJP 연합의 "협동" 기제는 성사되기가 힘든 것으로 예측한다.
딜레마 구도를 깨는 다른 방법들은 다음과 같이 요약할 수 있다.
1) 행위자가 비합리적 행위자(선호도를 무시한다든지, 자신의 효용 극대화를 추구하지 않는 행위자)로 바뀌는 경우
2) 행위자의 선호도가 바뀌는 경우 (예를 들어서, 두 행위자가 R > T > P > S 식의 선호도를 가지는 경우)
3) 전혀 다른 전략적 상호작용이 개입되는 경우 (신한국당이 개입하는 경우를 상정할 수 있음)
4) 행위자가 없어지는 경우 (극단적인 경우지만 두 행위자 중 한 명이 갑자기 자연사나 사고사할 경우에는 게임 자체가 원인무효가 됨)
[사회과학에서 미래에 대한 예측은 이론상으로는 100%의 확실성을 가진 결론일지라도 항상 확률적으로 표현하는 것이 옳다. 왜냐하면 인간은 자유의지를 가지고 있고, 또한 모델이 다루지 못하는 "작은" 요소들에 의해서 의외로 "큰" 사건이 벌어질 수도 있기 때문이다. 그런 "작은" 요소들까지 모두 모델에 포함할 수 없는 것은 불문가지이다. 과학적 예측은 일반화에 입각하며 (무당이나 점쟁이의 예측은 직관에 입각한다고 볼 수 있음; 물론 어떤 이는 고유의 모델과 일반화된 지식이 있다고 주장하는 경우도 있겠지만) 그러한 일반화를 위해서는 단순화가 필요불가결하기 때문이다. 역사가 열려 있느냐 닫혀 있느냐에 대한 입장 차이도 있을 수 있는데, 인간의 행위에 대한 과학적 예측은 확률 개념을 개입시켜서 path-dependent하게 하는 것이
방법론적으로 합당하다. 즉, A라는 조건 집합이 충족되면 C라는 결과가 예견되고, B라는 조건 집합이 충족되면 D라는 결과가 예견된다는 식이 적절하다. 따라서 자본주의 다음에는 공산주의가 온다는 식의 "닫힌 역사적 해석"은 인간의 자유의지에 의해서 역사가 어느 방향으로 튈지 모른다는 "열린 해석"과 대별된다. 자유 민주주의 이념은 지적 상대주의를 취하고 있기 때문에 "열린 해석" 편에 서 있다.]
6. "반복된 죄수의 딜레마 게임"과 팃포탯 (Tit-for-Tat) 전략
지금까지 일회에 그치는 (single-shot) "죄수의 딜레마 게임"의 이론적 분석을 현실의 국제정치적 예와 국내정치적 예에 적용시키는 시도를 해 보았다. "죄수의 딜레마"에 준하는 전략적 상호작용은 무정부(anarchy)적인 국제관계에서 전형적으로 나타난다고 할 수 있다. 즉, 국내정부와 같은 상위의 권위체가 없는 국제관계에서는 국가라는 행위자가 상대방을 믿지 못하는 상태에서 자신의 이익의 극대화를 위한 전략을 선택할 가능성이 많기 때문이다. 따라서 국제정치학에서는 그 게임을 이용하여 국가간의 경쟁과 분쟁관계를 설명하곤 한다. 그 대표적인 예가 앞에서 언급한 "안보 딜레마"이다.
그런데, 국제관계를 살펴보면 반드시 분쟁만 있는 것이 아니고 나름대로 평화를 유지하면서 "협력"하는 측면이 많은 것도 사실이다. 그 협력관계가 어떤 패권국의 주도에 의하여 이루어지면 "패권적 질서 (hegemonic order: 예를 들어서 Pax Romana, Pax Americana)"라고 부른다. 한편 무정부상태라는 국제관계의 기본속성을 바탕에 깔고 패권국이 없어도 국가간 협력관계는 가능하다고 주장하는 학자들이 흔히 원용하는 것이 "반복된 죄수의 딜레마 게임 (Iterated PD Game, IPD로 약칭)"의 분석이다. 그 게임을 분석한 대표적인 연구가 Axelrod의 "협력의 진화 (The Evolution of Cooperation)"이다. IPD는 일회용 PD 게임을 여러 회 반복한다는 차이만 있고 각 게임구조 자체는 원래 PD 게임과 동일하다. 또한 행위자는 전에 있었던 게임의 결과는 당연히 기억하는 것으로 가정한다.
Axelrod는 두 번에 걸친 IPD 게임 토너먼트에서 심리학자인 라퍼포트가 제출한 "Tit-for-Tat 전략 (눈에는 눈 귀에는 귀 전략, 혹은 보상보복전략: TFT로 약칭)"이 우승한 것을 이론적으로 분석하여 이기적 행위자 사이에 상호 의사교환이 없이도 협력을 이룩할 수 있는 조건을 밝혀 내었다. 토너먼트 방식은 참가한 전략들을 모두 일대 일로 일정한 횟수 동안 컴퓨터 시뮬레이션으로 붙여서 가장 많은 점수를 받는 전략이 우승하게끔 되어 있었다. TFT는 일단 첫 회에는 상대방에게 협력하고 그 다음부터는 이전 게임에서 상대방이 협력하면 그 다음 게임에서 협력하고, 이전 게임에서 배신하면 그 다음 게임에서 배신하는 식의 매우 간단한 전략이다. 한 번만 하는 PD 게임의 분석을 감안한다면, TFT를 제외한 모든 전략이 언제나 배신하는 전략(All Defect: AD로 약칭)을 제출했다면 TFT가 우승할 수는 없었을 것이다.
왜냐하면 첫 회에는 TFT가 S의 몫을, AD는 T의 몫을 받는 한편 두 번째 게임부터는 양쪽 모두 P를 공히 받을 것이기 때문이다. 그러나 두 토너먼트 모두 다양한 전략들이 제출되었기 때문에 TFT가 상대적으로 많은 평균 점수를 받아서 우승한 것이다.
TFT가 우승할 수 있었던 가장 중요한 조건이 바로 "미래에 대한 충분한 기대 (enough shadow of future)"이다. PD 게임이 일회로 끝난다면 앞에서 분석한 바와 같이 무조건 배신하는 것이 유일한 균형 전략이 된다. 언제나 배신하는 전략인 AD는 따라서 어떠한 전략에 대해서도 일대 일로 경합하면 상대방과 같거나 더 많은 몫을 챙겨올 수 있다. 그러나 만약 IPD가 진행되는 와중에 어떤 두 전략 사이에 협력의 기제가 자연적으로 발생한다면 협력 이후에는 그 두 전략이 R의 몫을 챙겨올 것이므로 AD 보다 더 많은 몫을 챙길 수 있다는 점을 주목해야 한다. 그러므로 게임이 어느 정도는 계속 진행되어야만 TFT가 균형 전략이 될 수 있는
가능성이 생기는 것이다. Axelrod의 연구에서 "미래의 그림자 (shadow of future)"는 미래의 몫에 대한 할인계수로 표시된다. 즉, 할인계수가 0이면 게임이 한 번으로 끝나는 것으로 상정할 수 있다 (예를 들어서 두 번째 게임에서 R의 몫을 받을 수 있다고 하여도 할인계수를 곱하면 결국 아무 것도 받지 못하는 것과 같다). 할인계수가 높으면 높을수록 "미래에 대한 기대"는 크다고 할 수 있고, 게임이 계속 진행될 가능성도 높다는 것을 의미한다.
그러면, TFT의 어떤 특성이 균형 전략을 구성할 수 있도록 해주는가를 알아보자. 먼저, TFT는 상대방이 금방 그 전략의 속성을 알아낼 수 있다(simple)는 특징이 있다. 즉, 상대방의 전략을 그대로 따라서 하기 때문에 몇 번만 게임을 해보면 자신이 협력을 하면 TFT는 그 다음 게임에서 자동적으로 협력한다는 것을 깨닫을 수 있는 것이다. 그렇다면 상대방이 굳이 배신을 선택하여 R대신 P의 몫을 받을 이유가 없어지는 것이다. 둘째, TFT는 신사적이다(nice). 이 속성은 TFT가 첫 번째 게임에서는 무조건 협력하는 것을 두고 일컫는 것이다. 상대방에게 호감을 주어서 장차 협력의 가능성이 있다는 것을 첫 수에 보여준다는 것이다. 셋째, TFT는 관대하다(generous). 상대방이 중간에 기만(배신)하더라도 TFT는 그 이후 게임에서 용서하기도 한다. 단, TFT의 관대함은 무조건적인 관대함이 아니고 상대방이 다시 협력을 한다는 조건이 붙는다. 즉, 배신을 한 상대방이 다시 협력의 수를 보여주어야만 그 다음 게임에서 용서하고 다시 협력한다는 것이다. 어떤 전략은 이런 속성이 전혀 없는 것도 있는데, 대표적인 것이 AD이고 다른 예로는 상대방이 한 번만 배신하면 그 다음부터는 게임이 끝날 때까지 계속 배신을 선택하는 전략도 있다. 이런 전략들은 상대방으로 하여금 협력의 믿음을 주기에는 미흡한 점이 많다. 넷째, TFT는 나약하지 않다(being provoked). TFT의 속성상 상대방이 기만하면 그 다음 게임에서는 반드시 협력하지 않음(보복함)으로써 상대방에게 "쓴 맛"을 안겨준다는 점에서 TFT는 나약하지 않은 것이다. 이기주의자들이 모여 사는 세상에서 언제나 협력하는 식의 전략은 상대방에게 착취당하기 알맞은 것이다.
앞에서 요약한 속성들 때문에 "충분한 미래에 대한 기대"가 있는 상황에서 TFT와 마주치는 행위자는 TFT를 배신하여 단기적인 이익을 노리기보다는 일정한 시간이 지난 후에 상호 협력하여 장기적인 이익을 추구한다는 것이 Axelrod의 IPD 게임에 대한 분석의 중요한 결론이다. 이 이외에도 Axelrod는 TFT가 "전략적으로 안정적(strategically stable)"이라는 점도 강조한다. 어떤 사회 구성원이 모두 TFT를 채택하여 상호협력을 구성하고 있다고 하자. 만약 AD라는 신참 구성원이 그 사회에 들어온다면 AD는 첫 번째 조우에서는 최선의 몫인 T를 확보할 수 있겠지만 그 다음 조우부터는 P의 몫을 가지게 될 것이다. 그렇지만 원래 사회 구성원들 사이에는 계속 R의 몫이 주어지기 때문에 AD는 쉽사리 자신의 전략을 퍼뜨릴(그 사회를 "침범invade"할) 수가 없다. 따라서 AD는 금방 자신의 전략을 포기하고 TFT를 채택하여 더 많은 몫을 얻으려고 할 것이므로 TFT는 "전략적으로 안정적"이라고 Axelrod는 정의한다.
Axelrod는 또한 소수의 TFT 행위자가 AD로 점철된 사회를 "침범(신 전략이 기존의 전략보다 더 많은 몫을 챙길 수 있는 경우)"할 수 있음도 보여준다. 그 반대의 경우로서 AD를 채택하고 있는 집단이 TFT 사회를 "침범"하려면 상대적으로 더 많은 수의 AD 행위자가 필요함을 보여줌으로서 TFT는 대화가 없는 (혹은 대화가 무용한) 이기주의자들 사이에서 상호 협력과 신뢰를 이끌어낼 수 있는 매우 유용한 전략으로서 Axelrod는 이론적 설명을 하고 있다.
7. "반복 게임"의 응용
IPD를 현실 문제에 대표적으로 적용하는 학자들이 국제정치의 "신자유주의 학자들(Neo-Liberalists: Keohane과 Nye 등이 대표적)"이다. 그들은 패권국이 없어도 (after hegemony: 패권적 질서는 "현실주의 학자들(Realists)"이 주로 주장한 것임) 이기적인 국가들 사이의 협력은 가능하다라고 주장하면서, 그 이론적인 기반으로 Axelrod의 IPD 분석을 제시하였다. 그들은 특히 국제정치경제 분야에서 미국 중심의 패권적 질서가 1970년대 초반에 무너졌음에도 불구하고 국제 협력이 유지되었음을 주목한다. 주지하다시피 제 2차 세계대전 이후의 국제경제 질서는 브레튼 우즈 체제(Bretton Woods System: 금본위제인 미국달러를 기축통화로 하면서 고정환율을 채택한 자유무역 체제)라는 미국 중심의 질서를 유지해오다가, 미국이 1970년대 초반에 금본위제를 포기하면서 고정환율 제도가 무너지고 변동환율제를 각국이 채택하게 되었다. 그 당시 대부분의 국가들이 기존의 국제경제질서가 무너져 혼란기를 겪게되는 것이 아닌가라는 우려가 있었지만 선진국들 중심으로 다시 협력 체제(예를 들어서 플라자 협정)를 구성했던 것이다. 이러한 중요한 역사적 예를 분석하면서 "신자유주의 학자들"은 서로 믿지 못하는 이기적인 국가들 사이에 협력이 발생했다는 것을 IPD를 원용하여 이론적으로 뒷받침했던 것이다.
필자의 수필 "사회개선의 조그만 성냥불 "이라는 제언에 나오는 처방전도 Axelrod의 이론을 원용한 것이다. 즉, 게임 이론의 분석 결과를 현실에 적용시키려는 시도를 보여준 것이다. 필자의 제언이 그 이론을 제대로 적용시키고 있는지 아닌지를 평가하려면 Axelrod가 구상한 모델(일단 PD 게임, 그 다음 IPD 게임)이 우리 나라의 어떤 현실적 상황과 얼마나 맞아떨어지는가를 살펴보아야 한다.
필자가 관찰해본 결과, 우리 나라에는 남을 "기만하려는" 풍조가 많이 퍼져 있다는 점을 포착할 수 있었다. 한보 청문회를 보면서 대부분의 정치인들이 부패되었음을 느꼈던 것이 행위자를 "이기주의자"로 간주한 결정적인 계기가 되었다 (물론 부패하지 않은 이기주의자도 가능함). 또 주위에서 듣고 경험한 바로는 "세상에 믿을 놈 없다"라는 분위기가 우리 사회 전반에 만연되어 있었고, 단기적으로 내 이익만 챙기지 않으면 오히려 자신이 손해를 본다는 일종의 "강박관념"에 많은 사람들이 사로잡혀 있는 것으로 판단하였다.
예를 들어서, 무슨 방법을 동원해서도 서울대에 들어가면 장차 앞길이 훤히 열린다든지, 무조건 고시에 붙고 보자 등의 사고 방식이 그런 상념을 대표적으로 대변하고 있다. 그렇다면 남이야 어떻게 되든지 일단 자신의 이익을 챙기는 게임 이론의 이기적 행위자와 딱 맞아떨어지는 것이다. 물론 현실에서는 다양한 상황이 전개되고 또 그 상황에서 나타나는 행위자의 반응도 각양각색이지만 매우 중요한 사안(특히 돈과 권력 문제)이 걸리면 서로 믿지 못하고 일단은 자신의 이익을 챙겨야 하는 그런 전략적 상호작용에 걸려 있는 것으로 단순화시킬 수 있다고 필자는 보았다. 교수와 학생 사이에도 충분한 신뢰관계가 형성되어 있지 않은 점을 참조하면 (필자는 초등, 중등, 고등 교육에서 이미 제대로된 신뢰관계를 형성할 수 없는 기제가 작용하는 것으로 판단하고 있음 --- 대표적 근거: 돈 봉투, 입시지옥, 그리고 내신성적) 사회의 전반적인 "불신 분위기"를 짐작하고도 남는다. 따라서 첨예한 이익이 걸린 상황과 상호 의사교환이 무용한 (서로 믿지 못하는) 상황하의 이기주의적 행위자를 상정한 것은 전혀 무리가 없다고 간주하였다.
그 다음, 전략적 상호작용이 반드시 두 행위자 사이에만 일어나는 것은 아니지만 분석의 편의상 현실을 단순화시켜서 일단 두 행위자의 상호 관계를 분석한 다음 현실에 그 결과를 원용할 수 있다. "성냥불" 수필은 매우 간략하고 일반적으로 작성되었으므로 구체적인 전략적 상호작용에 대한 설명은 없다. 여기서는 먼저 "정치자금"에 얽힌 상호작용의 예를 들어서 검토해보기로 하자. 사례를 구체화시키기 위해서 어떤 국회의원 선거구에서 두 정치인이 출마했다고 하자. 정치자금 상으로 두 정치인은 크게 나누어서 법이 허용하는 한도 내에서 선거자금을 모아서 쓸 수 있는 대안과 그 이상을 쓰는 대안이 있다고 단순화시킬 수 있다. 우리 나라의 예와 같이 법정 상한액 이상을 선거비용으로 사용하더라도 벌을 받지 않는 경우가 대부분이고 법정 한도액 이하를 쓰면 선거에서 질 가능성이 크다면 각 후보에게 가장 좋은 결과는 자신이 한도액 이상을 모금하여 쓰고 상대방 후보는 한도액 내에서 쓰는 것이 된다 (자신은 배신, 상대방은 협력: 몫은 T). 비슷한 방법으로 각 후보에게 주어지는 선호도는 다음과 같이 나타낼 수 있을 것이다.
T > R (상호 한도액 내에서 지출) > P (상호 한도액 이상 지출) > S (자신이 한도액 내에서 상대방이 한도액 이상 지출)
위와 같은 선호도를 두 행위자가 공히 가진다면 그 전략적 상호작용은 PD 게임에 준하는 것이다. 우리 나라의 많은 부패현상이 위와 같은 상황하에서 벌어지고 있다고 필자는 평가하였다. 일회용 게임으로서 이 문제를 해결하기 위해서 동원될 수 있는 방법은 이미 설명하였다 (대표적인 방법은 P를 S보다 낮추는 것: 한도액 이상 지출하면 무조건 실형 선고 --> 게임 구조가 바뀜). 이와 같은 상호작용의 구도는 그 자체로서는 대부분의 정치인들 각각에게는 "충분한 미래에 대한 기대"를 제공하지 못하므로 (차 차기는 없다는 식의 인식: 게임이 여러 회 반복되지 않는다는 인식) Axelrod의 TFT 처방을 적용시키기는 어려울 것이다. 따라서 이런 경우에는 제도적 장치를 강제적으로 적용시킴으로서 상호협력을 이끌어내는 처방이 주효할 것이다.
그러나 제도적 장치를 강제적으로 적용시킬 수 있는 힘을 가진 행위자 숫자는 매우 한정되어 있다. 상기한 예의 경우, 우선 생각할 수 있는 제도적 장치는 현실적인 정치자금법이나 선거법을 마련하고 행정부에서 법대로 집행하며 법을 어기는 정치인들은 사법부에서 단죄하는 장치를 생각할 수 있을 것이다. 첫 번째 단계를 검토해보면 법은 우선적으로 국회의원들이 제정하는 것인데, 부패된 사회의 국회의원들 자체가 법 제정에 있어서 "죄수의 딜레마 상황"에 빠져있을 가능성이 많다. 즉, "고양이 목에 누가 방울을 달겠는가"라는 집단행동(collective action)의 문제가 구조적으로 내재되어 있는 국회라면 대부분의 행위자가 상대방의 "협력"에 무임승차(free-riding)하려는 성향을 보일 것이다. 따라서 필자는 우리 나라와 같이 정치가 부패된 사회의 정치자금법이나 선거법은 극단적인 경우에는 국회에서 주도하는 것 보다 대통령이 주도하여 국민투표를 통하여 승인을 받는 것이 유용하다고 보는 편이다.
[필자는 "떡값"을 못 받게 규정하는 정치자금법보다는, "떡값"을 받도록 규정하는 정치자금법이 우리 나라에 시급하다고 판단한다. "떡값"의 속성상 아무리 받지 못하게 규정해도 뒷거래가 가능하기 때문이다. 따라서 오히려 현실적인 처방은 "떡값"을 받게 하고 실제 영수증 처리를 하도록 규정하며, 그 사용처도 실제 영수증을 검토하여 수입과 지출의 투명성이 확보되도록 정치자금법을 고쳐야 한다고 주장해왔다. 만약 감사나 사정의 과정에서 단 돈 만 원이라도 정치자금이나 "떡값(광범위하게는 이것도 정치자금)"을 수수하고 영수증을 발부하지 않았다든지, 지출을 했는데 영수증이 없다든지라면 그 정치인은 무조건 사법 처리되도록 하는 것이 옳다고 본다.]
"반복된 죄수의 딜레마 게임(IPD)"의 상황에 처해 있는 예로서 부조리의 시정을 원하는 우리 나라 엘리트들의 행위 유형을 들 수 있다 (여기서 엘리트는 어떤 조직에서 중요한 결정에 실질적인 영향력을 행사하는 행위자로 일단 정의한다 --- 예를 들어서 기업의 중간관리자 이상, 관료는 서기관 이상 등등의 기준을 적용할 수 있을 것이다). 일단 우리 나라의 엘리트들이 돈과 권력 문제에 있어서 합리적 행위자라는 가정은 무리 없이 할 수 있다. 현실을 단순화시키기 위해서 두 엘리트가 우리 나라의 부패상을 잘 알고 있고 그 시정을 추구하고자 하며, 다음과 같은 대안, 결과, 그리고 선호도를 가지고 있다고 모델을 설정해보자.
(대안) 부조리의 시정을 시도함 vs. 부조리를 방조함
(결과)
일방적 방조 (T: 자신은 방조, 상대방은 시정을 시도
==> 상대방이 당함)
사회개선 시도 합의 (R: 부조리 시정을 시도함을 합의)
상호방조 (P: 상호 편하게 살기로 함)
일방적 시정 시도 (S: 자신은 시정을 시도, 상대방은 방조
==> 자신이 당함)
(선호도) T > R > P > S ==> "죄수의 딜레마"의 전략적 상호작용
물론 이 모델은 사회개선은 두 엘리트가 공히 협력하여야 이루어질 가능성이 있는 것으로 가정하고 있는데, 우리의 실정을 감안하면 전혀 무리가 없다. 물론, 최고 권력자가 일시적으로 혁명적 변화나 개혁적 변화를 시도하는 것은 위의 게임 모델로서 설명할 수 없다. 이 모델은 그런 혁명적 변화나 개혁적 변화가 아닌 경우의 사회개선에 대한 우리 나라 엘리트들의 상호작용을 적절하게 재구성한 것이기 때문이다.
필자가 만나본 대부분의 엘리트들은 우리 사회에 부패가 만연되어 있고 그 시정이 시급함에는 이견이 없었다. 그럼에도 불구하고 부정부패나 불친절의 사회상을 조금씩이라도 고치자고 어떤 엘리트가 주장하면 상대방은 실제 행동으로 옮기는 점에 있어서는 대부분 부정적이었다. 옳고 바르게 살자고 주장하면 "잘못하다가는 네 목이 날아갈 수 있어"라는 말을 많이 듣는 상황인 것이다. 즉, "사회개선의 집단행동"은 상대방의 협조를 요하는데 상대방을 잘못 믿으면 오히려 큰 손해를 볼 수 있는 "집단행동의 딜레마"에 준하는 전략적 상호작용을 많은 엘리트들이 그리고 있는 것으로 필자는 파악하였다.
다음 단계로 이런 전략적 상호작용이 계속 반복되는 것인지 아닌지를 검토해야 하고, 행위자들이 "미래에 대한 충분한 기대"를 가지고 있는 것인지도 따져봐야 한다. 우리 나라의 부패 구조가 어제오늘 일이 아니었음을 감안한다면 그러한 게임이 여러 번 반복되었음을 간접적으로 확인할 수 있다. 문제는 엘리트들이 어느 정도의 할인계수를 미래에 받을 몫에 부여하였는지가 관건이 된다. 필자가 판단하기로는 현실적인 부정부패에 대해서 그 시정의 필요성을 느끼고 있는 많은 엘리트들도 주로 단기적인 이익에만 관심이 있고, 그 자식이나 손자에게 어떤 세상을 물려줄 것인지에 대한 의식이 부족했거나 사회개선에 대해서 "자포자기" 상태였음을 감안한다면 "미래의 몫에 대한 충분한 기대"가 없었던 것으로 보인다. 이런 상황하에서는 대부분의 행위자들이 일회용 "죄수의 딜레마" 게임의 균형전략인 "부조리를 방조함 (IPD에서는 AD 전략)"을 선택하는 것이 합리적 선택이다. 따라서 IPD의 구조를 가진 것은 맞지만 많은 엘리트들이 "편하게 사는" 균형전략을 택했기 때문에 우리 나라의 부패가 잘 청산되지 않는 일면이 있었다는 하나의 설명도 가능하다.
필자의 수필인 "사회개선의 조그만 성냥불"에서는 행위자들이 TFT 전략을 택하여 장기적으로 또 점진적으로 사회개선을 이룰 수도 있음을 주장하고 있다. 그런데 Axelrod의 연구에 의하면 유아독존 식으로 그 전략을 사용하면 상호협력을 이룩할 수 없고 일정한 수의 행위자가 TFT를 채택해야지만 AD가 판을 치는 세상을 좋은 의미로 "침범"할 수가 있다는 것을 알 수 있다. 따라서 필자는 TFT를 채택하는 개인주의적인 운동을 제안하여 부정부패 척결의 필요성을 느끼고 있는 엘리트들이 보다 많이 호응해줄 것을 희망하였고, 그 방식으로 "착하고 바르게 사는 것"을 제시했던 것이다. 여기서 "착하게" 산다는 것은 IPD의 첫 게임에서 "협력"을 선택하는 것을 암시하고 있다. "착하게" 산다는 것은 자기 능력을 넘어서서 남을 도와주라는 뜻이 아니고 (예를 들어서, 친척이 돈을 빌려 달라고 할 때 여유가 없으면서도 은행의 융자를 얻어주는 식의 행위는 착하기보다는 "바보 같은" 행위로 간주된다) 능력 한도 내에서 남을 도와주면서 자신이 행복감을 느끼는 것으로 정의된다. 특히 서로 잘 알지 못하는 상황에서 일단 "협력"의 대안을 선택할 것을 권하는 것으로 해석할 수 있다. "바르게 산다"는 것은 건전한 상식과 이성에 입각해서 옳은 것은 옳다고 하고 틀린 것은 틀렸다고 당당하게 얘기하는 것으로 정의된다.
그런데 여기에서 우리가 조심해서 검토해야 하는 것이 미래의 몫에 대한 기대가 높다고 하더라도 R이 충분히 크거나 혹은 P가 충분히 작지 않으면 TFT를 선택해도 별 소용이 없게 된다는 것이다 (이 점도 Axelrod의 분석에 포함되어 있다). 즉, 협력의 보상이 충분하지 않거나 배신에 대한 보복이 모자라면 (예컨대 R = P+e) 아무리 TFT를 선택하는 행위자가 많더라도, 또 미래에 대한 충분한 기대가 있더라도 상호협력(사회개선의 시도)을 이끌어내기가 어려워지는 것이다. 왜냐하면 첫 번째 게임에서 배신하는 전략(부조리 방조)이 충분히 큰 몫을 행위자에게 가져다준다면, 한 번의 T 값이 여러 회에 걸친 R 값의 합보다 더 클 수 있기 때문이다.
8. 인간의 행위와 제도적 장치
논의가 여기까지 진행되면 "닭(인간의 행위)이 먼저냐, 달걀(제도)이 먼저냐"라는 그 다음 질문에 당도하게 된다. 즉, R 값이 현재상태에서는 충분히 크지 않기 때문에 당분간은 TFT를 채택해서는 안되고 AD를 선택해서 "부조리를 방조할 수밖에 없고, R 값이 제도적으로 올라가면 그 때 TFT를 선택하면 된다"라고 주장하는 입장이 등장할 수 있다. 이런 주장을 하는 사람들은 선호도에 있어서 R이 P에 근접해 있고 T는 R보다 상당히 큰 값을 가지고 있다고 생각하는 행위자들이다. 따라서 이런 부류의 사람들이 대다수인 사회에서는 제도적으로 R과 P 값의 차이는 벌이고 T와 R 값의 차이는 줄이는 방안이 도입되면 TFT에 의한 상호협력을 이끌어내기가 쉬울 것이다.
그러나 우리 나라의 실정을 감안한다면 제도가 나빠서 상호불신과 부조리가 팽배해 있는 부분도 많지만, 제도가 제대로 되어 있어도 잘 지켜지지 않거나 제도를 강제하기 힘든 상황도 널려 있는 것으로 보인다. 정치자금법이나 선거법의 예를 보자면 법 자체는 "검은 돈"에 대해서 상당히 엄격한 규제를 명시하고 있음에도 불구하고 정치인들이 잘 지키지 않는 문제가 있다. "떡값"의 경우에는 잘 추적하기 어려운 문제도 있다. 제도는 인간의 머리로 만들어내는 것이기 때문에 항상 허점을 가지고 있고 인간은 그 허점을 이용하여 자신의 편협한 이익을 챙기려는 경향이 있는 것은 주지의 사실이다. 결국은 제도도 중요하지만 인간의 행위 양식 (개인 사이의 충돌도 포함) 자체도 중요할 수밖에 없다. 또한 제도를 만들기 위한 사전 준비 작업으로서 인간이 움직여야 하는 측면도 있는 것이다. 예컨대 많은 엘리트들이 "나는 R 값이 상당히 큰 선호도를 가지고 있어"라고 생각하면서 TFT 전략을 선택하게 되고 자신들의 장기적 이익을 더욱 더 보장받기 위해서 좀더 나은 제도를 요구할 수도 있을 것이다.
요약하자면, 상기한 사회개선 게임의 딜레마를 풀기 위해서는 부패를 시정하려는 행위자에게 충분한 보상을 주거나 혹은 이에 비협조적인 행위자에게 손실을 주는 "제도적 개선"이 일부 필요하고, 행위자들이 사회개선의 장기적 이익을 제대로 인식하여 예의 보상보복전략(TFT)을 택하는 것이 한 방법이 될 수 있음을 알 수 있다. 필자의 주장은 "제도적 개선"이 불충분하거나 점진적으로 이루어지는 와중에도 사회개선을 촉진하는 방향으로 엘리트들이 움직일 필요가 있다는 것이다. 특히 현실 권력에 직접 참여하고 있지 않는 지식인이나 사회지도층들도 앞장서서 권력 엘리트들에게 단기적인 편협한 이익을 추구할 것이 아니라 장기적으로 누적되는 몫을 추구하도록 촉구하고 자신들도 또한 모범을 보일 필요가 있다는 것이다.
일단 엘리트 중 이미 선호도가 TFT에 충분히 기대를 걸 수 있는 이들이 먼저 앞장서서 상호간의 "협동"을 이룩하고 점차 TFT를 채택하는 엘리트들이 많아지도록 유도할 수 있을 것이다. 또한 장기적으로는 부패된 사회에서 이익을 추구하는 것이 명확한 한계를 가지고 있고, 장차 제도적 장치에 의해서 부조리에 휩쓸리면 결국은 손해를 본다는 점을 더욱 많은 엘리트들이 인식하도록 그들을 설득할 수도 있을 것이다. 필자가 파악하기로는 사회개혁의 시동력이 될 수 있는 엘리트들이 이러한 장기적 계산을 하지 않으려거나, 미래에 대한 충분한 기대가 없다고 생각하는 경향이 있는 것으로 보인다. 이것은 일종의 편의주의와 패배주의로서 한 사회의 발전을 위해서 전혀 바람직하지 않은 것이다.
필자는 그런 편의주의나 패배주의는 그릇된 역사의식에 기반하고 있는 것으로 평가한다. 현 사회가 문제점이 많다면 그 사회를 후손들에게 물려주지 않을 노력을 경주하여야 하는데 게임이 마치 자기 대에서 끝나는 것으로 간주하고 부조리에 편승하거나 묵인하는 단세포적인 반응인 것이다. 우리 사회가 더욱 발전된 모습을 보일 때 그런 단세포적인 행위자들은 앞장서서 부정을 저지르는 이들과 함께 결국은 도태될 것이다. 그렇게 되지 않으면 우리 사회는 희망이 없는 사회가 될 수밖에 없다. 어쩌면 우리 사회 자체가 망하는 지경에 이를지도 모른다. 사회 전체가 망하면 엘리트의 이익은 당연히 없어지는 것과 마찬가지이다. 따라서 사회를 개선하는 작업은 "이타적"인 행위를 요하는 것이 아니고 각자의 "이기심"에 의한 기준에서도 필요하다는 사실을 널리 각성시켜야 한다고 본다.
그러나 현재와 같이 이미 딜레마 상황에 빠져있을 때는 그 딜레마를 깨기가 매우 힘든 것이 사실이다. 누구든지 어느 집단이든지 먼저 시작해야지만 이론에서 논의되었듯이 부패의 전략(AD)이 판을 치고 있는 상황을 "침범"할 수 있는데 그 시작이 무척 어려운 것이다. 게임 외적 상황으로 AD를 채택하고 있는 행위자들이나 혹은 아예 사회개선을 선호하지 않는 (P > R) 이들이 "착하고 바르게" 살고자 하는 행위자의 기를 꺾으려는 경우를 생각해 볼 수 있다. 예를 들어서 선생님들이 돈 봉투를 받는 경우를 살펴보면, 신참 선생님이 돈 봉투를 받지 않으려고 해도 주위의 선생님들이 "혼자서만 잘난 척 하는 것"이라고 핀잔을 준다든지, 교장 선생님이 불이익을 줄 수 있음을 내비치면서 은근히 상납을 요구한다든지 하여 결국은 돈 봉투를 받게되는 식이다. 이런 구도를 깨어야 한다는 것이 필자의 주장이다. 이 구도를 깨기 위해서 초기에는 사회개선을 향하는 "돈키호테"와 같은 행위들을 최소한 좌절시키지 말고 격려해줄 수 있어야 한다. 우리 사회가 부조리의 나락에서 빠져나오자고 주장하는데도 불구하고 오히려 그 시도를 도와주지는 못할 망정 좌절시키려는 태도는 같이 망하자는 것과 마찬가지이다. 물론 제도개선에도 힘을 쏟아야겠지만, 결국 인간의 행위도 제도와 더불어서 같이 나아가야 함을 잊어서는 안되겠다.
9. "성냥불"과 사회개선
다른 조건이 비슷하다면 TFT를 채택하는 엘리트의 숫자가 커질수록 사회개선의 가능성이 높아지므로 필자는 그에 준해서 후진양성에 힘쓰고자 한다. 즉 앞으로 엘리트가 될 가능성이 큰 필자의 학생들이 후일 사회에 진출하여 TFT에 준하여 "착하고 바르게" 살도록 그 불씨를 살려놓자는 것이다. 그 불씨들이 "사회개선의 성냥불"이며 먼 훗날 "들불"을 일으킬 행위자들이 되어야 한다는 것이다. 이런 작업은 단 시일에 될 수 있는 것이 아니고 적어도 몇 십 년의 장기적인 안목으로 추진되어야 할 것이다. 그 중간에 "성냥불"의 숫자도 늘어날 것이고, 또 그들이 충분히 보상을 받는 제도적 개선도 덩달아서 이루어질 것으로 필자는 추정하고 있다.
TFT 전략을 응용하여 광의로 해석하면 우리 사회의 문제가 있는 여러 분야에 이용할 수도 있다. 상대방이 좋은 방향으로 나에게 협조하려 하면 상(보상)을 주고, 나를 기만하려면 협조하지 않거나 벌(보복)을 주는 식으로 TFT를 해석할 수도 있다. 우리 사회에 전반적으로 문제가 되어 있는 서비스 업계의 불친절은 어떻게 보면 우리들 자신들이 그 만큼 보상보복을 하지 않았기 때문에 고질적인 문제로 남아 있는 측면이 있다. 외국의 경우 팁을 주는 제도가 전형적인 TFT이다. 즉, 서비스가 좋으면 팁을 많이 주고 서비스가 나쁘면 극단적인 경우에는 팁을 주지 않는 식의 보상보복이 제도화되어 있는 것이다.
우리 나라의 실정을 감안하면 외국과 같이 팁 제도를 도입하기는 당분간 어려울 것으로 보인다 (일부 고급 식당에 도입된 팁 제도는 전혀 보상보복의 역할을 못하고 있다). 팁 제도가 없다고 해서 서비스 업계의 불친절을 시정하지 못하는 것은 아니다. 우리 나라 사람들은 어떤 불이익을 당해도 귀찮아서 말을 잘 하지 않으려는 경우가 허다하다. 필자가 직접 경험한 예를 들자면, 사회 지도층 급의 지식인 약 10 명과 같이 저녁 식사를 하는데 종업원이 매우 불친절해도 아무도 시정을 요구하는 이가 없어서 깜짝 놀란 적이 있다. 결국은 필자가 그 종업원의 잘못을 지적하고 시정할 것을 요구했는데, 같이 있었던 몇 몇 분들로부터 "우리 나라는 다 그래, 혹은 아직 우리 나라에 적응이 덜 됐군"이라는 얘기를 필자는 들었던 것이다. 이런 식으로 "포기"한다면 서비스업의 불친절은 시정하기가 어려워진다.
잘못된 서비스는 벌을 주고 잘된 서비스는 상을 주는 식의 전략이 일반화되어야 손님과 종업원의 협력관계가 촉진될 것이다. 필자는 가끔 고객카드제를 이용하여 서비스가 좋은 종업원은 우수 고객으로 추천하고, 서비스가 두드러지게 나쁜 종업원의 경우는 시정을 요구하는 식의 "보상보복"을 해왔다. 즉, 잘된 부분은 보다 더 확대시키고 잘못된 부분은 축소시키는 그런 관행이 굳어져야지만 서비스 업계의 불친절 문제는 근본적인 시정이 이루어질 것이다. 이를 위해서는 보다 더 많은 시민들이 "입을 열" 필요가 있다 (보상의 경우와는 달리 시정을 요구할 때는 싸움이 되지 않도록 특별히 조심해야 함은 물론이다).
교수라는 직업도 일종의 서비스업임을 감안한다면 학생들에 의한 "보상보복"도 교수의 서비스 질을 높이기 위한 부분적인 방안으로 대두될 수 있다. 지금 현재 학생들에 의한 교수평가를 실시하지 않는 학교들이 많음을 감안한다면, 또한 교수-학생의 특수한 관계를 감안한다면(학점과 학위와 연관된 권력관계), 학생들의 입장에서는 "보상"이 더 적절한 전략이 될 것이다. 즉, 상대적으로 비교하여 보다 더 나은 서비스를 제공하는 교수가 있다면 그 교수를 고무시키는 방안을 찾아보는 것도 한 방법이다. 우리 나라에도 장기적으로는 미국과 같이 학생들이 서비스가 좋지 않은 경우에는 부분적으로 (학생의 평가에 의한 보상보복은 부분적일 수밖에 없음) 벌을 줄 수 있는 제도도 확립될 것으로 필자는 예상하고 있다.
결론적으로 TFT 전략은 이기주의라는 게임 구도 자체가 변하지 않아도 (제도적 개선이 미비하거나 진행중이더라도) "상호협동"의 딜레마를 깰 수 있는 유효한 방법임이 이론적으로 뒷받침되어 있고, 앞에서 논의한 바와 같이 우리 사회의 개선을 위해서 채택할만한 충분한 가치가 있는 전략이다. 그 전략이 현실에서 사회개선의 효과를 나타내기 위해서는 일정한 수의 착하고 바르게 사는 "성냥불(TFT 행위자)"들이 부패한 현 사회를 후손에게 물려주지 않겠다는 의식을 가짐과 동시에 장기적으로는 부패한 사람들보다 더 많은 이익을 가질 것이라는 (혹은, 부패한 사람들이 결국 손해를 볼 것이라는) 미래에 대한 충분한 기대를 가지고 있어야 한다. 필자는 장차 그런 "성냥불"들이 대접받는 시대가 반드시 도래한다고 믿는 편이다. 왜냐하면 부정으로 돈을 버는 행위자들은 갈수록 "당할" 가능성이 커지고 명분 싸움에서 밀릴 수밖에 없을 것이기 때문이다.
'형설지공 > 경제경영' 카테고리의 다른 글
정보이론 (0) | 2001.01.26 |
---|---|
게임이론의 정의 (0) | 2001.01.26 |
[2000.12]2000년 상반기 기업경영분석 결과 (0) | 2001.01.25 |
[2000.12]2000년 세계경제 동향과 2001년 전망 (0) | 2001.01.25 |
[2000.12]최근 설비투자의 행태변화 분석 (0) | 2001.01.25 |