1. 게임이론이란 무엇인가?
게임(game)은 우리만로 '놀이, 오락, 경기' 등의 의미를 갖는다. 흔히 보는 게임에는 놀이판 위에서 하는 바둑이나 장기, 카드를 갖고 하는 포커(poker)나 화투, 컴퓨터를 상대로 하는 각종 전자오락, 그리고 경기장에서 하는 야구, 축구, 테니스, 수영 등이 있다.
이들 가운데 어떤 것들은 서로 상관이 없어 보임에도 불구하고 게임이라는 동일 범주 안에 분류되는데, 그것은 상호간에 공통점이 있기 때문이다. 그러한 공통점으로는 첫째 모든 게임은 나름대로의 규칙(rule) 아래에서 진행된다는 것이다. 우선 규칙은 게임의 주체가 되는 경기자(player) 혹은 팀의 구성을 규정하며, 선수들이 어떠한 순서(order)로 게임을 할 것인가도 규정한다. 규칙에 따라 선수들이 택해도 좋은 행동과 택해서는 안 되는 행동이 정해져 있다. 이에 따라 반칙을 범했을 경우(즉, 규칙에 어긋나는 행동을 했을 때)에는 벌점을 받거나 그 정도가 심하면 경기를 계속할 수 없도록 퇴장당하기도 한다. 두 번째 공통점은 전략(strategy)의 중요성이다. 전략에는 좋은 전략이 있는 반면 잘못된 전략이 있다. 어떤 선수나 팀이 잘못된 전략을 계속해서 사용할 경우에는 게임에 지게 된다. 게임이론의 중요한 역할 중 하나는 어떤 전략이 좋은 것이고 어떤 전략이 잘못된 전략인지를 가려내는 데 있다. 셋째, 모든 게임에는 최종적인 결과(outcome)가 있다. 운동경기의 경우에는 우리편이 이기든가 상대편이 이기든가 혹은 비기든가 셋 중 하나의 결과가 최종적으로 실현된다. 넷째, 게임의 결과는 전략적 상호작용(strategic interaction)에 의하여 결정된다. 바둑에서 내가 아무리 악수(惡手)를 많이 둔다고 하더라도 상대방이 악수를 더 많이 두면 승리는 내 것이 될 수 있다. 반대로 내가 아무리 훌륭한 전략을 쓴다 하더라도 상대방이 나를 능가하는 전략을 쓴다면 나는 게임에서 지게 되는 것이다.
일반적으로 게임이라고 불리지는 않으나 위의 공통점을 모두 만족하는 현상들이 많이 있다. 과점시장에서 영업하는 기업들간의 경쟁은 그 좋은 예이다. 경쟁의 주체는 개별기업이다. 각 기업에는 정관, 채권채무관계, 지분 및 소유권, 정부규제를 포함하여 회사운영과 경쟁을 규정짓는 규칙이 있다. 이 규칙을 어길 경우 벌금을 물거나 처벌을 받게 되며, 심한 경우 경영진교체, 부도 등 최악의 상황에 몰릴 수도 있다. 기업들간의 경쟁에 있어서 생산량 결정, 가격 책정, TV광고 여부 등 각종 의사결정에 따르는 전략의 수립은 매우 중요하다. 끝으로 우리 회사가 얼마의 매출액과 순이익을 남기느냐 하는 결과는 우리 회사가 택한 전략과 경쟁회사들이 택한 전략의 상호작용에 의하여 결정된다. 결국 과점기업기간의 경쟁은 규칙, 전략, 결과, 전략적 상호작용이라는 게임의 필수요건을 모두 갖추고 있으며, 따라서 경제학자들은 과점기업들간의 경쟁을 게임이라고 본다. 투자와 운영을 위하여 필요한 자금 중 얼마를 부채로 조달하고 얼마를 주식발행이나 사내유보금으로 충당할 것인가, 내부거래를 어느 정도로 조절하여야 공정거래위원회의 눈을 피하면서 기업집단의 이익을 극대화할 수 있을 것인가, 정부의 구조조정 압력에 어떻게 대응할 것인가 등은 우리 나라의 대기업이 직면하는 전형적인 게임 상황이다.
노사간 임금협상도 게임의 대표적인 예이다. 협상의 주체는 노동조합과 사용자이다. 임금협상의 과정에는 법률적, 사회적으로 정한 규칙이 있으며, 노동자와 사용자는 모두 정해진 범위 내의 행동만을 선택하도록 요구된다. 물론 규칙을 어기고 불법적 행동을 취할 경우 받게 될 불이익도 명시된다. 노동자는 임금인상요구안, 태업, 차업 등 각종 전략을 적절히 사용하거나 혹은 사용하겠다고 위협하여 자신의 이익을 최대한 관철시키고자 한다. 반면에 사용자는 임금인상안, 비임금혜택의 약속 등의 전략을 적절히 사용하여 자신의 이익을 극대화하려 할 것이다. 노동자의 전략과 사용자의 전략이 상호작용하여 조업중단, 임금동결, 소폭인상, 대폭인상 등 가능한 결과 중 하나가 실현된다.
이 같은 예를 확장시켜 생각해 볼 때 우리는 일상생활에서 의식적이든 무의식적이든 게임의 상황에 참여하고 있으며 인간의 사회적 행태와 경제사회의 현상을 파악하는 데 게임을 이해하는 것이 중요하다는 것을 알 수 있다. 게임을 이해하기 위해서 게임의 특징을 체계화시킨 것이 게임이론(game thoery)이다. 구체적으로 게임이론은 전략적 상호작용이 존재하는 게임의 상황에서 개인의 전략 또는 행동이 초래하게 될 결과 중 가장 바람직한 결과를 얻기 위하여 어떠한 전략을 선택해야 할 것인가를 제시하는 실용적인 기여도 할 수 있다. 단순한 예로 서울시내 어느 주차장의 지배인이 총수입을 두 배로 늘리기 위한 전략으로 주차료를 두 배로 올리는 것은 매우 잘못된 전략이라 할 수 있다. 주위의 다른 대형주차장들이 덩달아 주차료를 두 배로 올리지 않거나 혹은 기존의 고객 중 일부가 주차료를 두 배로 내는 대신 대중교통수단을 이용한다면 이 주차장 지배인의 전략으로는 기대했던 목표를 결코 달성할 수 없을 것이기 때문이다.
2. 게임이론의 역사
게임이론은 쿠르노(Cournot, 1838), 버틀란드(Bertland, 1883)등의 학자에 의하여 시작되었다. 이들은 과점분야에서 기업이 어떻게 생산량 및 가격을 결정하는가 하는 문제에 초점을 맞추어 분석한 것이나, 아주 특수한 경우에 국한된 모형으로서 이를 게임이론의 일반적 시초로 보기에는 문제가 있다.
현대적 게임이론의 역사는 대략 반 세기 전으로 거슬러 올라간다. 헝가리 출신의 유태인 천재 이론물리학자 폰 노이만(John Von Neumann)과 오스트리아 출신의 경제학자 모르겐슈타인(Oskar Morgenstern)이 1944년 출간한 '게임의 이론과 경제적 형태'(Theory of Games and Economic Behavior)에서 찾아 볼 수있다. 사실 이 저작이 출판되기 훨씬 전에 폰 노이만은 게임의 정의와 해의 개념을 수학적으로 정립했다는 신빙성있는 근거가 있다. 이 책에는 경제학의 많은 분야를 게임이론으로 접근하였으며, 전략적 게임과 확장형 게임으로 분류하여 표현하였고, MINIMAX라는 개념을 정의하였으며, 모든 2인형 제로섬 게임에서 MINIMAX의 해가 존재함을 증명하는 증의 내용이 수록되어 있다.또한 2인 게임에서 출발하여 여러 명이 하는 게임을 체계적으로 확장시켜 분석하였다. 그리고 이 책은 기대효용이론(expected utility theory)을 분석한 책으로도 잘 알려져 있다.
그 후 1950년에는 내쉬(Nash)가 협상(bargaining)이론에 관한 협조적 모형을 발표하였는데, 이는 사전에 선수들이 구속력 있는 협약을 맺고 하는 게임이다. 이는 몇 개의 공리를 이용하여 다수의 결과 중 관심 있는 결과를 하나만 가려냈다 하여 공리적(axiomatic)모형이라고도 한다. 이어 내쉬는 비협조적 게임을 위한 균형이론을 발전시켰는데, 이것이 유명한 내쉬균형이론이다. 내쉬균형은 각 선수들의 전략이 상대가 사용할 것이라고 예측한 전략에 대하여 최선의 전략이 되어야 하며, 또한 상대방에 대한 예측이 들어맞아야 한다는 두 가지 특성을 지니고 있다. 따라서 내쉬균형 상태에서는 어느 한 쪽도 독자적으로 균형전략으로부터 이탈한 유인이 없게 된다.
과점 모형에서 흔히 분석하는 쿠르노 모형이나 버틀란드모형은 크게 보면 내쉬균형의 특수한 형태로서 단지 생산량 및 가격을 결정하는 단순한 모형이다. 그러나 내쉬균형은 향후 일어날 상황에 따른 전략 의 선택에 대해서는 취약한 약점이 있다. 예컨대, 만약 오늘 상대방 기업이 가격을 내린다면, 내일 나도 가격을 내리겠다는 전략을 분석하는 데는 미약하다. 즉, 상황에 따른 행동(contingent action)은 주로 다단계 게임(multi stage game)에서 많이 나타나는데, 이를 위해서는 확장형 형태의 게임에 대한 분석이 필요하게 되고 이러한 형태의 게임에 관한 분석이 필요하게 되고 , 이러한 형태의 게임에서는 새로운 개념이 필요하게 되었다.
젤튼(Selten, 1965)과 하샤니(Harsanyi, 1967~1968)는 이러한 확장형 게임에 필요한 새로운 개념을 많이 고안해 냈는데, 이는 내쉬균형의 문제점에서부터 출발하였다. 젤튼은 내쉬균형에서는 거짓 협박이 가능하다는 비판에서부터 출발하였다. 즉, 어떤 경쟁회사가 가격을 내린다면 우리는 무료로 물건을 팔겠다고 협박하는 것이다. 이러한 협박은 상화에 따라 신뢰성이 없는 협박이 될 가능성이 높다. 왜냐하면, 상대가 실제로 가격을 내린 경우가 발생하였다며, 그 상황에서는 무료로 주는 것이 합리적이 아니기 때문이다. 이러한 신뢰성이 있는 협박 여부를 고려한 부분게임 완전균형이라는 새로운 균형개념을 도입하여 이 문제를 풀려고 시도하였다.
하샤니는 기본적인 게임에 선수들이 상대방 보상(payoff)을 모르는 경우를 가정한 게임을 분석하였다. 이를 불완전정보하의 게임이라고 하는데, 하샤니는 베이지안 내쉬균형개념을 도입하여 해결함으로 이 분야의 시금석이 되었다. 따라서 내쉬균형개념도 불완전정보하의 게임에서 사용될 수 있게 됨으로써 게임이론은 급속한 진전을 보게 되었다. 즉 메커니즘 디자인라든지 비선형 가겨차별, 최적 경매, 공공쟁에서 선호를 나타내는 문제, 그리고 협상모형 등에 활용되고 있다. 그러나 게임이 불완전정보하의 동적인 게임인 경우에는 역시 거짓협박의 문제점이 있게 되어 이를 해결하기 위한 새로운 개념들이 1980년대에 많이 등장하게 되었다. 그 예로서 완전균형(perfect equilibrium), 축자적 균형(sequential equilibrium) 등이 있으며, 이와 같은 개념은 신호모형 및 약탈가격등에 많이 활용되고 있다. 이 밖에도 평판효과(reputation effect)라는 개념이 불완전정보하의 게임에 활용되고 있다.
그러나 아직도 내쉬균형이론의 두 가지 문제가 있다.
ㄱ. 균형의 결과가 바람직한 답이 아닌 경우가 종종 등장한다. 죄수의 딜레마게임의 경우가 그 예이다.
ㄴ. 다수 또는 무한히 많은 균형이 나타나는 경우가 있다. 예를 들어, 내쉬의 협상게임에서도 무수히 많은 균형이 존재하는 데, 내쉬는 공리적 접근방법에 의해 다수의 해 중 바람직한 해를 골라냈다.
그러나 왜 공리를 따라야 하는가 하는 근본적인 문제가 발생한다. 이러한 문제의 해답으로서 셸링(Schelling)은 1960년 '관심의 초점'으로서 설명하려고 했다. 관심의 초점이란 게임 당사자들이 다수의 해 중 하나를 선택하는 데 무언의 합의를 갖게 되는데, 이는 서로 관심이 한 곳으로 모이게 되기 때문이라는 이론이다. 왜, 어떤 경우에 이런 일치가 일어날 수 있는가 하는 문제는 완전히 설명하지 않으나, 문화적.정치적 또는 관습에 의해 일부 설명된다.
3.게임의 종류
ㄱ. 협조적 게임과 비협조적 게임
협조적 게임(cooperative game) : 게임을 하기 이전의 게임에 참여하는 선수들이 완전히 구속력 있는 협약 (full and binding agreement)을 맺고 하는 게임
비협조적 게임(noncooperative game) : 서로가 사전에 어떤 구속력 있는 협약이 없이 , 선수들이 주어진 전략집합하에서 자시의 효용을 극대화하기 위해 합리적으로 자신의 최선의 전략을 찾으려는 형태의 게임
ㄴ. 정적 게임과 동적 게임
정적 게임(one stage game) : 각 선수들이 한 번에 전략을 선택한 후 게임이 끝나는 경우
동적 게임(multi-stage game) : 각 선수가 전략을 선택한 후 (일부 선수만 전략을 선택하는 경우도 포함) 그 결과를 본 후 다시 전략을 선택하는 과정을 수회에 걸쳐 행한 후에 나타난 결과에 따라 보상을 받는 경우
반복 게임(repeated game) : 동적 게임 중 동일한 게임을 여러 번 반복하는 경우
ㄷ. 전략형 게임과 확장형 게임
전략형 게임(strategic-form game) : 정적인 게임의 분석에 적합한 형태로서 게임에 참여하는 선수들, 선수들이 택한 결과로서 각 선수들이 얻는 보상으로 구성된다. 이는 전략이 중심이 되는 게임형태로서 이를 정상형 게임(normal-form game)이라고도 한다.
확장형 게임(extensive-form game) : 동적 게임 분석에 유용하게 활용되는 형태로서 게임의 진행과정, 즉 선수들이 선택한 전략을 알아보기 쉽게 표현되어 있다. 즉 첫번째에 상대가 무엇을 선택했는지, 또한 나느 무엇을 선택했는지를 표시하고 그 표시된 상태에서 다시 두 번째에는 무엇을 택했는지 하는 과정을 생생하게 알아볼 수 있도록 표시한 게임이다.
ㄹ. 완전정보게임과 불완전정보게임
완전정보게임(complete information game) : 선수, 전략집하브 전략에 따른 보상 등 각 선수에 관한 사항을 모두 알고 시작하는 게임
불완전정보게임(incomplete information game) : 이러한 사항 중 적어도 하나는 모르는 경우의 게임
비대칭정보게이(asymmetric information game) : 한 쪽은 상대의 정보를 모두 알고 있으나, 다른 쪽은 상대의 정보를 일부 모르는 경우의 게임
ㅁ. 제로섬게임과 비제로섬게임
제로섬게임(zero-sum game) : 각 선수가 어떤 전략을 택하든지 그 결과로서 나타나는 보상의 합이 영이 되는 경우의 게임
비제로섬게임(non-zero game) : 제로섬게임이 아닌 모든 경우.
--------------------------------------------------------------------------------
완전정보하의 정적 게임
1. 게임의 균형
1.1 우월전략(Dominant Strtegy)
상대방이 어떤 전략을 선택하는 지에 관계없이 자신의 보수를 더 크게 만드는 전략.
1.2 내쉬균형(Nash Equilibrium)
각 경기자가 상대방의 전략을 주어진 것으로 보고 자센이게 최적전략을 선택할 때 이 최적 전략의 짝을 내쉬균형이라고 한다.
1) 내쉬균형의 특성
ㄱ. 선수들은 주어진 상황에서 최선의 대응전략을 택한다고 특성은 지닌다.
ㄴ. 자기예상실현의 특성을 지니고 있다. 즉, 상대방이 택할 전략을 예측할 수 있으며, 이 예측대로 상대가 선택한다는 것이다.
* 정리
(1) 열등전략은 결코 내쉬균형전략이 될 수 없다.
(2) 반복적 열등전략 삭제에 의해 구한 균형은 내쉬균형이다.
EXAMPLE : prisoners' Dilemma
두 명의 공범자 1, 1를 형사가 검거했다. 그러나 그 형사는 심증만 있는 상태라서 범인들의 자백이 없이는 기소가 불가능하다. 그러자 이 형사는 다음과 같은 방법을 생각해 냈다. 각각 피의자를 독방에 격리기켜 놓고 다음과 같은 사항을 알려 주었다. "만약 당신이 자백을 하니 않았는데 다른 한 명이 자백을 하면 자백한 사람은 특전으로 풀려나나 당신은 10년의 징역을 살게 됩니다. 반대로 당신만이 자백을 하게 되면 당신이 특전의 혜택을 받게 됩니다. 만약 둘이 다 자백하는 경우에는 각각 5년형을 언도 받을것이며, 둘 다 자백을 하지 않으면 각각 1년형을 언도 받게 될 것입니다."
이를 normal form으로 표현하면 다음과 같다.
위 상황에서 1과 2는 각각 confess하는 것이 Domanant Strategy이다. 따라서 (C,C)는 Dominant Strategy Equilibrium이 된다. 그 결과 두 용의자는 모두 5년씩 징역을 살게 된다.
이 결과를 살펴보면, 서로에게 불만족한 해를 얻는다는 문제를 발견할 수 있는데, 그것은 둘이 다 not confess하면 1년씩만 징역을 살면 되는데 두사람에게 서로 좋은 결과를 마다하고 5년 징역을 살게 되는 것이 최선의 대응이라는 결과가 나오는 까닭에 딜레마이다.
그러나 믿는다는 것이 말로만 형성되는 것이 아니고 확실한 보장이 있어야만 가능하다. 이러한 딜레마는 개인의 합리성(individual rationality)과 집단의 합리성(collective rationality) 차이에 의해 생긴다. 즉 파레토 효율이 아닌 것이다.
1.3 내쉬 혼합전략균형
1) 순수전략과 혼합전략
순수전략(pure strategy) : 일어날 개연성이 있는 모든 경우에 대해서 해당 경기자가 취할 행동의 완전한 계획(complete contingent plan)으로 정의 된다.
혼합전략(mixed strategy) : 경기자가 여러 개의 행동 가운데 하나를 선택하되 주어진 확률분포에 따라 임의로 택하는 것을 뜻한다.
2) 혼합전략으로서의 균형개념
위에서 언급한 것 처럼 혼합전략의 정의는 여러 가지 순수전략을 확률로써 혼합하여 사용하는 전략이다. 그러면 왜 혼합전략을 사용하는가 혼합전략을 사용할 조건은 무엇인가 하는 질문에 어느 정도 이해사 있어야만 혼합전략을 찾을 수 있게 된다.
먼저 어떤 선수가 혼합전략을 사용할 경우에는 몇 가지 순수전략을 선택하여 그 순수전략을 각각 확률로써 선택하게 된다. 이 경우 열등전략은 아무리 작은 확률 이라도 선택되어서는 안된다. 왜냐 하면, 만약 확률로써 그 열등전략이 나오게 되면 그 선수는 최선의 전략을 택한 것이 아니기 때문이다. 따라서 혼합전략의 대상이 되는 순수전략 각각은 열등전략이 아니어야 한다.
둘째로는 각각의 순수전략이 선수의 입장에서는 동등한 보상을 주어야 한다. 만약 어떤 순수전략이 선수에게 보상(기대보상)을 더 준다면 혼합전략이나 다른 순수전략을 택하는 대신 바로 그 순수전략을 택하는 것이 최선이기 때문이다. 따라서 혼합전략을 선수가 택한다는 것은 동일한 보상을 주는 순수전략들의 확률을 결정하는 것이라고 볼 수 있다.
그러면 왜 동일한 보상을 주는 데 꼭 혼합전략을 사용하여야 하는냐 하는 문제가 생기게 된다. 동일한 보상이므로 아무 전략이나 사용하여도 문제가 되지 않는가 하고 반문할 수 있다. 그 해답이 바로 이 균형의 묘미다. 동일한 보상하에서 적절한 확률로 전략을 택하여야 균형을 얻을 수 있기 때문이다.
만약 동일하다고 아무 전략이나 택한다면(동일한 보상을 주는 전략 중) 상대방은 이에 대한 최선의 전략을 택하기 때문에 이 경우 자신이 택한 전략이 이제는 최선이 되지 않는 경우가 발생한다. 따라서 균형이 되기 위해서는 동일한 보상 중 적절한 것을 택하여야 상대가 그에 대한 최선의 선택을 하더라도 자신의 전략을 바꾸지 않아도 되 그런 확률이 있게 된다.
이것이 혼합전략으로서의 균형개념이다. 오로지 균형상태에서만 보상이 동일해지기 때문에 그 균형을 유지하지 않는 다른 상태가 되면 순수전략의 보상이 동일해지지 않는다. 따라서 혼합전략으로서 균형이 깨져 버린다.
3) 혼합전략 찾는 방법
ㄱ. 열등 전략을 계속 반복하여 삭제
ㄴ. 서로 상대방이 어느 순수전략을 택하든 보상이 동일해지도록 확률을 설정
2. 내쉬균형의 존재, 다중성 및 파레토 효율성
2.1 내쉬균형의 존재정리
1) 정리 1 : 모든 유한한 전략형 게임은 내쉬균형을 가진다.(Nash. 1951)
2) 정리 2 : 모든 선수들의 순수전략집합이 밀집(compact)되어 있고, 선수들의 보상함수가 순수전략에 대해 연속적일 경우 내쉬균형은 존재한다. (Dasgupta and Maskin, 1986)
2.2 내쉬균형의 약점
1)균형의 다중성 문제 -내쉬균형이 유일한 경우가 아닌 여러 개 있는 경우로서 이를 균형의 다중성 문제라고 한다.
2) 내쉬균형이 파레토효율적이 아닐 수도 있다는 점이다. 먼저 파레토 효율의 정의를 간략하게 살펴보면 어느 일방을 해치지 않고 서로가 좋아질 수 없는 상태에 있을 때 이를 파레토 효율이라고 한다.
위 example 죄수 딜레마의 그림에서 보면 내쉬균형은 (C,C)로서 (-5,-5)를 얻는다. 그러나 이러한 결과는 (NC,NC)의 경우보다 서로에게 나쁘며, 따라서 파레토 비효율적인 것이 되는 경우이다.그러나 일반적으로 균형이 여러 개 있는 경우에 파레토 효율적인 균형이 선택될 가능성이 높으며 이것도 일종의 관심의 초점으로 해석될 수 있다.
* 정리
1) 내쉬균형은 반드시 파레토 효율이 아니다.
2) 우월전략균형은 내쉬균형이다. (역도 성립)
3) 우월전략균형은 반드시 파레토 효율이 아니다.
게임(game)은 우리만로 '놀이, 오락, 경기' 등의 의미를 갖는다. 흔히 보는 게임에는 놀이판 위에서 하는 바둑이나 장기, 카드를 갖고 하는 포커(poker)나 화투, 컴퓨터를 상대로 하는 각종 전자오락, 그리고 경기장에서 하는 야구, 축구, 테니스, 수영 등이 있다.
이들 가운데 어떤 것들은 서로 상관이 없어 보임에도 불구하고 게임이라는 동일 범주 안에 분류되는데, 그것은 상호간에 공통점이 있기 때문이다. 그러한 공통점으로는 첫째 모든 게임은 나름대로의 규칙(rule) 아래에서 진행된다는 것이다. 우선 규칙은 게임의 주체가 되는 경기자(player) 혹은 팀의 구성을 규정하며, 선수들이 어떠한 순서(order)로 게임을 할 것인가도 규정한다. 규칙에 따라 선수들이 택해도 좋은 행동과 택해서는 안 되는 행동이 정해져 있다. 이에 따라 반칙을 범했을 경우(즉, 규칙에 어긋나는 행동을 했을 때)에는 벌점을 받거나 그 정도가 심하면 경기를 계속할 수 없도록 퇴장당하기도 한다. 두 번째 공통점은 전략(strategy)의 중요성이다. 전략에는 좋은 전략이 있는 반면 잘못된 전략이 있다. 어떤 선수나 팀이 잘못된 전략을 계속해서 사용할 경우에는 게임에 지게 된다. 게임이론의 중요한 역할 중 하나는 어떤 전략이 좋은 것이고 어떤 전략이 잘못된 전략인지를 가려내는 데 있다. 셋째, 모든 게임에는 최종적인 결과(outcome)가 있다. 운동경기의 경우에는 우리편이 이기든가 상대편이 이기든가 혹은 비기든가 셋 중 하나의 결과가 최종적으로 실현된다. 넷째, 게임의 결과는 전략적 상호작용(strategic interaction)에 의하여 결정된다. 바둑에서 내가 아무리 악수(惡手)를 많이 둔다고 하더라도 상대방이 악수를 더 많이 두면 승리는 내 것이 될 수 있다. 반대로 내가 아무리 훌륭한 전략을 쓴다 하더라도 상대방이 나를 능가하는 전략을 쓴다면 나는 게임에서 지게 되는 것이다.
일반적으로 게임이라고 불리지는 않으나 위의 공통점을 모두 만족하는 현상들이 많이 있다. 과점시장에서 영업하는 기업들간의 경쟁은 그 좋은 예이다. 경쟁의 주체는 개별기업이다. 각 기업에는 정관, 채권채무관계, 지분 및 소유권, 정부규제를 포함하여 회사운영과 경쟁을 규정짓는 규칙이 있다. 이 규칙을 어길 경우 벌금을 물거나 처벌을 받게 되며, 심한 경우 경영진교체, 부도 등 최악의 상황에 몰릴 수도 있다. 기업들간의 경쟁에 있어서 생산량 결정, 가격 책정, TV광고 여부 등 각종 의사결정에 따르는 전략의 수립은 매우 중요하다. 끝으로 우리 회사가 얼마의 매출액과 순이익을 남기느냐 하는 결과는 우리 회사가 택한 전략과 경쟁회사들이 택한 전략의 상호작용에 의하여 결정된다. 결국 과점기업기간의 경쟁은 규칙, 전략, 결과, 전략적 상호작용이라는 게임의 필수요건을 모두 갖추고 있으며, 따라서 경제학자들은 과점기업들간의 경쟁을 게임이라고 본다. 투자와 운영을 위하여 필요한 자금 중 얼마를 부채로 조달하고 얼마를 주식발행이나 사내유보금으로 충당할 것인가, 내부거래를 어느 정도로 조절하여야 공정거래위원회의 눈을 피하면서 기업집단의 이익을 극대화할 수 있을 것인가, 정부의 구조조정 압력에 어떻게 대응할 것인가 등은 우리 나라의 대기업이 직면하는 전형적인 게임 상황이다.
노사간 임금협상도 게임의 대표적인 예이다. 협상의 주체는 노동조합과 사용자이다. 임금협상의 과정에는 법률적, 사회적으로 정한 규칙이 있으며, 노동자와 사용자는 모두 정해진 범위 내의 행동만을 선택하도록 요구된다. 물론 규칙을 어기고 불법적 행동을 취할 경우 받게 될 불이익도 명시된다. 노동자는 임금인상요구안, 태업, 차업 등 각종 전략을 적절히 사용하거나 혹은 사용하겠다고 위협하여 자신의 이익을 최대한 관철시키고자 한다. 반면에 사용자는 임금인상안, 비임금혜택의 약속 등의 전략을 적절히 사용하여 자신의 이익을 극대화하려 할 것이다. 노동자의 전략과 사용자의 전략이 상호작용하여 조업중단, 임금동결, 소폭인상, 대폭인상 등 가능한 결과 중 하나가 실현된다.
이 같은 예를 확장시켜 생각해 볼 때 우리는 일상생활에서 의식적이든 무의식적이든 게임의 상황에 참여하고 있으며 인간의 사회적 행태와 경제사회의 현상을 파악하는 데 게임을 이해하는 것이 중요하다는 것을 알 수 있다. 게임을 이해하기 위해서 게임의 특징을 체계화시킨 것이 게임이론(game thoery)이다. 구체적으로 게임이론은 전략적 상호작용이 존재하는 게임의 상황에서 개인의 전략 또는 행동이 초래하게 될 결과 중 가장 바람직한 결과를 얻기 위하여 어떠한 전략을 선택해야 할 것인가를 제시하는 실용적인 기여도 할 수 있다. 단순한 예로 서울시내 어느 주차장의 지배인이 총수입을 두 배로 늘리기 위한 전략으로 주차료를 두 배로 올리는 것은 매우 잘못된 전략이라 할 수 있다. 주위의 다른 대형주차장들이 덩달아 주차료를 두 배로 올리지 않거나 혹은 기존의 고객 중 일부가 주차료를 두 배로 내는 대신 대중교통수단을 이용한다면 이 주차장 지배인의 전략으로는 기대했던 목표를 결코 달성할 수 없을 것이기 때문이다.
2. 게임이론의 역사
게임이론은 쿠르노(Cournot, 1838), 버틀란드(Bertland, 1883)등의 학자에 의하여 시작되었다. 이들은 과점분야에서 기업이 어떻게 생산량 및 가격을 결정하는가 하는 문제에 초점을 맞추어 분석한 것이나, 아주 특수한 경우에 국한된 모형으로서 이를 게임이론의 일반적 시초로 보기에는 문제가 있다.
현대적 게임이론의 역사는 대략 반 세기 전으로 거슬러 올라간다. 헝가리 출신의 유태인 천재 이론물리학자 폰 노이만(John Von Neumann)과 오스트리아 출신의 경제학자 모르겐슈타인(Oskar Morgenstern)이 1944년 출간한 '게임의 이론과 경제적 형태'(Theory of Games and Economic Behavior)에서 찾아 볼 수있다. 사실 이 저작이 출판되기 훨씬 전에 폰 노이만은 게임의 정의와 해의 개념을 수학적으로 정립했다는 신빙성있는 근거가 있다. 이 책에는 경제학의 많은 분야를 게임이론으로 접근하였으며, 전략적 게임과 확장형 게임으로 분류하여 표현하였고, MINIMAX라는 개념을 정의하였으며, 모든 2인형 제로섬 게임에서 MINIMAX의 해가 존재함을 증명하는 증의 내용이 수록되어 있다.또한 2인 게임에서 출발하여 여러 명이 하는 게임을 체계적으로 확장시켜 분석하였다. 그리고 이 책은 기대효용이론(expected utility theory)을 분석한 책으로도 잘 알려져 있다.
그 후 1950년에는 내쉬(Nash)가 협상(bargaining)이론에 관한 협조적 모형을 발표하였는데, 이는 사전에 선수들이 구속력 있는 협약을 맺고 하는 게임이다. 이는 몇 개의 공리를 이용하여 다수의 결과 중 관심 있는 결과를 하나만 가려냈다 하여 공리적(axiomatic)모형이라고도 한다. 이어 내쉬는 비협조적 게임을 위한 균형이론을 발전시켰는데, 이것이 유명한 내쉬균형이론이다. 내쉬균형은 각 선수들의 전략이 상대가 사용할 것이라고 예측한 전략에 대하여 최선의 전략이 되어야 하며, 또한 상대방에 대한 예측이 들어맞아야 한다는 두 가지 특성을 지니고 있다. 따라서 내쉬균형 상태에서는 어느 한 쪽도 독자적으로 균형전략으로부터 이탈한 유인이 없게 된다.
과점 모형에서 흔히 분석하는 쿠르노 모형이나 버틀란드모형은 크게 보면 내쉬균형의 특수한 형태로서 단지 생산량 및 가격을 결정하는 단순한 모형이다. 그러나 내쉬균형은 향후 일어날 상황에 따른 전략 의 선택에 대해서는 취약한 약점이 있다. 예컨대, 만약 오늘 상대방 기업이 가격을 내린다면, 내일 나도 가격을 내리겠다는 전략을 분석하는 데는 미약하다. 즉, 상황에 따른 행동(contingent action)은 주로 다단계 게임(multi stage game)에서 많이 나타나는데, 이를 위해서는 확장형 형태의 게임에 대한 분석이 필요하게 되고 이러한 형태의 게임에 관한 분석이 필요하게 되고 , 이러한 형태의 게임에서는 새로운 개념이 필요하게 되었다.
젤튼(Selten, 1965)과 하샤니(Harsanyi, 1967~1968)는 이러한 확장형 게임에 필요한 새로운 개념을 많이 고안해 냈는데, 이는 내쉬균형의 문제점에서부터 출발하였다. 젤튼은 내쉬균형에서는 거짓 협박이 가능하다는 비판에서부터 출발하였다. 즉, 어떤 경쟁회사가 가격을 내린다면 우리는 무료로 물건을 팔겠다고 협박하는 것이다. 이러한 협박은 상화에 따라 신뢰성이 없는 협박이 될 가능성이 높다. 왜냐하면, 상대가 실제로 가격을 내린 경우가 발생하였다며, 그 상황에서는 무료로 주는 것이 합리적이 아니기 때문이다. 이러한 신뢰성이 있는 협박 여부를 고려한 부분게임 완전균형이라는 새로운 균형개념을 도입하여 이 문제를 풀려고 시도하였다.
하샤니는 기본적인 게임에 선수들이 상대방 보상(payoff)을 모르는 경우를 가정한 게임을 분석하였다. 이를 불완전정보하의 게임이라고 하는데, 하샤니는 베이지안 내쉬균형개념을 도입하여 해결함으로 이 분야의 시금석이 되었다. 따라서 내쉬균형개념도 불완전정보하의 게임에서 사용될 수 있게 됨으로써 게임이론은 급속한 진전을 보게 되었다. 즉 메커니즘 디자인라든지 비선형 가겨차별, 최적 경매, 공공쟁에서 선호를 나타내는 문제, 그리고 협상모형 등에 활용되고 있다. 그러나 게임이 불완전정보하의 동적인 게임인 경우에는 역시 거짓협박의 문제점이 있게 되어 이를 해결하기 위한 새로운 개념들이 1980년대에 많이 등장하게 되었다. 그 예로서 완전균형(perfect equilibrium), 축자적 균형(sequential equilibrium) 등이 있으며, 이와 같은 개념은 신호모형 및 약탈가격등에 많이 활용되고 있다. 이 밖에도 평판효과(reputation effect)라는 개념이 불완전정보하의 게임에 활용되고 있다.
그러나 아직도 내쉬균형이론의 두 가지 문제가 있다.
ㄱ. 균형의 결과가 바람직한 답이 아닌 경우가 종종 등장한다. 죄수의 딜레마게임의 경우가 그 예이다.
ㄴ. 다수 또는 무한히 많은 균형이 나타나는 경우가 있다. 예를 들어, 내쉬의 협상게임에서도 무수히 많은 균형이 존재하는 데, 내쉬는 공리적 접근방법에 의해 다수의 해 중 바람직한 해를 골라냈다.
그러나 왜 공리를 따라야 하는가 하는 근본적인 문제가 발생한다. 이러한 문제의 해답으로서 셸링(Schelling)은 1960년 '관심의 초점'으로서 설명하려고 했다. 관심의 초점이란 게임 당사자들이 다수의 해 중 하나를 선택하는 데 무언의 합의를 갖게 되는데, 이는 서로 관심이 한 곳으로 모이게 되기 때문이라는 이론이다. 왜, 어떤 경우에 이런 일치가 일어날 수 있는가 하는 문제는 완전히 설명하지 않으나, 문화적.정치적 또는 관습에 의해 일부 설명된다.
3.게임의 종류
ㄱ. 협조적 게임과 비협조적 게임
협조적 게임(cooperative game) : 게임을 하기 이전의 게임에 참여하는 선수들이 완전히 구속력 있는 협약 (full and binding agreement)을 맺고 하는 게임
비협조적 게임(noncooperative game) : 서로가 사전에 어떤 구속력 있는 협약이 없이 , 선수들이 주어진 전략집합하에서 자시의 효용을 극대화하기 위해 합리적으로 자신의 최선의 전략을 찾으려는 형태의 게임
ㄴ. 정적 게임과 동적 게임
정적 게임(one stage game) : 각 선수들이 한 번에 전략을 선택한 후 게임이 끝나는 경우
동적 게임(multi-stage game) : 각 선수가 전략을 선택한 후 (일부 선수만 전략을 선택하는 경우도 포함) 그 결과를 본 후 다시 전략을 선택하는 과정을 수회에 걸쳐 행한 후에 나타난 결과에 따라 보상을 받는 경우
반복 게임(repeated game) : 동적 게임 중 동일한 게임을 여러 번 반복하는 경우
ㄷ. 전략형 게임과 확장형 게임
전략형 게임(strategic-form game) : 정적인 게임의 분석에 적합한 형태로서 게임에 참여하는 선수들, 선수들이 택한 결과로서 각 선수들이 얻는 보상으로 구성된다. 이는 전략이 중심이 되는 게임형태로서 이를 정상형 게임(normal-form game)이라고도 한다.
확장형 게임(extensive-form game) : 동적 게임 분석에 유용하게 활용되는 형태로서 게임의 진행과정, 즉 선수들이 선택한 전략을 알아보기 쉽게 표현되어 있다. 즉 첫번째에 상대가 무엇을 선택했는지, 또한 나느 무엇을 선택했는지를 표시하고 그 표시된 상태에서 다시 두 번째에는 무엇을 택했는지 하는 과정을 생생하게 알아볼 수 있도록 표시한 게임이다.
ㄹ. 완전정보게임과 불완전정보게임
완전정보게임(complete information game) : 선수, 전략집하브 전략에 따른 보상 등 각 선수에 관한 사항을 모두 알고 시작하는 게임
불완전정보게임(incomplete information game) : 이러한 사항 중 적어도 하나는 모르는 경우의 게임
비대칭정보게이(asymmetric information game) : 한 쪽은 상대의 정보를 모두 알고 있으나, 다른 쪽은 상대의 정보를 일부 모르는 경우의 게임
ㅁ. 제로섬게임과 비제로섬게임
제로섬게임(zero-sum game) : 각 선수가 어떤 전략을 택하든지 그 결과로서 나타나는 보상의 합이 영이 되는 경우의 게임
비제로섬게임(non-zero game) : 제로섬게임이 아닌 모든 경우.
--------------------------------------------------------------------------------
완전정보하의 정적 게임
1. 게임의 균형
1.1 우월전략(Dominant Strtegy)
상대방이 어떤 전략을 선택하는 지에 관계없이 자신의 보수를 더 크게 만드는 전략.
1.2 내쉬균형(Nash Equilibrium)
각 경기자가 상대방의 전략을 주어진 것으로 보고 자센이게 최적전략을 선택할 때 이 최적 전략의 짝을 내쉬균형이라고 한다.
1) 내쉬균형의 특성
ㄱ. 선수들은 주어진 상황에서 최선의 대응전략을 택한다고 특성은 지닌다.
ㄴ. 자기예상실현의 특성을 지니고 있다. 즉, 상대방이 택할 전략을 예측할 수 있으며, 이 예측대로 상대가 선택한다는 것이다.
* 정리
(1) 열등전략은 결코 내쉬균형전략이 될 수 없다.
(2) 반복적 열등전략 삭제에 의해 구한 균형은 내쉬균형이다.
EXAMPLE : prisoners' Dilemma
두 명의 공범자 1, 1를 형사가 검거했다. 그러나 그 형사는 심증만 있는 상태라서 범인들의 자백이 없이는 기소가 불가능하다. 그러자 이 형사는 다음과 같은 방법을 생각해 냈다. 각각 피의자를 독방에 격리기켜 놓고 다음과 같은 사항을 알려 주었다. "만약 당신이 자백을 하니 않았는데 다른 한 명이 자백을 하면 자백한 사람은 특전으로 풀려나나 당신은 10년의 징역을 살게 됩니다. 반대로 당신만이 자백을 하게 되면 당신이 특전의 혜택을 받게 됩니다. 만약 둘이 다 자백하는 경우에는 각각 5년형을 언도 받을것이며, 둘 다 자백을 하지 않으면 각각 1년형을 언도 받게 될 것입니다."
이를 normal form으로 표현하면 다음과 같다.
위 상황에서 1과 2는 각각 confess하는 것이 Domanant Strategy이다. 따라서 (C,C)는 Dominant Strategy Equilibrium이 된다. 그 결과 두 용의자는 모두 5년씩 징역을 살게 된다.
이 결과를 살펴보면, 서로에게 불만족한 해를 얻는다는 문제를 발견할 수 있는데, 그것은 둘이 다 not confess하면 1년씩만 징역을 살면 되는데 두사람에게 서로 좋은 결과를 마다하고 5년 징역을 살게 되는 것이 최선의 대응이라는 결과가 나오는 까닭에 딜레마이다.
그러나 믿는다는 것이 말로만 형성되는 것이 아니고 확실한 보장이 있어야만 가능하다. 이러한 딜레마는 개인의 합리성(individual rationality)과 집단의 합리성(collective rationality) 차이에 의해 생긴다. 즉 파레토 효율이 아닌 것이다.
1.3 내쉬 혼합전략균형
1) 순수전략과 혼합전략
순수전략(pure strategy) : 일어날 개연성이 있는 모든 경우에 대해서 해당 경기자가 취할 행동의 완전한 계획(complete contingent plan)으로 정의 된다.
혼합전략(mixed strategy) : 경기자가 여러 개의 행동 가운데 하나를 선택하되 주어진 확률분포에 따라 임의로 택하는 것을 뜻한다.
2) 혼합전략으로서의 균형개념
위에서 언급한 것 처럼 혼합전략의 정의는 여러 가지 순수전략을 확률로써 혼합하여 사용하는 전략이다. 그러면 왜 혼합전략을 사용하는가 혼합전략을 사용할 조건은 무엇인가 하는 질문에 어느 정도 이해사 있어야만 혼합전략을 찾을 수 있게 된다.
먼저 어떤 선수가 혼합전략을 사용할 경우에는 몇 가지 순수전략을 선택하여 그 순수전략을 각각 확률로써 선택하게 된다. 이 경우 열등전략은 아무리 작은 확률 이라도 선택되어서는 안된다. 왜냐 하면, 만약 확률로써 그 열등전략이 나오게 되면 그 선수는 최선의 전략을 택한 것이 아니기 때문이다. 따라서 혼합전략의 대상이 되는 순수전략 각각은 열등전략이 아니어야 한다.
둘째로는 각각의 순수전략이 선수의 입장에서는 동등한 보상을 주어야 한다. 만약 어떤 순수전략이 선수에게 보상(기대보상)을 더 준다면 혼합전략이나 다른 순수전략을 택하는 대신 바로 그 순수전략을 택하는 것이 최선이기 때문이다. 따라서 혼합전략을 선수가 택한다는 것은 동일한 보상을 주는 순수전략들의 확률을 결정하는 것이라고 볼 수 있다.
그러면 왜 동일한 보상을 주는 데 꼭 혼합전략을 사용하여야 하는냐 하는 문제가 생기게 된다. 동일한 보상이므로 아무 전략이나 사용하여도 문제가 되지 않는가 하고 반문할 수 있다. 그 해답이 바로 이 균형의 묘미다. 동일한 보상하에서 적절한 확률로 전략을 택하여야 균형을 얻을 수 있기 때문이다.
만약 동일하다고 아무 전략이나 택한다면(동일한 보상을 주는 전략 중) 상대방은 이에 대한 최선의 전략을 택하기 때문에 이 경우 자신이 택한 전략이 이제는 최선이 되지 않는 경우가 발생한다. 따라서 균형이 되기 위해서는 동일한 보상 중 적절한 것을 택하여야 상대가 그에 대한 최선의 선택을 하더라도 자신의 전략을 바꾸지 않아도 되 그런 확률이 있게 된다.
이것이 혼합전략으로서의 균형개념이다. 오로지 균형상태에서만 보상이 동일해지기 때문에 그 균형을 유지하지 않는 다른 상태가 되면 순수전략의 보상이 동일해지지 않는다. 따라서 혼합전략으로서 균형이 깨져 버린다.
3) 혼합전략 찾는 방법
ㄱ. 열등 전략을 계속 반복하여 삭제
ㄴ. 서로 상대방이 어느 순수전략을 택하든 보상이 동일해지도록 확률을 설정
2. 내쉬균형의 존재, 다중성 및 파레토 효율성
2.1 내쉬균형의 존재정리
1) 정리 1 : 모든 유한한 전략형 게임은 내쉬균형을 가진다.(Nash. 1951)
2) 정리 2 : 모든 선수들의 순수전략집합이 밀집(compact)되어 있고, 선수들의 보상함수가 순수전략에 대해 연속적일 경우 내쉬균형은 존재한다. (Dasgupta and Maskin, 1986)
2.2 내쉬균형의 약점
1)균형의 다중성 문제 -내쉬균형이 유일한 경우가 아닌 여러 개 있는 경우로서 이를 균형의 다중성 문제라고 한다.
2) 내쉬균형이 파레토효율적이 아닐 수도 있다는 점이다. 먼저 파레토 효율의 정의를 간략하게 살펴보면 어느 일방을 해치지 않고 서로가 좋아질 수 없는 상태에 있을 때 이를 파레토 효율이라고 한다.
위 example 죄수 딜레마의 그림에서 보면 내쉬균형은 (C,C)로서 (-5,-5)를 얻는다. 그러나 이러한 결과는 (NC,NC)의 경우보다 서로에게 나쁘며, 따라서 파레토 비효율적인 것이 되는 경우이다.그러나 일반적으로 균형이 여러 개 있는 경우에 파레토 효율적인 균형이 선택될 가능성이 높으며 이것도 일종의 관심의 초점으로 해석될 수 있다.
* 정리
1) 내쉬균형은 반드시 파레토 효율이 아니다.
2) 우월전략균형은 내쉬균형이다. (역도 성립)
3) 우월전략균형은 반드시 파레토 효율이 아니다.
'형설지공 > 경제경영' 카테고리의 다른 글
게임이론의 역사 (0) | 2001.01.26 |
---|---|
정보이론 (0) | 2001.01.26 |
게임이론과 현실 (0) | 2001.01.26 |
[2000.12]2000년 상반기 기업경영분석 결과 (0) | 2001.01.25 |
[2000.12]2000년 세계경제 동향과 2001년 전망 (0) | 2001.01.25 |