ゲーム理論『囚人のジレンマ』をわかりやすく【ゼロからわかる】

選択のジレンマ

心理学実験のページでも補足的にご紹介したゲーム理論の1つ『囚人のジレンマ』のまとめです。

なお、囚人のジレンマは、思考実験の事例の一つとしても取り上げられることがあります。

このページでは、以下の内容がゼロからわかるようになっています。

このページでわかること
  1. 内容
  2. 典型的な結果
  3. 参考文献

YouTubeバージョン

ゲーム理論『囚人のジレンマ』とは?

まずは前提内容です。

スポンサーリンク

『『裏切り』と『協力』の狭間で揺れる『ジレンマ(葛藤)』を再現したゲーム』

囚人のジレンマ』とは、『『裏切り』と『協力』の狭間で揺れる『ジレンマ(葛藤)』を再現したゲーム』のことです。

ゲーム理論の1つであり、1950年に公表されてから、人の意思決定を検証する手段などに使われてきました。

スポンサーリンク

ゲーム理論『囚人のジレンマ』の内容【シナリオのすべて】

結論からいうと、囚人のジレンマは、囚人と仮定したA、Bの両名に、以下のようなジレンマが生じている状況のことをいいます。

利得行列(利得表)

図:利得行列(利得表)

それではここからは、この図のもとになったシナリオをご紹介させていただきます。

注:当然ながらシナリオに登場する役柄や状況はすべてフィクションです

スポンサーリンク

囚人2人が”別々の場所で”、取調べで”黙秘”を続けている

取調べ

とある事件の共犯の疑いをかけられた囚人2人が、”別々の場所で”、検察官から取調べを受けています。

囚人はお互いに”黙秘”を続けており、囚人同士でコミュニケーションをとることはできません。

つまりどちらの囚人も、もう片方の囚人が黙秘をしているのかはわからない状況です。

スポンサーリンク

“2人が黙秘”したままだと、”2人ともに懲役1年の刑だけ”が下る状況

囚人2人がこのまま黙秘を続ける状況が続けば、どちらも起訴されても懲役1年の刑にしかなりません。

しかしながら、取調べをする検察官は、囚人2人が重大な事実を隠していると推測しています。

スポンサーリンク

そこで検察官は囚人に、個別で”ある取引き”を持ちかける

そこで検察官は、囚人に”ある取引き”を持ちかけます。

スポンサーリンク

【取引内容】『もう一人の囚人が黙秘している間に自白してくれたら、黙秘を続けたもう一人だけを起訴して懲役20年にし、お前だけ不起訴にしてやるぞ』

もう一人の囚人が黙秘している間に自白してくれたら、黙秘を続けたもう一人だけを起訴して懲役20年にし、お前だけ不起訴にしてやる

検察官は上記のように、黙秘を続ける囚人をそそのかしました。

スポンサーリンク

囚人に生じたのは、”裏切るか協力するか”の”ジレンマ”だった

ここで囚人に生じたのは、ある種の“ジレンマ(葛藤)”でした。

なぜなら、自白“することは自分個人の利益(不起訴)を優先し、相棒に不利益(懲役20年)を被らせる”裏切り“行為ともいえるからです。

天使と悪魔

また検察官からの取引内容には続きがあり、以下のように、自分が自白することが必ずしも抜け駆けとなるわけでもありません。

取引きの全容
  1. 2人がそろって自白⇒2人に懲役10年
  2. 1人のみが自白⇒自白した方は不起訴、黙秘した方は懲役20年
  3. 2人がそろって黙秘⇒2人に懲役1年

このことも囚人へのジレンマを助長させました。

利得行列(利得表)

図:利得行列(利得表)

とはいえ、囚人2人の合計刑期から考察するなら、合計刑期が最も少ないのは、お互いに黙秘した場合の2年(懲役1年+懲役1年)です。

つまり相棒が信頼できるのであれば、黙秘することが望ましいのかもしれません。

しかし、繰り返す通り、取調べはもう一人の囚人にもまったく同じ取引きが別の場所で行われているため、相棒の選択をあらかじめ知ることができないジレンマがあります。

 

ーーーーー

これらの状況は個人が目先の利益を追求しても、それが全体の損失につながってしまう『社会的ジレンマ』にも通じています。

余談ながらこのようなジレンマ構造は、日常のあらゆる場面で見かけることができます。

 

なお、『各場合のすべてにおいて得となる行動があれば、それを選ぶ』という思考を『優越原理』といい、『期待値の大きな方の行動を選ぶ』という思考を『期待効用原理』といいます。

ーーーーー

スポンサーリンク

ゲーム理論『囚人のジレンマ』の典型的な結果

囚人のジレンマが実施されたときに見られる、典型的な結果についてです。

スポンサーリンク

【結論1】多くの場合は”2人ともが裏切る”

結論からいうと、囚人のジレンマでは多くの場合、”2人の囚人がともに裏切る“という結末になります。

これは言うまでもなく、囚人自身が個人の短期的な利益(不起訴)を追求してしまうためです。

スポンサーリンク

【結論2】しかし、”取引きが長期化”、もしくは”相手への信頼度が高い場合”などは、”協力”が促進される

しかしながら、この結論には例外も存在します。

それは取引きが長期化し、何回も行われる場合、または相棒への信頼が高い場合です。

協力が促進される条件の例
  1. 取引きが長期化し、何回も行われるとき
  2. 相棒への信頼が高いとき

このことは相棒との付き合いが長くなると、信頼が増し、協力的になりやすい面がある…といえるのかもしれません。

少なくとも人は、目先の短期的な利益”だけ”で動くわけではなさそうです。

スポンサーリンク

ゲーム理論『囚人のジレンマ』にまつわるその他の情報

最後はおまけです。

スポンサーリンク

『しっぺ返し戦略』(応報戦略)

政治学者:アクセルロッドはゲーム理論の専門家たちに、複数回繰り返すタイプの囚人のジレンマを使ったゲームの戦略プログラムを募集しました。

心理学や経済学、政治学、数学、社会学らの14人のゲーム理論の専門家たちが集まり、様々なプログラムが集まります。

披露されたプログラムには、相手の戦略の裏をかいたうえで、自分の戦略を決めるような高度で複雑なものもあったようです。

しかし、結果的として一番高い成績を残したのは、『しっぺ返し戦略』(応報戦略)と呼ばれる最もシンプルなプログラムでした。

しっぺ返し戦略の特徴
  1. 最初のターン:協力
  2. 2回目以降のターン:相手の前回の手を模倣

これは最初のターンは無条件に『協力』し、それ以降は相手が前回取った手と同じ手を自分も取るという戦略プログラムです。

つまり最初のターン以外は、相手が前回『協力』を選択していれば、こちらも『協力』を選択。逆に相手の前回が『裏切り』だったなら、こちらも『裏切り』を選択といった具合です。

いわゆるオウム返しのような戦略です。

オウム返し

イベントは大きな反響を呼び、2回目には世界中から60人以上の専門家が集まることとなります。

しかしながら、それでも最も高い成績を残したのは、しっぺ返し戦略を使ったプログラムでした。

アクセルロッドはしっぺ返し戦略の特徴を以下のように挙げています。

【アクセルロッドが指摘した、しっぺ返し戦略の特徴】

1.自分からは相手を裏切らない上品な戦略である

2.意図がわかりやすい

3.相手の戦略に即座に対応できる

スポンサーリンク

意外と”裏切る”日本人

社会心理学者の山岸俊男さんが自著で明らかにしたことによると、囚人のジレンマでよく見られる”裏切りやすい”傾向は、日本人にも当てはまるようです。

山岸さんはゲーム理論や質問紙調査によって、そのことを明らかにしています。

日本人は他国の方々と比べると「協調性が高い」といわれることがあります。

しかし、少なくとも囚人のジレンマにおいては、そうとはいえない面があるのかもしれません。

スポンサーリンク

ゲーム理論『囚人のジレンマ』まとめ

人は裏切りやすい。

しかし、条件によってはそうとはいえない一面もある。

回数に限っていうならば、ゲームが一度切りなら裏切り、繰り返すなら協力することが安牌な戦略だといえそうだ。

それでは。

参考文献

当ページをつくるにあたり、大いに参考にさせていただきました。

ありがとうございました。

>>つきあい方の科学:バクテリアから国際関係まで

>>安心社会から信頼社会へー日本型システムの行方

・Thibaut, J. W., & Kelly, H. H.(1959)The social psychology of groups. Wiley.

>>【日本社会心理学会】論文ニュース/他者を想像することで協力が増す?

・Kelly, H. H., Holmes, J. G., Kerr, N. L., Reis, H. T., Rusbult, C. E., & van Lange, P. A. M.(2003)An atlas of interpersonal situations. Cambridge University Press.

>>論理パラドクス 論証力を磨く99問

・Lewis, David. “Prisoner’s Dilemma Is a Newcomb Problem” Philosophical Papers I(Oxford U. P., 1983)

>>論理的思考力を鍛える33の思考実験

>>よくわかる思考実験

>>思考実験 科学が生まれるとき

関連ページ

YouTubeバージョン