ゲーム理論シミュレーター 戻る
数理科学

ゲーム理論シミュレーター

囚人のジレンマ・鹿狩り・チキンゲームの利得行列を操作してナッシュ均衡を求め、空間進化ゲームで協力と競争のダイナミクスをリアルタイム可視化。

ゲームプリセット
利得行列(行: P1, 列: P2)
P2: 協力 (C)P2: 裏切 (D)
P1: 協力 (C) / /
P1: 裏切 (D) / /
進化ゲーム設定
グリッドサイズ30×30
突然変異率2%
協力率
0
世代
平均利得
パレート最適

ナッシュ均衡の条件

任意のプレイヤー $i$ と戦略 $s_i'$ に対して:
$u_i(s_i^*, s_{-i}^*) \geq u_i(s_i', s_{-i}^*)$

レプリケーター方程式:
$\dot{x}_i = x_i(f_i - \bar{f})$
協力 (C)
裏切り (D)
しっぺ返し
Win-Stay

ゲーム理論シミュレーターとは

🧑‍🎓
このシミュレーターで「ナッシュ均衡」ってどうやって見つけるんですか?利得行列の数字をいじるだけでいいんですか?
🎓
ざっくり言うと、誰も戦略を変える気にならない状態が均衡だね。このツールでは、まず左上の「囚人のジレンマ」などのプリセットを選んで、利得行列の数字を直接クリックして変えてみよう。例えば「協力」の報酬を大きくすると、均衡が「協力」に変わる瞬間が見られるよ。実務では、価格競争のモデルでこの数字を調整して均衡価格を探ったりするんだ。
🧑‍🎓
え、でもそれって静的な分析ですよね?下の「空間進化ゲーム」でグリッドが動いてるのは何を見てるんですか?
🎓
いいところに気が付いたね。下のグリッドは、ナッシュ均衡だけでは説明できない「戦略の普及・進化」をシミュレートしてるんだ。例えば、隣人から戦略をコピーする「更新ルール」や、たまに戦略が変わる「突然変異率」を上のスライダーで変えてみて。協力が広がる条件や、裏切り者が蔓延する条件がリアルタイムで見えるよ。生物の群れの行動や、社会規範の広がりを研究するのに使われる手法だ。
🧑‍🎓
「初期戦略」を「ランダム」から「ほとんど協力」に変えると、最初は協力だらけなのに、すぐに裏切りが広がっちゃいました…。これが「囚人のジレンマ」の怖いところってことですか?
🎓
その通り!個人の合理的選択が集団を悪い結果に導くパラドックスを、目で見て確認できたね。でも、「鹿狩りゲーム」に切り替えて同じパラメータで試してみて。こっちでは協力が維持されるはずだ。シミュレーターを触ると、ゲームの構造(利得行列)が集団の運命をどう決めるか、直感的に理解できるんだ。自動車業界での技術標準の競争(VHS対ベータみたいな)も、このようなモデルで分析されることがあるよ。

物理モデルと主要な数式

このシミュレーターの根幹にあるのは、戦略プロファイル $s^* = (s_1^*, ..., s_n^*)$ がナッシュ均衡であるための条件です。どのプレイヤーも、他のプレイヤーの戦略を所与として、自分だけ戦略を変えても利得を改善できない状態を定式化します。

$$u_i(s_i^*, s_{-i}^*) \geq u_i(s_i', s_{-i}^*) \quad \forall i, \forall s_i' \in S_i$$

$u_i$: プレイヤー $i$ の利得関数, $s_i^*$: プレイヤー $i$ の均衡戦略, $s_{-i}^*$: 他の全プレイヤーの均衡戦略, $S_i$: プレイヤー $i$ が選択可能な戦略の集合。この不等式が全プレイヤーについて成り立つ時、その戦略の組み合わせは誰も動くインセンティブのない「均衡」となります。

空間進化ゲームのダイナミクスは、生物進化の考え方を借りた「レプリケーター方程式」などで記述されます。より成功した戦略ほど、その割合が増えていくというモデルです。

$$\dot{x}_i = x_i (f_i(\mathbf{x}) - \bar{f}(\mathbf{x}))$$

$x_i$: 戦略 $i$ を採用する個体の割合, $f_i$: 戦略 $i$ の利得(適応度), $\bar{f}$: 集団全体の平均利得, $\dot{x}_i$: 割合の時間変化。この式は、自分の利得が平均より高い戦略は増殖し、低い戦略は淘汰されていくことを意味します。シミュレーターでは、この連続方程式を離散的なグリッド上の近傍相互作用で模倣しています。

実世界での応用

経済学・経営戦略:企業間の価格競争や広告競争をモデル化し、ナッシュ均衡としての市場価格を予測します。新規参入企業の戦略や、既存企業の協調行動(カルテル)が均衡をどう崩すかの分析に使われます。

生物学・生態学:動物の行動(縄張り争い、餌の分配、繁殖戦略)を「進化的に安定な戦略(ESS)」として研究します。例えば、ハト派とタカ派の戦略が個体群内でどのような割合で共存するかをシミュレートできます。

政治学・国際関係:軍拡競争や国際交渉、環境条約の遵守問題を「囚人のジレンマ」や「チキンゲーム」として分析します。相互不信がどのように非協調的な均衡を生み出すか、またそれを脱するための制度設計を考察します。

コンピュータサイエンス・ネットワーク設計:インターネット上のデータ転送におけるユーザー(またはプロトコル)の振る舞いをゲームとしてモデル化します。各ノードが自己の効率を最大化する行動を取った結果、ネットワーク全体の輻輳が発生するという「混雑ゲーム」の分析などが該当します。

よくある誤解と注意点

まず、「ナッシュ均衡は唯一の『正解』だ」という思い込みは捨てましょう。例えば「鹿狩りゲーム」では、「全員が協力」と「全員が裏切り」の2つのナッシュ均衡が存在します。シミュレーターで初期状態を変えると、どちらの均衡に収束するかが変わることがありますよね。これは、現実の交渉や市場でも、初期条件や歴史的経緯(例えば、どちらの技術が先に普及したか)によって異なる均衡が実現することを示しています。

次に、進化ゲームのパラメータ設定の落とし穴です。「更新ルール」を「最良応答」にした場合、グリッド上の戦略変化が非常に速く、カオス的になることがあります。これは、現実の人間や生物の学習・模倣がそこまで合理的ではないことを考えると、過度に単純化されたモデルかもしれない、と疑うきっかけにしてください。実務で応用する際は、更新ルールの選択が結論を大きく左右するので、対象とするシステムの「学習メカニズム」をよく考える必要があります。

最後に、利得行列の数字の「絶対値」よりも「大小関係」が本質的だという点です。囚人のジレンマでは、裏切りに対する誘惑の利得T、協力に対する報酬R、相互裏切りに対する懲罰P、単独協力に対する惨事Sの間に、T > R > P > S という関係が成り立っています。シミュレーターで「報酬R」の数値を10から100に大きくしても、この大小関係が保たれていれば、依然として囚人のジレンマは成立し、裏切りが優勢になります。数字をいじる際は、この順序関係がどう変わるかに注目しましょう。

関連する工学分野

このシミュレーターの背後にある考え方は、マルチエージェントシステムの設計や解析に直結します。例えば、自律走行車群が交差点で効率的に通過順序を決める「協調制御」や、複数のロボットが物資を運搬する「分散ロボティクス」では、各エージェント(プレイヤー)が局所的な情報に基づいて意思決定します。ここで生じる衝突や非効率性は、まさにゲーム理論の問題。シミュレーターで「空間進化ゲーム」を観察することで、局所的な相互作用が全体のパターン(渋滞や効率的な流れ)をどう生み出すか、その感覚を養えます。

また、無線通信ネットワークにおける周波数帯域の割り当て問題も、ゲーム理論の応用例です。各送信機(プレイヤー)が、互いの干渉を避けつつ通信品質(利得)を最大化する周波数(戦略)を選びます。これは「鹿狩りゲーム」に近く、全員が異なる周波数を選んで協調すれば全体の利得が最大化されますが、誰かが良い帯域に集中すると混雑が生じます。シミュレーターで利得行列を操作する行為は、このようなネットワークのプロトコル設計におけるパラメータ調整の基礎トレーニングになります。

さらに、材料科学における相転移のモデリングともアナロジーがあります。グリッド上の各セルが「協力」か「裏切り」かの状態を持ち、隣接セルとの相互作用で状態が変わる様子は、磁性体のスピンが隣接スピンの影響を受ける「イジングモデル」と数学的に類似しています。パラメータ(例えば利得や更新確率)を変えることで、協力が広がる「秩序状態」と裏切りが蔓延る「無秩序状態」の間の急激な変化(相転移)を観察できます。これは、複雑系におけるマクロな秩序の創発を理解する貴重な視点です。

発展的な学習のために

まず次のステップは、「混合戦略ナッシュ均衡」を理解することです。今のツールは「純粋戦略」(確定的に協力か裏切りを選ぶ)だけですが、現実では確率的に行動を変えることもあります。例えば、サッカーのPKでキッカーとゴールキーパーが左右どちらに蹴る(飛ぶ)かをランダムに混ぜるのが混合戦略です。これを学ぶと、シミュレーターの「突然変異率」が、意図しない混合戦略的な振る舞いを生み出している可能性にも気づけるようになります。

数学的背景を深めたいなら、「最適化問題」との関連を押さえましょう。ナッシュ均衡の概念は、各プレイヤーが自分だけの利得関数を(他のプレイヤーの行動を所与として)最大化する「相互に絡み合った最適化問題」の解と見なせます。つまり、ゲーム理論は「分散された、競争的な最適化」の枠組みなのです。この視点を得ると、先ほどのマルチエージェント制御やネットワーク資源配分の問題が、よりクリアに「工学の問題」として見えてくるはずです。

最後に、このツールで「空間」の重要性を体感したなら、「ネットワーク科学」への展開を強くお勧めします。現実の人間関係やインターネットは、均一なグリッドではなく、複雑なネットワーク構造を持っています。次の学びでは、「スケールフリーネットワーク上での進化ゲーム」などをキーワードに調べてみてください。ほんの数人の「ハブ」(多くの繋がりを持つ人)が、全体の協力率を劇的に向上させ得る、といったより現実に即したダイナミクスを学ぶことができるでしょう。