| P2: 協力 (C) | P2: 裏切 (D) | |
|---|---|---|
| P1: 協力 (C) | / | / |
| P1: 裏切 (D) | / | / |
$u_i(s_i^ , s_{-i}^ ) \geq u_i(s_i', s_{-i}^*)$
レプリケーター方程式:
$\dot{x}_i = x_i(f_i - \bar{f})$
囚人のジレンマ・鹿狩り・チキンゲームの利得行列を操作してナッシュ均衡を求め、空間進化ゲームで協力と競争のダイナミクスをリアルタイム可視化。
| P2: 協力 (C) | P2: 裏切 (D) | |
|---|---|---|
| P1: 協力 (C) | / | / |
| P1: 裏切 (D) | / | / |
経済学・経営戦略:企業間の価格競争や広告競争をモデル化し、ナッシュ均衡としての市場価格を予測します。新規参入企業の戦略や、既存企業の協調行動(カルテル)が均衡をどう崩すかの分析に使われます。
生物学・生態学:動物の行動(縄張り争い、餌の分配、繁殖戦略)を「進化的に安定な戦略(ESS)」として研究します。例えば、ハト派とタカ派の戦略が個体群内でどのような割合で共存するかをシミュレートできます。
政治学・国際関係:軍拡競争や国際交渉、環境条約の遵守問題を「囚人のジレンマ」や「チキンゲーム」として分析します。相互不信がどのように非協調的な均衡を生み出すか、またそれを脱するための制度設計を考察します。
コンピュータサイエンス・ネットワーク設計:インターネット上のデータ転送におけるユーザー(またはプロトコル)の振る舞いをゲームとしてモデル化します。各ノードが自己の効率を最大化する行動を取った結果、ネットワーク全体の輻輳が発生するという「混雑ゲーム」の分析などが該当します。
まず、「ナッシュ均衡は唯一の『正解』だ」という思い込みは捨てましょう。例えば「鹿狩りゲーム」では、「全員が協力」と「全員が裏切り」の2つのナッシュ均衡が存在します。シミュレーターで初期状態を変えると、どちらの均衡に収束するかが変わることがありますよね。これは、現実の交渉や市場でも、初期条件や歴史的経緯(例えば、どちらの技術が先に普及したか)によって異なる均衡が実現することを示しています。
次に、進化ゲームのパラメータ設定の落とし穴です。「更新ルール」を「最良応答」にした場合、グリッド上の戦略変化が非常に速く、カオス的になることがあります。これは、現実の人間や生物の学習・模倣がそこまで合理的ではないことを考えると、過度に単純化されたモデルかもしれない、と疑うきっかけにしてください。実務で応用する際は、更新ルールの選択が結論を大きく左右するので、対象とするシステムの「学習メカニズム」をよく考える必要があります。
最後に、利得行列の数字の「絶対値」よりも「大小関係」が本質的だという点です。囚人のジレンマでは、裏切りに対する誘惑の利得T、協力に対する報酬R、相互裏切りに対する懲罰P、単独協力に対する惨事Sの間に、T > R > P > S という関係が成り立っています。シミュレーターで「報酬R」の数値を10から100に大きくしても、この大小関係が保たれていれば、依然として囚人のジレンマは成立し、裏切りが優勢になります。数字をいじる際は、この順序関係がどう変わるかに注目しましょう。
囚人のジレンマ標準形:協力-協力(3,3)、協力-裏切り(0,5)、裏切り-協力(5,0)、裏切り-裏切り(1,1)を入力。初期協力率60%、世代数200で実行。第50世代で協力率が32%に低下、第120世代で均衡に達し平均利得1.85。TFT(しっぺ返し)戦略導入時は協力率が75%で安定化し、平均利得が2.94に上昇する空間進化動態を観測。