檔案狀態:    住戶編號:2044027
 5168 的日記本
快速選單
到我的日記本
看他的最新日記
加入我的收藏
瀏覽我的收藏
game theory  《前一篇 回他的日記本 後一篇》 game theory
 切換閱讀模式  回應  給他日記貼紙   給他愛的鼓勵  檢舉
篇名: game theory
作者: 5168 日期: 2011.01.15  天氣:  心情:
概括而言囚徒困境進行第一次後會出現以下兩種情況:
甲在第一次中被乙指控,即會在第二次指乙,最終導致,甲即時獲釋,乙服刑10年或二人同服刑2年
雙方均保持沉默,即會建立互信的關係,最終導致,二人同服刑半年。
但互信的關係並非牢不可破,這一點也可以被利用,即甲,乙在第一次中共同選擇沉默而贏得對方的信任,但甲或乙中的一人在獲得對方的信任後指控對方而獲得自身最大的里即自身即時獲釋,但對方將服刑10年。這是一個以犧牲對方利益而獲得自身最大利益的一種策略。
如果假設,兩個囚徒均欲利用此策略,並將局數推演為十次,那麼就會出現如下的情況:在第一局到第九局的過程中雙方均會保持沉默,以期望建立互信關係,並在第十局指控對方,這將最終導致,二人同服刑2年。
再一次假設,雙方都明確對方會使用與自己同樣的策略,即知道對方會在第十局中指控自己,這樣,在第九局時兩者間的信任關係的建立即是沒有意義的,如此類推,第八局到第一局中信任關係的建立也是沒有意義的,即是十局都會互相背叛,也就是納什均衡。也可推論,在如此的情況下,只有在囚徒困境的局數在不肯定的情況下(即雙方均不知道進行的局數),才會出現互相保持沉默以獲得信任關係的現象。
[編輯]一般形式

整理囚徒困境的基本博弈結構,可更清楚地分析囚徒困境。實驗經濟學常用這種博弈的一般形式分析各種論題。以下是實現一般形式的其中一例:
有兩個參與者和一個莊家。參與者每人有一式兩張卡片,各印有「合作」和「背叛」。參與者各把一張卡片文字面朝下,放在莊家面前。文字面朝下排除了參與者知道對方選擇的可能性1。然後,莊家翻開兩個參與者卡片,根據以下規則支付利益:
一人背叛、一人合作:背叛者得5分(背叛誘惑),合作者0分(受騙支付)。
二人都合作:各得3分(合作報酬)。
二人都背叛:各得1分(背叛懲罰)。
用支付矩陣表格展示支付如下(以紅和藍分別表示二參與者):
一般形式囚徒困境的支付矩陣
合作 背叛
合作 3, 3 0, 5
背叛 5, 0 1, 1
以「T、R、P、S」符號表示
合作 背叛
合作 R, R S, T
背叛 T, S P, P
以「勝-負」術語表示
合作 背叛
合作 勝, 勝 大負, 大勝
背叛 大勝, 大負 負, 負
簡單博弈獲得的點數可以得出一些一般化的結論。
T、R、P、S符號表
符號 分數 英文 中文(非術語) 解釋
T 5 Temptation 背叛誘惑 單獨背叛成功所得。
R 3 Reward 合作報酬 共同合作所得
P 1 Punishment 背叛懲罰 共同背叛所得
S 0 Suckers 受騙支付 被單獨背叛所獲
若以T(Temptation)=背叛誘惑,R(Reward)=合作報酬,P(Punishment)=背叛懲罰,S(Suckers)=受騙支付,以個人選擇得分而言,可得出以下不等式。
T>R>P>S
(解:從5>3>1>0獲得以上不等式)
若以整體獲分而言,將得出以下不等式。
2R>T+S或2R>2P
(解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及單獨背叛的共得5分,顯然合作獲分比背叛高。合作在團體而言是支配性策略。)
而重複博弈或重複的囚徒困境將會使參與者從注重T>R>P>S轉變成注重2R>T+S。就是說將使參與者脫離困境。 以上理論是道格拉斯·霍夫施塔特創建的。 [:))] [:))] [:))]
標籤:
瀏覽次數:27    人氣指數:227    累積鼓勵:10
 切換閱讀模式  回應  給他日記貼紙   給他愛的鼓勵 檢舉
給本文愛的鼓勵:  最新愛的鼓勵
game theory  《前一篇 回他的日記本 後一篇》 game theory
 
給我們一個讚!