賽局理論_ Chapter 06 Game theory_筆記
http://huizhoukexie.com/sys-nd/1336.html 賽局理論 主要是研究理性者互動策略選擇,研究人類互動行為的方法。(比方:選舉、戰爭、貿易經濟戰) 當個人之最佳行動抉擇於他人行動或預期行動時,可協助釐清情勢。 目的在於發掘穩定及可預測的互動結果,學者將穩定可預測之結果稱之為 均衡(Equilibrium) 。 關鍵步驟:發覺在給定期他參與者策略下,找出參與者的 最適反映(Best Response) 。 賽局理論就是在研究策略性互動,通常會需要有 參與者(players) 至少兩人 參與者可能採取的策略(possible strategies) 報酬(Payoff) 最適反映(Best Response) 在給定或預期其他參與者將選擇之色略下,能帶給自身最大報酬的策略。 報酬表(Payoff Table) 用於描述有兩個或三個參與者於不同策略組合下的參與者報酬。 參與者的策略分解於行和列,行和列下的數字,分別表述所對應策略組合下,行與列參與者的報酬。 納許均衡(Nash Equilibrium) 納許是美國數學家,他提出:「我們應該預期每個人都會考慮其他參與者的策略,並據此做出最佳決策。」 在包含兩個或以上參與者的非合作賽局中,假設每個參與者都知道其他參與者的均衡策略的情況下,沒有參與者可以透過改變自身策略使自身受益時的一個概念解。 優勢策略(Dominant Strategy) 當賽局中存在優勢策略時,便會產生讓人非選該策略不可的強大理由,此狀態就稱為優勢策略均衡。 囚犯困境(The Prisoner’s Dilemma) 之所以難下抉擇,是因為刑期不僅取決於自己認罪與否,也取決於別人認罪與否。 嫌疑犯1 跟 2各自是否認罪? 若兩人都不招就各判關1年 兩人都招就各判關4年 其中一方招對方不招,則招的一方直接自由,另一方不招就關10年。 Payoff Table如下呈現 NC 代表 不認罪(Not Confess) C 代表 認罪(Confess) 基於理性原則為前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判刑1年就不會出現。兩人都選擇坦白的策略以及因此被判4年的結局被稱作是「納許均衡」(也叫非合作均衡)。 明顯可見,嫌疑犯雙方最有利的抉擇理應選定都不招,指各判關一年,但這並非均衡結果。 每一...