發表文章

目前顯示的是有「賽局理論」標籤的文章

賽局理論_ Chapter 07 Evolutionary Game Theory_筆記_甲蟲推算

圖片
高高的杉木之所以彼此都長到這麼高,主要就是害怕被其他鄰近的相同樹種高過去遮蔽曬不到陽光。 Evolutionary Game Theory最早由John Maynard Smith和G. R. Price提出 演化生物學基於這樣一個觀念:生物的基因在很大程度上決定了其可觀察的特徵,進而決定其在特定環境中的適應性。 較適合基因的基因隨著時間推移往往勝出,因為它們能提供較高的繁殖率。 這些生物中任何一種的成功,取決於其行為與其他生物的互動 比方,當兩隻甲蟲為食物競爭時,可能出現下列結果: 當體型相同的甲蟲競爭時,它們獲得相等的食物份額 當大型甲蟲與小型甲蟲競爭時,大型甲蟲獲得大多數食物 在所有情況下,較大的甲蟲從相同數量的食物中獲得的適合度利益較少。 某個族群中個體的適應度(fitness),是指其與該族群中某個隨機個體相互作用時所獲得的預期收益( expected payoff ) 若在一個群體中,有比例為 x 的個體使用策略 T,而比例為 1 − x 的個體使用策略 S(其中 x 為極小的正數),則稱策略 T 以 x 的程度入侵策略 S。 若存在一個(極小的)正數 y,使得當任何其他策略 T 以任何程度 x < y 入侵策略 S 時, 採用策略 S 的生物體適應度皆嚴格大於採用策略 T 的生物體適應度,則稱 S 為演化穩定(evolutionarily stable) 族群中有1 − p 比例的族群使用 Small,而 p 比例的族群使用 Large 小甲蟲的預期報酬如下: 5(1 − p) + 1 · x = 5 − 4p 大甲蟲的預期報酬如下: 8(1 − p) + 3 · p = 8− 5p =>「小」在演化上是不穩定的 族群中有 1−p 的比例使用 Large,而有 p 的比例使用 Small 大甲蟲的預期報酬如下: 3(1 − p) + 8 · p = 3 + 5p 小甲蟲的預期報酬如下: (1 − p) + 5 · p = 1 + 4p =>Large 為演化穩定策略 Ref https://plato.stanford.edu/archives/sum2018/entries/game-evolutionary/ https://www.pugetsound.edu/sites/default/files/file/evolution...

賽局理論期中報告參考資料

  https://castrodavid.dev/posts/the-tech-debt-dilemma/ https://newsletter.pragmaticengineer.com/p/manu https://goomics.net/#2012-02-28_gdrive_launch https://goomics.net/62 https://medium.com/hackernoon/game-theoretical-reasons-software-projects-fail-the-prisoners-dilemma-reputational-damage-and-4129c6bdf0eb

賽局理論_ Chapter 06 Game theory_筆記

圖片
http://huizhoukexie.com/sys-nd/1336.html 賽局理論 賽局理論主要是用來分析雙方(至少2人以上,太多也不好)利害、對立關係或交涉的工具。 主要是研究理性者互動策略選擇,研究人類互動行為的方法。(比方:國家對立、選舉、貿易經濟戰、組織內問題、經營公司店家等) 當個人之最佳行動抉擇於他人行動或預期行動時,可協助釐清情勢。 目的在於發掘穩定及可預測的互動結果,學者將穩定可預測之結果稱之為 均衡(Equilibrium) 。 關鍵步驟:發覺在給定期他參與者策略下,找出參與者的 最適反映(Best Response) 。 賽局理論就是在研究策略性互動,通常會需要有 參與者(players) 至少兩人 參與者可能採取的策略(possible strategies) 報酬(Payoff) 之後要進行的就是俯瞰問題思考模式,對於複數的人或組織間所發生的狀況,用客觀角度俯瞰分析全貌,將其視為一場賽局。絕大部分人都不擅長俯瞰思考。 最適反映(Best Response) 在給定或預期其他參與者將選擇之色略下,能帶給自身最大報酬的策略。 報酬表(Payoff Table) 用於描述有兩個或三個參與者於不同策略組合下的參與者報酬。 參與者的策略分解於行和列,行和列下的數字,分別表述所對應策略組合下,行與列參與者的報酬。 納許均衡(Nash Equilibrium) 納許是美國數學家,他提出:「我們應該預期每個人都會考慮其他參與者的策略,並據此做出最佳決策。」 在包含兩個或以上參與者的非合作賽局中,假設每個參與者都知道其他參與者的均衡策略的情況下,沒有參與者可以透過改變自身策略使自身受益時的一個概念解。 納許均衡可大致分為 純策略均衡 (Pure Strategy) 和 混合策略均衡 (Mixed Strategy) 。 優勢策略(Dominant Strategy) 簡而言之,自己的某個策略,對對手所有的策略都是最適回應。當賽局中存在優勢策略時,便會產生讓人非選該策略不可的強大理由,此狀態就稱為優勢策略均衡。 囚犯困境(The Prisoner’s Dilemma) 之所以難下抉擇,是因為刑期不僅取決於自己認罪與否,也取決於別人認罪與否。 嫌疑犯1 跟 2各自是否認罪? 若兩人都不招就各判關1年 兩人都招就各判關4年 其中一方招對方不招,則招的一方直...