--“囚徒困境”博弈的啟示
榕城老應
6。後記和參考
這個題目寫完,朋友問:“你說的有益進一步學習的材料在那裏?別不是忽悠老實人吧?” 我說:“搜索呀!這裏關鍵詞都是正規術語,無論穀歌還是百度都認得呀!”
好吧,為讓大家省點力氣搜索,我將主要的參考資料介紹如下。
關於博弈的基本概念,囚徒困境問題,納什均衡,重複博弈,觸發策略,冷酷策略和無名氏定理(the Folk Theorem)在一般博弈論的大學和研究生的教科書都有介紹。下麵的鏈接是 Shoham 根據Osborne 和 Rubinstein 給出無名氏定理的數學證明的框架,十分簡明清晰,對了解無名氏定理很有幫助( http://www.cs.ubc.ca/~kevinlb/teaching/cs532a%20-%202003-4/folk.pdf )
進化穩定策略(Evolutionarily Stable Strategy),簡稱ESS,最好的參考書當然是John Maynard Smith 1982年那本書《Evolution and the Theory of Games》,有中譯本,2008年的《演化與博弈論》。
Nowak,Sasaki,Taylor,Fudenberg等人 2004年《自然》論文 “Emergence of cooperation and evolutionary stability in finite populations" 見鏈接( http://www.fas.harvard.edu/~ped/people/faculty/publications_nowak/Nature04a.pdf )
Brembs 1996年 OIKOS Mini-Review論文的鏈接 ( http://expertvoices.nsdl.org/cornell-info204/files/2010/04/brembs-1996-prisoners-dilemma-solutions.pdf )
對“囚徒困境(Prisoner's Dilemma)和合作現象研究最多的是密知根大學的政治學教授Robert Axelrod。他早在1970年便設計了那個著名的電腦囚徒困境策略競賽。1981年與生物學家W. D. Hamilton在《科學》期刊上發表了“The Evolution of Cooperation”論文。1984年Axelrod更是將幾篇論文編輯成書,同樣也以《The Evolution of Cooperation》之名發表。這部書成為一本經典,在二十多年來產生了重大影響,形成一個新的領域。中譯本《合作的進化(修訂版)》也在2007年出版。很可惜,我一直等到寫完這個題目貼出後,才讀到這本書,讓我費了不少時間從不同地方挖掘到這些結果。對這個題目感興趣想進一步學習的人,一定要看這本書。除了這裏最後一節Nowak和Brembs的兩篇論文結果外,這本書闡述了這裏前麵四節的非常相似的內容,而且附有兩次電腦仿真實驗數據結果。所不同的,他是政治學者,原創者,熱情地用電腦仿真和博弈論來證明和鼓吹合作可以從霍布斯叢林中產生。我是普及者,在這裏則始終用博弈的邏輯引導讀者思考這個問題。
Robert Axelrod的第二本書,1997年的《The Complexity of Cooperation:Agent-Based Models of Competition and Collaboration》集合了他幾篇的論文,作為上一本書的延續。在這裏他繼續發揮了所擅長的,用計算機模擬人群決策的研究。主要內容有:遺傳算法演化新策略,在噪音環境下TFT策略的幾個變種,社會規範的產生,陣營和標準的形成,霸權的興衰和文化的傳播。中譯本在2008年出版,書名為《合作的複雜性——基於參與者競爭與合作的模型》。喜歡他計算機模擬人群決策研究方法的人,可從這書進一步了解他工作的成果。