互惠的博弈分析

期刊名字：制度經(jīng)濟(jì)學(xué)研究
文件大小：379kb
論文作者：羅伯特·薩金，皮建才
作者單位：東英格蘭大學(xué)經(jīng)濟(jì)學(xué),南京大學(xué)經(jīng)濟(jì)學(xué)院
更新時(shí)間：2020-09-25
下載次數(shù)：次

論文簡(jiǎn)介

互惠的博弈分析'0羅伯特.薩金”皮建才律”.[摘要]本文從博弈論的角度分析了互惠的形成以及形成互惠的穩(wěn)定均衡策略。[關(guān)鍵詞]互惠囚徒困境擴(kuò)展博弈針?shù)h相對(duì)勇敢互惠謹(jǐn)慎互惠中圖分類號(hào): F063.1 文獻(xiàn)標(biāo)識(shí)碼: A-、囚徒困境假設(shè)你是一個(gè)美國(guó)的學(xué)者,我是一個(gè)英國(guó)的學(xué)者。我們互訪彼此的大學(xué)，并且我們互換住處。因?yàn)橛龅搅艘蝗汉軔?ài)熱鬧的美國(guó)人，所以我打算在我返回英國(guó)之前舉行-個(gè)晚會(huì)。我知道這將會(huì)把你的房子搞得亂七八糟一煙頭燒壞椅子，啤酒弄臟地毯,但是這在很大程度上與我無(wú)關(guān)，因?yàn)槲乙院笤僖灿貌恢淌苓@些亂七八糟的東西。與此同時(shí)，你遇到了-群不緊不忙的英國(guó)人，所以你也打算在離開(kāi)之前為他們舉行-一個(gè)晚會(huì).......假設(shè)不管每個(gè)聚會(huì)造成什么樣的破壞，求助法律都是不可能的。你不會(huì)因?yàn)闅牡靥憾灰?。假設(shè)- -旦我們的互訪結(jié)束，不管是我們還是我們的●本文譯自羅伯特.薩金( Robert Sugden) 的著作《權(quán)利、合作與福利的經(jīng)濟(jì)學(xué)》 (The Eco-nomics of Rights, Cooperation and Welfare) 第6章，翻譯時(shí)把標(biāo)題“互惠”改成了“互惠的博弈分析"，摘要和關(guān)鍵詞為澤者所加。本文在翻譯時(shí)得到了韋森教授的指導(dǎo)。作者羅伯特.薩金( Robert Sugden),東英格蘭大學(xué)經(jīng)濟(jì)學(xué)教授( Profesor of Economics, Uni-versity of East Anglia)。中國(guó)煤化工...譯者:皮建才，博士后，南京大學(xué)經(jīng)濟(jì)學(xué)院教師;IYHCNMHG:學(xué)商學(xué)院安中大樓281信箱(210093); E-mail: jiancaipi@ hotnail om?！?12●互惠的博弈分析機(jī)構(gòu)都不會(huì)有任何彼此之間的交往。這樣的話，我們正在進(jìn)行的就是-一次性的博弈:交訪博弈( the exchange -visit game)。我們每個(gè)人都可以從兩個(gè)策略中選擇- -個(gè):或者進(jìn)行聚會(huì)，或者不進(jìn)行聚會(huì)。從我的觀點(diǎn)來(lái)看，我將把我們都進(jìn)行聚會(huì)的事態(tài)當(dāng)做已知數(shù),并且賦予這個(gè)結(jié)果零效用。這樣- -來(lái)，“不進(jìn)行聚會(huì)”將會(huì)給采取這種行動(dòng)的人帶來(lái)成本，卻給另-方帶來(lái)了好處。用c代表當(dāng)我不進(jìn)行聚會(huì)時(shí)損失的效用,用b代表當(dāng)你不進(jìn)行聚會(huì)時(shí)我得到的效用。對(duì)我來(lái)說(shuō)最壞的結(jié)果就是我沒(méi)有進(jìn)行聚會(huì)但你卻進(jìn)行了聚會(huì)，這個(gè)結(jié)果對(duì)我的效用是-c。對(duì)我來(lái)說(shuō)最好的結(jié)果就是我進(jìn)行了聚會(huì)而你卻沒(méi)有進(jìn)行聚會(huì)，這個(gè)結(jié)果對(duì)我的效用是b。如果我們都不進(jìn)行聚會(huì)，我得到的效用是b-c。不用多說(shuō)，b和c都是正的。我將設(shè)定b>c:相對(duì)于我們都進(jìn)行聚會(huì)我更加喜歡我們都不進(jìn)行聚會(huì)的結(jié)果。現(xiàn)在假設(shè)博弈從你的觀點(diǎn)來(lái)看和從我的觀點(diǎn)來(lái)看是一樣的，那么(暫時(shí)不考慮標(biāo)識(shí)性非對(duì)稱)我們得到的對(duì)稱博弈如圖1所示。對(duì)手的策略合作不合作(不進(jìn)行聚會(huì)) (進(jìn)行聚會(huì))(不進(jìn)行聚會(huì))b-e參與人的策略(進(jìn)行聚會(huì))b0注意: b>c>0且π>c/b。圖1交訪博弈 .當(dāng)然，這個(gè)博弈就是著名的囚徒困境博弈的一個(gè)版本。在囚徒困境博弈中，每個(gè)參與人都可以選擇兩個(gè)策略(合作和不合作)中的一個(gè)。對(duì)每個(gè)參與人而言，最壞的結(jié)果是他合作而他的對(duì)手不合作。第二壞的結(jié)果是他們都不合作。比這更好的結(jié)果是他們都合作。但是對(duì)每個(gè)參與人而言,所有結(jié)果中最好的結(jié)果是他不合作然而他的對(duì)手合作。在交訪博弈中進(jìn)行聚會(huì)是不合作策略，而不進(jìn)行聚會(huì)則是合作策略。我賦予了交訪博弈結(jié)果的效用值,用以保證我的博弈結(jié)構(gòu)和囚徒困境的博弈結(jié)構(gòu)一樣。現(xiàn)在想象- -一個(gè)學(xué)術(shù)社區(qū)的世界，其中每個(gè)人和其他人進(jìn)行重復(fù)但不匿名的交訪博弈。因此，總體上每個(gè)人積累了博弈的經(jīng)驗(yàn)，但是并不是關(guān)于特定對(duì)手的行為的經(jīng)驗(yàn)。這樣，博弈的分析非常簡(jiǎn)單。這里僅僅有一個(gè)均衡策略，即純策略“不合作”(進(jìn)行聚會(huì))。并且，這個(gè)均衡是穩(wěn)定的。注意到“不合作”是唯-一的最好回應(yīng)( best reply), 不僅對(duì)這個(gè)策略自身而言而且對(duì)所有的策略而言,不管是純的策略還是混合的策略.都是這樣。用常識(shí)性的話說(shuō)，我做的任何事情都不能中國(guó)煤化工進(jìn)行聚會(huì)，由于直到你回家時(shí)你才會(huì)知道我做了什么MHCNMHG最好也。 213.制度經(jīng)濟(jì)學(xué)研究進(jìn)行聚會(huì)。而且，如果你不進(jìn)行聚會(huì),那么無(wú)論如何我仍然最好利用你的好品性進(jìn)行聚會(huì)。因?yàn)椤安缓献鳌笔且粋€(gè)占優(yōu)策略，所以不管參與人認(rèn)識(shí)到博弈是對(duì)稱的還是非對(duì)稱的都無(wú)關(guān)緊要。不管我的角色是什么也不管我期望你做什么，對(duì)我來(lái)說(shuō)不合作總是最好。描述這個(gè)結(jié)果的一種方式是考慮-一個(gè)互利交易的機(jī)會(huì)一我們都想要達(dá)成不進(jìn)行聚會(huì)的協(xié)議一-但是我們不可能利用這個(gè)機(jī)會(huì)，因?yàn)楸M管我們能夠達(dá)成協(xié)議，但我們卻不能實(shí)施這些協(xié)議。(我們每個(gè)人可能許諾照看對(duì)方的房子，但是我們每個(gè)人都有違背諾言的激勵(lì))我們還有類似問(wèn)題的另一個(gè)例子。我把它叫做交易博弈(thetradinggame)。假設(shè)你從一個(gè)遠(yuǎn)方集郵的親戚那里繼承了一些稀有的郵票。你對(duì)這些郵票不感興趣，從務(wù)實(shí)的角度出發(fā)打算賣掉它們。你在雜志上做了廣告，并且接到了一個(gè)集郵者的電話，他給你開(kāi)價(jià)50英鎊。你接受了?，F(xiàn)在你必須決定如何安排郵票和金錢的交換。集郵者住的地方遠(yuǎn)在300英里，因此碰面是不實(shí)際的。你建議他郵寄給你50英鎊現(xiàn)金，你-收到這些錢就馬上把郵票郵寄過(guò)去。這樣的話你就可以防止他騙走你的郵票。他回應(yīng)了一個(gè)相反的建議:你把郵票郵寄給他，他-收到郵票就馬上把錢郵寄給你。這樣的話他就可以安全了。很明顯，你的位置和他的位置是彼此對(duì)稱的，你們不可能都是安全的。因此最后你同意一個(gè)對(duì)稱的解決方案。你許諾直接寄郵票，他許諾直接寄錢。他會(huì)遵守諾言嗎?你會(huì)嗎?這個(gè)博弈和交訪博弈有相同的結(jié)構(gòu):遵守諾言是合作的策略，而違背諾言則是不合作的策略。我們將再一次(假設(shè)進(jìn)行重復(fù)的匿名博弈)得到唯一-的穩(wěn)定均衡，在這個(gè)均衡中所有的人總是不合作，盡管每個(gè)人都可以從交易中獲利，但是沒(méi)有人交易。下面是最后-一個(gè)例子，是由休謨( Hume)給出的:你的莊稼今天熟，我的莊稼明天熟。我今天和你-起勞動(dòng)并且你明天幫助我，對(duì)我們來(lái)說(shuō)是有利的。我不會(huì)對(duì)你仁慈，也知道你不會(huì)對(duì)我仁慈。因此，我不會(huì)不辭辛苦地幫你收割你的莊稼;并且如果我和你--起勞動(dòng)來(lái)收割你的莊稼，我知道在期望回報(bào)方面我會(huì)失望，我只能徒然依靠你的感激。結(jié)果自然就是我不幫你，你也不幫我。季節(jié)輪回，我們每個(gè)人都失去自己的收獲，因?yàn)槲覀內(nèi)狈ο嗷ラg的信任和保證。這個(gè)博弈和前面兩個(gè)博弈稍微有些不同，在休謨的博弈中參與人輪流選擇(而不是同時(shí)選擇)合作還是不合作。但是這個(gè)區(qū)別并不顯著;充分分析休謨的博弈我們就可以發(fā)現(xiàn)唯一的穩(wěn)定均衡( 假設(shè)為重復(fù)匿名博弈)是誰(shuí)都不幫誰(shuí)。實(shí)際上,那正是休謨自中國(guó)煤化芏俗地表口日址山達(dá)出來(lái)。YHCNMHG●214.互惠的博弈分析二、擴(kuò)展囚徒困境博弈中的互惠我在第- -部分考慮的博弈都是匿名的。在匿名情形下，守諾是不可能獲得益處的。在-一次博弈中如果你違背諾言，被你欺騙的人并沒(méi)有辦法采取報(bào)復(fù)行動(dòng)，因?yàn)槲覀兗僭O(shè)他下一次不會(huì)遇到你一或者即使他遇到你也不會(huì)認(rèn)出你。并且，因?yàn)槲覀兞硗饧僭O(shè)你的對(duì)手從來(lái)就不知道你在以前的博弈中表現(xiàn)如何，所以也就沒(méi)有辦法為你遵守諾言建立聲譽(yù)。現(xiàn)在我將要考慮的是，如果參與人有機(jī)會(huì)下次見(jiàn)面，那么交訪博弈或囚徒困境博弈將會(huì)發(fā)生什么情況。我將通過(guò)分析囚徒困境博弈的擴(kuò)展彤式來(lái)做到這-一點(diǎn)。擴(kuò)展博弈由同樣兩個(gè)個(gè)體的一- 系列回合構(gòu)成，每一個(gè)回合從它自身的角度來(lái)看都是-一個(gè)簡(jiǎn)單的博弈，其中每個(gè)個(gè)體從他可以選擇的策略或行動(dòng)中進(jìn)行選擇。我將分析這樣的擴(kuò)展博弈，每個(gè)回合采取如圖1所示的形式，也就是說(shuō)，博弈由交訪博弈的重復(fù)行動(dòng)構(gòu)成(交訪博弈無(wú)疑是囚徒困境博弈的-一個(gè)例子)。擴(kuò)展博弈的每一回合之后都有π的可能性結(jié)束博弈，否則，就進(jìn)行另一個(gè)回合。因此博弈不會(huì)永遠(yuǎn)持續(xù)下去，但是不存在這樣-一個(gè)階段，該階段的參與人知道他們正在進(jìn)行最后一次見(jiàn)面。我認(rèn)為，這就是人類交互作用的方式?，F(xiàn)在我們可以運(yùn)用通常的均衡和穩(wěn)定性概念來(lái)分析擴(kuò)展博弈。這種分析的主要困難是存在大量的可能策略。--個(gè)策略就是進(jìn)行整個(gè)擴(kuò)展博弈的一個(gè)計(jì)劃。由于一一個(gè)策略會(huì)使得參與人在-一個(gè)回合中采取的行動(dòng)依賴于他的對(duì)手在以前的回合中采取的行動(dòng)，所以可能的策略的數(shù)量會(huì)隨著可能進(jìn)行的回合的數(shù)量而爆炸性地增長(zhǎng)。如果囚徒困境博弈僅進(jìn)行- -回合，那么每個(gè)參與人只有兩個(gè)可能的策略。如果進(jìn)行兩個(gè)回合，就有8個(gè)可能的策略;如果進(jìn)行三個(gè)回合，就有128個(gè)策略;如果進(jìn)行四個(gè)回合，就有2"或32 768個(gè)策略;如果進(jìn)行五個(gè)回合，就有2"或大約2150 000 000個(gè)策略!當(dāng)然，我分析的擴(kuò)展博弈并沒(méi)有對(duì)可能進(jìn)行的回合數(shù)設(shè)限。啟動(dòng)分析非常復(fù)雜的博弈的一種方式就是僅考慮-些相當(dāng)簡(jiǎn)單的策略。然而，在做這件事情之前，我將對(duì)π的值作出重要的假設(shè)。貫穿本章我都將假設(shè)π>c/b。為了弄清楚這意味著什么，我們可以想象兩個(gè)參與人達(dá)成了一個(gè)協(xié)議，即他們?cè)诿? -回合中相互合作。如果協(xié)議被遵守,每個(gè)參與人都可以獲得(b-c)(1 +π+π? +..或者(b-c)/(1-π)的期望效用。現(xiàn)在假設(shè)參與人知道一旦他違背協(xié)議。他的對(duì)手就再也不會(huì)同他合作(注意這是他的對(duì)手所能做的最嚴(yán)厲H中國(guó)煤化工人在第- -回合違背了協(xié)議，而他的對(duì)手卻遵守了協(xié)議CNMHG得到的i.215.制魔經(jīng)濟(jì)學(xué)研究效用為b。之后他將從每個(gè)回合中得到的效用為0,因?yàn)闆](méi)有人會(huì)和他合作。遵守協(xié)議值不值，依賴于(b-c)/(1-π) 比b大還是比b小，或者用等價(jià)的說(shuō)法，依賴于π比b大還是比b小。假設(shè)π >c/b意味著存在相互合作的協(xié)議的可能性。當(dāng)πc/b并不意味著典型的博弈進(jìn)行的回合很長(zhǎng)。舉個(gè)例子，如果b=2且c=1，那么當(dāng)π>1/2時(shí)-也就是博弈的平均回合數(shù)大于2. 0時(shí)一-假設(shè)就得到滿足?，F(xiàn)在我將考察擴(kuò)展囚徒困境博弈的一-些簡(jiǎn)單策略。我主要關(guān)心使參與人的合作依賴于他的對(duì)手的合作的那些策略，即互惠策略。但是我將首先分析其中兩個(gè)最簡(jiǎn)單的策略。這就是無(wú)條件的合作一在每一回合都進(jìn)行合作而不管你的對(duì)手的行為一以及無(wú)條件的不合作一在每一回合都不進(jìn)行合作。我將用S (代表容易受騙的人)和N (代表品質(zhì)惡劣的人)表示這些策略。一即刻明顯的是，S不可能是-一個(gè)均衡策略。如果你知道你的對(duì)手不管你做什么都將和你進(jìn)行合作的話，你的合作就沒(méi)有任何意義。對(duì)S最好回應(yīng)的唯一策略就是像N這樣的回應(yīng)策略一在每一 -回合中都不合作; S對(duì)它自身來(lái)說(shuō)并不是最好的回應(yīng)。同樣明顯的是，N是-一個(gè)均衡策略。如果你知道不管你怎么做你的對(duì)手都會(huì)不合作，那么你曾經(jīng)的合作就沒(méi)有任何意義。因此對(duì)N最好回應(yīng)的唯一策略就是在每一回合中都不合作的回應(yīng)策略。因?yàn)镹是這樣-一個(gè)策略,所以它是對(duì)自身的最好回應(yīng)。換句話說(shuō)，在一個(gè)大家都不合作的世界里，你最好的策略就是自己也不合作。N是穩(wěn)定均衡策略嗎?對(duì)N的唯一最好回應(yīng)是這些策略一一和 N博弈時(shí)每- -回合都不合作。但是N并不是具有這種性質(zhì)的唯一策略。我認(rèn)為,參與人會(huì)遵循謹(jǐn)慎的策略，除非他的對(duì)手先前合作過(guò)至少- -次,否則他永遠(yuǎn)不會(huì)合作。N是謹(jǐn)慎的策略，但是它并不是唯- -的這種策略。很容易明白的是，所有的謹(jǐn)慎策略(而不是別的策略)都是對(duì)N的最好回應(yīng)。我們也要注意，如果遵循謹(jǐn)慎策略的參與人相互碰面，他們永遠(yuǎn)不會(huì)合作。因此，只要所有的人都遵循這樣或那樣的謹(jǐn)慎策略,所有的謹(jǐn)慎策略就會(huì)產(chǎn)生相同的結(jié)果:沒(méi)有人會(huì)合作。這樣的結(jié)局就是沒(méi)有力量陽(yáng)止N刑參與人被某些別的謹(jǐn)慎策略侵占，但是沒(méi)有任何力量能夠培育中國(guó)煤化工是漂走(drift)中的一種。YCNMHG，216●互惠的博弈分析如果我們想對(duì)N的穩(wěn)定性或不穩(wěn)定性進(jìn)行更多的討論，我們就必須考慮到參與人時(shí)而不時(shí)犯錯(cuò)誤的可能性。我將通過(guò)如下的假設(shè)來(lái)模型化錯(cuò)誤,即，在每一回合中總是存在著很小的可能性一那些本來(lái)打算不合作的參與人實(shí)際上卻合作了，反過(guò)來(lái)也是這樣。我將假設(shè)，犯錯(cuò)誤的參與人會(huì)立即意識(shí)到他做了什么;他的對(duì)手知道實(shí)際上被采用的行動(dòng),但是他不知道這些行動(dòng)是有意的還是無(wú)意的。考慮這些假設(shè)，假定你的對(duì)手采用N策略，也就是說(shuō)，他打算在每一回合都不合作。他要是合作了，這只是一個(gè)錯(cuò)誤，而不是一個(gè)他打算將來(lái)合作的信號(hào)。所以你的最好回應(yīng)一你的唯一的最好回應(yīng)一- 就是審慎地從來(lái)不與他合作，不管你的對(duì)手做什么。換句話說(shuō)，N是對(duì)它自身的唯- - 最好回應(yīng):它是-一個(gè)穩(wěn)定均衡策略。然而，這并不是說(shuō)N是唯- -的穩(wěn)定均衡策略?，F(xiàn)在我將考慮- -種簡(jiǎn)單的互惠策略一與同你合作的人合作。這就是針?shù)h相對(duì)策略(簡(jiǎn)寫(xiě)為T)。遵循T策略的參與人在第一回合中合作。在每一個(gè)后續(xù)回合中他將跟他的對(duì)手在先前的回合中采用的策略( 合作或不合作)相同。注意，如果兩個(gè)T型參與人相遇，他們會(huì)在每一回合中都合作。然而，如果-一個(gè)T型參與人遇到了一個(gè)N型參與人，T型參與人只會(huì)在第一回合中合作,之后他就會(huì)不合作。這樣一來(lái)，T型參與人愿意同他們一樣的人合作，但是他們并不準(zhǔn)備成為輕易上當(dāng)受騙的人。T是穩(wěn)定策略嗎?下面的討論基于阿克塞爾羅德( Axelrod, 1981) 的文獻(xiàn)。假定你知道你的對(duì)手采用T策略，并且假定你打算把博弈進(jìn)行到第i回合。這里有兩種可能性，依賴于這是不是第-回合，如果不是的話，依賴于你在先前的回合采用的策略:或者你的對(duì)手將在第i回合合作，或者他在第i回合不合作。你知道情形會(huì)是哪- -種。給定上述知識(shí)，你就有可能為剩下的博弈找出對(duì)你的對(duì)手的行動(dòng)的最好回應(yīng)(因?yàn)樗诘趇+1, i+2, .回合的行動(dòng)將完全由你有待采取的行動(dòng)決定)。另外，不難發(fā)現(xiàn), i的價(jià)值與你的計(jì)算無(wú)關(guān)。你在第i+1, i+2, ..回合采取的行動(dòng)獨(dú)立于i。因此下面的兩個(gè)問(wèn)題將有獨(dú)立于i的確定的答案:1.如果你的對(duì)手在第i回合合作，那么你也在第i回合合作是最好回應(yīng)的一部分嗎?2.如果你的對(duì)手在第i回合不合作，那么你在那- -回合合作是最好回應(yīng)假定問(wèn)題1的答案是“是”。然后令i=1。你知道你的對(duì)手將會(huì)在第-回合合作，所以你也合作是-個(gè)最好回應(yīng)。但是如果你在第- -回合合作，你的對(duì)手在第二二回合將合作。那么你也合作將是一個(gè)最好向應(yīng)_諸加此類。因此，如果問(wèn)題1的答案是“是”，在每-回合中國(guó)煤化工應(yīng)?，F(xiàn)在反過(guò)來(lái)假設(shè)問(wèn)題1的答案是“不是”MHCN MH可應(yīng)都,.217.制度經(jīng)濟(jì)學(xué)研究是在第- -回合不合作。這保證你的對(duì)手在第二回合不合作?，F(xiàn)在有兩種可能性，它們依賴于問(wèn)題2的答案。如果那個(gè)問(wèn)題的答案是“不是”，任何對(duì)T的最好回應(yīng)都是在第二回合也不合作。諸如此類。在每一回合中不合作是對(duì)T的最好回應(yīng)。如果反過(guò)來(lái)問(wèn)題2的答案是“是”，那么你在第二回合中合作將會(huì)是一個(gè)最好回應(yīng)。這將會(huì)保證你的對(duì)手在第三回合合作。這重復(fù)了第一回合的位置，所以你將再次不合作。諸如此類。在奇數(shù)回合中不合作而在偶數(shù)回合中合作是對(duì)T的最好回應(yīng)。現(xiàn)在考慮對(duì)T的三種可能的回應(yīng): T自身, N (例如在每- -回合都不合作)和一個(gè)新策略A。A (為了交替)是一種在奇數(shù)回合中合作、在偶數(shù)回合中不合作的策略。我們從上面段落的討論中知道，這三種策略中肯定有一種是對(duì)T的最好回應(yīng)。我們現(xiàn)在可以估計(jì)出采取每種策略來(lái)回應(yīng)T時(shí)獲得的期望效用。運(yùn)用圖1中的效用指數(shù):E(T, T)=(b-c)(1 +π+π2 +..)=(b-c)/(1-π)(1)E(N, T) =b(2)E(A, T)=b-mc+πb-π'e+π'b..=(b-πc)/(1-π')(3)不難算出，如果π>c/b (正如我已經(jīng)假設(shè)的),那么E(T, T)>E(N,T)且E(T, T) >E(A, T)。換句話說(shuō)，作為對(duì)T的回應(yīng)，T比N或A更好。但是由于它們中有一個(gè)是對(duì)T的最好回應(yīng)，所以T必定是對(duì)它自身的最好回應(yīng)，即針?shù)h相對(duì)策略是一個(gè)均衡策略。三、懲罰和補(bǔ)償針?shù)h相對(duì)是慣例嗎?我已經(jīng)指出針?shù)h相對(duì)策略是擴(kuò)展囚徒困境博弈中的均衡策略。我也指出它并不是唯一的均衡。策略N (從來(lái)不合作)也是一個(gè)均衡，每個(gè)人都不合作使壞的均衡是穩(wěn)定的。根據(jù)我的定義，慣例就是兩個(gè)或多個(gè)穩(wěn)定均衡策略中的-一個(gè);因此為了說(shuō)明針?shù)h相對(duì)策略是一個(gè)慣例，我必須說(shuō)明針?shù)h相對(duì)策略是-一個(gè)穩(wěn)定均衡策略。在第二部分中，針?shù)h相對(duì)策略T的唯- -最好回應(yīng)是這樣的策略，和T博弈時(shí)每一回合都合作。T有這樣的性質(zhì)一這就是為什么T是- -個(gè)均衡策略一但是別的策略也這樣。其中最為明顯的例子就是S一容易受騙的人的無(wú)條件合作策略。和S對(duì)招時(shí)，S和T-樣成功。只要每個(gè)人遵循這兩種策略中的這種或那種，就從來(lái)不會(huì)有不合作出現(xiàn)。這意味著并沒(méi)有力量阻止T型參與人的世界被S型參與人侵占;但是也沒(méi)有力丹平培美汶樣的侵占。中國(guó)煤化工我們?cè)僖淮蔚玫狡? drift)的情形。因此我將像先前一樣假定，參與人有時(shí)MH.CNMH.沒(méi)定，我●218●互惠的博弈分析需要在定義針?shù)h相對(duì)策略時(shí)進(jìn)行--下小的改動(dòng)。假設(shè)你很有把握你的對(duì)手將采用針?shù)h相對(duì)策略。因此你在每- -回合都合作，并且你的對(duì)手也合作。接著在一個(gè)回合中，比如說(shuō)回合i,你犯了一個(gè)錯(cuò)誤，你想要合作但結(jié)果卻沒(méi)有合作。你現(xiàn)在應(yīng)當(dāng)怎么做呢?你會(huì)預(yù)期到你的對(duì)手為了回應(yīng)你的偶然的不合作會(huì)在第i+1回合不合作。如果你遵循嚴(yán)格的針?shù)h相對(duì)原則，你將在第i+2回合以不合作回應(yīng)，接著你的對(duì)手將在第i+3回合也不合作，依次類推。通過(guò)在第i+2回合合作來(lái)縮短報(bào)復(fù)和反報(bào)復(fù)的無(wú)休止的鏈條似乎更好。我將這種隱藏在變種的針?shù)h相對(duì)策略中的直覺(jué)稱為T1。T1開(kāi)始于擁有好名聲的概念。其中的精髓思想是擁有好名聲的參與人有權(quán)利或資格來(lái)與他的對(duì)手合作。博弈開(kāi)始時(shí)每個(gè)參與人都被認(rèn)為有好名聲。一個(gè)參與人可以保持好名聲，只要他經(jīng)常按照T1的限定來(lái)合作。如果●任-一個(gè)參與人在當(dāng)T1限定他應(yīng)當(dāng)合作時(shí)沒(méi)有合作,他就會(huì)失去他的好名聲;在后續(xù)的博弈中合作后他就會(huì)重新得到他的好名聲(這就是為什么我把這個(gè)策略稱為T1;如果需要兩個(gè)回合的合作才能重新得到好的名聲，這個(gè)策略就是T2,依次類推)。給定所有這些，T1可以被系統(tǒng)地闡述如下:“當(dāng)你的對(duì)手擁有好名聲時(shí)，或者當(dāng)你不擁有好名聲時(shí)，合作;否則，不合作?！睂?duì)一個(gè)從來(lái)不犯錯(cuò)誤的參與人來(lái)說(shuō)，T和T1是相互等價(jià)的(如果你遵循T1且不犯錯(cuò)誤，你就會(huì)一直有好名聲，因此T1將限定你的對(duì)手在每一回合都合作。因此你的對(duì)手是否在任- -回合中都擁有好名聲完全依賴于他是否在先前的回合中與你合作。如果他在第i-1回合合作，T1就要求你在第i回合合作;如果他在第i-1回合不合作，T1就要求你在第i回合不合作)。T1和T的區(qū)別僅涉及參與人在犯了錯(cuò)誤不合作后采取的行動(dòng)。假設(shè)將遵循T1并將博弈第i回合;你和你的對(duì)手都有好名聲。因此你應(yīng)當(dāng)在第i回合合作。然而，假設(shè)當(dāng)你的對(duì)手合作時(shí)你犯錯(cuò)誤沒(méi)有合作。接著你失去了你的好名聲。現(xiàn)在，根據(jù)T1,你應(yīng)該在第i+1回合合作。由于你已經(jīng)失去了好名聲，你的對(duì)手在第i+1回合不合作也不會(huì)失去他的好名聲，因此不管他在第i+1回合怎么做, T1都會(huì)要求你在i+2回合合作。只要犯錯(cuò)誤的概率充分小，T1就是-一個(gè)穩(wěn)定均衡策略。為什么?假設(shè)你知道你的對(duì)手將遵循T1,并且你將進(jìn)行第i回合的博弈。假設(shè)不管過(guò)去發(fā)生了什么，你和你的對(duì)手都不會(huì)犯更深層次的錯(cuò)誤。我將指明在這樣的假設(shè)下唯一的最好回應(yīng)就是“當(dāng)你的對(duì)手擁有好名聲時(shí),或者當(dāng)你不擁有好名聲時(shí)，合作;否則，不合作。”但是，如果當(dāng)沒(méi)有進(jìn)--步犯錯(cuò)誤的可能性時(shí)這是唯一的最好回應(yīng)一也就是說(shuō)，如果這個(gè)回應(yīng)嚴(yán)格優(yōu)于其他回應(yīng)一那么當(dāng)有進(jìn)一步(犯)錯(cuò)誤的可能性時(shí)，只要犯錯(cuò)誤的可能性足夠得小，它就必定保持為唯- -的最好回應(yīng)。因此，我將中國(guó)煤化工的可能.性但可能性足夠小時(shí)，“當(dāng)你的對(duì)手擁有好名HCNMHG好名聲●219.制度經(jīng)濟(jì)學(xué)研究時(shí)，合作;否則,不合作”是對(duì)T1的最好回應(yīng)。但是這個(gè)回應(yīng)是T1。所以我將證明T1是一個(gè)穩(wěn)定均衡策略?，F(xiàn)在我們將進(jìn)行證明。當(dāng)你進(jìn)入第i回合時(shí)，只有三種可能性:1.或者你和你的對(duì)手都擁有好名聲，或者你們都不擁有好名聲。這樣你的對(duì)手將在第i回合合作并且之后采用針?shù)h相對(duì)策略(例如，重復(fù)你最后的行動(dòng))。2.你的對(duì)手擁有好名聲，但是你卻沒(méi)有好名聲。這樣他將在第i回合不合作并且之后采用針?shù)h相對(duì)策略。.3.你擁有好名聲，但是你的對(duì)手卻沒(méi)有好名聲。這樣他將在第i回合合作，在第i+1回合再次合作，并且之后采用針?shù)h相對(duì)策略。注意到在博弈的第- -回合，情形1必定適用。因此這就是我們?cè)诘诙糠址治龅那樾?，其中我證明如果不犯錯(cuò)誤，對(duì)策略T的最好回應(yīng)是在每一回合都合作(這個(gè)證明實(shí)際上是阿克賽爾羅德的)。所以我們知道在情形1你在第i回合的唯一的最優(yōu)行動(dòng)就是合作?，F(xiàn)在考慮情形2。注意到如果你在第i回合中合作,那么第i+1回合將會(huì)是情形1的步驟:你的對(duì)手在那一回合中合作，接著采用針?shù)h相對(duì)策略。我們知道在情形1你的唯一的最優(yōu)回應(yīng)是“合作，合作，...”.. 所以如果在第i回合合作是最優(yōu)行動(dòng)，那么在第i+1回合合作也是最優(yōu)行動(dòng)，依次類推。反過(guò)來(lái)如果你在第i回合不合作,那么第i+1回合就是情形2的另一個(gè)步驟;因此如果第i回合不合作是一一個(gè)最優(yōu)行動(dòng)，在第i+1回合不合作必定，是一個(gè)最優(yōu)行動(dòng)，依次類推。因此，回合i, i+1, .的兩種序列行動(dòng)中的一種必定是-個(gè)最好回應(yīng)一或者 “合作，合作，...或者“不合作，不合作，....考慮到假設(shè)π>c/b,前一種序列產(chǎn)生更大的期望效用。因此，在情形2下，就像在情形1下一樣,你在第i回合的唯-最優(yōu)行動(dòng)是合作。最后考慮情形3。在這種情形下，在第i回合你可以不合作而不會(huì)喪失自己的好名聲;不管你在第i回合做什么，第i+1回合都將是情形1的一個(gè)步驟。所以你的最優(yōu)行動(dòng)必定是在第i回合不合作。這就完成了證明:當(dāng)你的對(duì)手擁有好名聲時(shí)，或者當(dāng)你不擁有好名聲時(shí)(情形1和2)，你在第i回合的最優(yōu)行動(dòng)是合作;否則，就不合作(情形3)。這樣一來(lái)，T1策略就是一個(gè)穩(wěn)定的均衡一一-但不是唯一穩(wěn)定的均衡。.(回憶起無(wú)條件不合作也是一個(gè)穩(wěn)定的均衡)換句話說(shuō)，T1是-一個(gè)慣例?？紤]一下這個(gè)慣例用日常的措詞怎么說(shuō)。它從開(kāi)始就很明顯是-一個(gè)互惠慣例:只要他的對(duì)手愿意合作，一個(gè)遵循T1策略的人就愿意合作。但是它也是一一個(gè)懲罰慣例。假設(shè)在某個(gè)i回合當(dāng)你合作的時(shí)候你的對(duì)手錯(cuò)誤地沒(méi)有合作，那中國(guó)煤化工你成了輕易受騙的人。現(xiàn)在慣例規(guī)定在下一回合你MHCNMHG合作時(shí)●220.互惠的博弈分析他應(yīng)當(dāng)合作。這樣在第i+2回合你們都再次合作。發(fā)生在第i+1回合的事情可以看成是對(duì)你的對(duì)手的先前的違背慣例的懲罰:他在那一回合中得到了最壞的可能結(jié)果( 效用損失為c)。注意到這個(gè)結(jié)果比他像你一樣第i+1回合不合作的結(jié)果要差。在這個(gè)意義上，你的對(duì)手愿意接受懲罰(知道如果他不這樣，對(duì)他來(lái)說(shuō)長(zhǎng)期結(jié)果仍將會(huì)更加糟糕)。但是，說(shuō)你的對(duì)手已經(jīng)被懲罰了只不過(guò)講了故事的一半。在第i+1回合你得到最好的可能結(jié)果一效用收益為 b。對(duì)你來(lái)說(shuō)這比相互合作的回合的結(jié)果更好，更不要說(shuō)相互不合作的回合的結(jié)果了。所以第i+1回合的事件不僅對(duì)你的對(duì)手施加了傷害，而且使你獲益。換句話說(shuō)，正在進(jìn)行的不僅是懲罰，而且是補(bǔ)償。我們可以這么說(shuō)，慣例規(guī)定你的對(duì)手進(jìn)行補(bǔ)償行動(dòng)。你在第i+1回合的不合作以及他的合作都是這個(gè)行動(dòng)的一部分。策略T1規(guī)定補(bǔ)償?shù)幕睾习殡S任何不合理的不合作(也就是說(shuō)，任何不合作并不是由T1規(guī)定的)。這一回合過(guò)后，兩個(gè)參與人再次合作。為什么僅有一個(gè)補(bǔ)償回合呢?畢競(jìng)，這種補(bǔ)償并沒(méi)有充分抵消受害方從另一個(gè)參與人的違背慣例中所遭到的損失。最初的違背一比如說(shuō)在第i回合一對(duì)受害方施加了成本b:這是他本來(lái)應(yīng)該從他的對(duì)手的合作行動(dòng)中得到的利益。第i+1回合的補(bǔ)償行動(dòng)允許受害方節(jié)省c，因?yàn)樗麖膶?duì)手的合作行動(dòng)中獲得了利益而不會(huì)招致他自己合作的成本。但是我們知道b>c。另外，節(jié)省c的成本必須被貼現(xiàn)以考慮第i+1回合不會(huì)進(jìn)行的可能性。答案是補(bǔ)償?shù)某潭缺旧砭褪且灰粋€(gè)慣例。受害方要求的補(bǔ)償跟他期望他的對(duì)手容許讓與的一-樣多，并且他的對(duì)手提供的和其預(yù)期第-個(gè)參與人堅(jiān)持要求的一-樣多。我們想象策略T2 (規(guī)定對(duì)每個(gè)不合理的不合作有兩回合的補(bǔ)償)，或者策略T3 ( 規(guī)定三回合的補(bǔ)償)，等等。我們可以證明( 但是在這里我將不會(huì)給出)任何一個(gè)像Tr的策略都是一個(gè)穩(wěn)定的均衡，只要π' >c/b。因此如果π充分地接近1,任何Tr策略都是一個(gè)穩(wěn)定的均衡,但是r的值越大，π的值必須越接近1以保證穩(wěn)定性。這是為什么呢?r的值越大，參與人犯錯(cuò)誤后重新獲得好名聲就得付出更大的補(bǔ)償;我們可以說(shuō)，遵循阿克塞爾羅德(1981), r值越小的策略越容易被寬容。-一個(gè)可以成為均衡的策略有多寬容有一個(gè)明顯的限制:補(bǔ)償必須足夠地難以負(fù)擔(dān)以阻止有目的的不合作。但是，即使對(duì)T1一所有策略中最寬容的策略來(lái)說(shuō)，這也是真的。超過(guò)這一點(diǎn)不寬容就是一種危險(xiǎn)。一旦犯了一次錯(cuò)誤，參與人并不是被迫補(bǔ)償,他也許反過(guò)來(lái)屈從于他的好名聲的喪失，并且繼續(xù)不合作。他的對(duì)手越不寬容，后一種選擇的吸引力就越大。π的值越小它也會(huì)更具吸引力，因?yàn)椴┺目赡芙Y(jié)束得越快，保持好名聲的收益就越小。中國(guó)煤化工YHCNMHG制度經(jīng)濟(jì)學(xué)研兗四、演化偏佑互惠嗎我一直考慮的針?shù)h相對(duì)策略是大族中的成員，我把這個(gè)大族稱為勇敢互惠策略。這些策略有兩個(gè)定義性的特征。第一，對(duì)每- -回合都不合作的對(duì)手而言，這些策略是，除了在第一-回合以外每- -回合都不合作。第二，如果兩個(gè)勇敢互惠策略的參與人相遇，他們?cè)诿恳换睾隙紩?huì)合作(再次提醒,只要沒(méi)有犯錯(cuò)誤)。注意兩個(gè)參與人不需要遵循同樣的策略。一個(gè)策略能夠只滿足第二個(gè)條件，如果它在第- -回合總是合作(直到進(jìn)行了第一回合，沒(méi)有參與人能夠知道關(guān)于他的對(duì)手的策略的任何事情)。這就是我為什么稱這些策略為“勇敢”的原因。在有證據(jù)顯示你的對(duì)手將互惠以前就準(zhǔn)備合作，就為你總是被不合作的對(duì)手利用敞開(kāi)了大門。如果你遵循勇敢互惠策略，這種利用將僅限為-回合，但這仍然是利用。如果你遵循任何“與它自身合作”的策略，這都是不得不付出的代價(jià)一也就是說(shuō)，任何一種策略一當(dāng) 參與人雙方在博弈中都遵循它時(shí)，他們將相互合作(如果除非別的參與人已經(jīng)合作過(guò)，沒(méi)有參與人愿意合作,他們將永遠(yuǎn)壓根兒不會(huì)合作;因此如果一個(gè)策略是和它自身合作，那么它就必須在有證據(jù)顯示對(duì)方有同樣的合作意愿之前就愿意合作)?，F(xiàn)在假設(shè)當(dāng)人們進(jìn)行擴(kuò)展囚徒困境博弈時(shí)，他們僅考慮兩種類型的策略一-勇敢互惠策略和無(wú)條件背叛不合作策略(N)。當(dāng)然，當(dāng)實(shí)際可得的策略的數(shù)字無(wú)限大時(shí)，這只是一一個(gè)大膽的簡(jiǎn)化。(回憶起即使是五個(gè)回合的擴(kuò)展囚徒困境博弈也有超過(guò)20億個(gè)策略!)但是我們必須從某個(gè)地方開(kāi)始?，F(xiàn)在有三種可能性。第一，兩個(gè)N型參與人可能相遇。他們?cè)诿恳换睾隙疾缓献?，每個(gè)人只能從博弈中得到零效用。第二，一個(gè)N型參與人遇;到某個(gè)遵循勇敢互惠策略的人(我把他叫做B型參與人)。除了第一回合,他們將在所有回合都不合作;但是在第-回合N型參與人不合作，而B(niǎo)型參與人合作。因此從整個(gè)博弈中N型參與人得到的效用為b,而B(niǎo)型參與人得到的效用為-c。第三種可能性是兩個(gè)B型參與人相遇。他們?cè)诿? ~回合都合作，從而在每一回合中得到的效用為b-c;這一效用流的期望值是(b-c)/(1-π)。注意，B型參與人遵循同樣的策略與否無(wú)關(guān)緊要;重要的是每個(gè)B型參與人遵循某種勇敢互惠策略。這種情形可以用圖2所示的簡(jiǎn)單對(duì)稱博蠻來(lái)描述?，F(xiàn)在這個(gè)博弈可以用中國(guó)煤化工通常的方式進(jìn)行分析。PYHCNMHG.222.互惠的博弈分析對(duì)手的策略B(合作)(無(wú)條件不合作)(b-c)/(1-π)-參與人的策略N (無(wú)條件不合作)注意: b>c>0 且π>c/b。圖2擴(kuò)展囚徒困境博弈的-個(gè)簡(jiǎn)單版本注意，N是對(duì)N的最好回應(yīng)，并且只要π>c/b, B就是對(duì)B的最好回應(yīng)。因此參與人會(huì)選擇哪-一個(gè)更好的策略依賴于他的對(duì)手選擇-種策略而不是另一種策略的可能性。令p表示一個(gè)隨機(jī)的對(duì)手選擇策略B的可能性。那么將有p的某個(gè)臨界值，比如說(shuō)p", 根據(jù)p是否大于、等于或小于p°來(lái)使得B比N更加成功、一樣成功或更不成功。很容易計(jì)算出這個(gè)臨界值是:p° =cl一π/[π(b-c)](4)如果再--次遇到對(duì)手的概率相當(dāng)高，那么這個(gè)p的臨界值可能非常接近于零。舉個(gè)例子，假設(shè)b=2且c=1 (這看起來(lái)和任何-一個(gè)假設(shè)- - 樣中立)。這樣當(dāng)π=9時(shí)，意味著博弈的平均長(zhǎng)度為10回合，p的臨界值是0.11。當(dāng)π=0.98時(shí)，結(jié)果是博弈的平均長(zhǎng)度為50回合，臨界值是0.02。這反映的事實(shí)是采用B策略是一種有風(fēng)險(xiǎn)的投資。冒著在第一回合有可能被N型參與人利用的風(fēng)險(xiǎn)，你就能夠跟B型參與人在每- -回合都合作。博弈可能進(jìn)行的時(shí)間越長(zhǎng)，從成功的投資上獲得補(bǔ)償?shù)臅r(shí)間就越多。這個(gè)結(jié)果似乎表明，在平均擁有多個(gè)回合的博弈中，勇敢互惠的慣例有很好的機(jī)會(huì)演化出來(lái)。即使開(kāi)始時(shí)大多數(shù)參與人都是品質(zhì)惡劣的人，這些品質(zhì)惡劣的人的也可能做得比少數(shù)遵循勇敢互惠策略的人差;這樣- -來(lái)，少數(shù)群體就會(huì)有-一個(gè)增長(zhǎng)的自我加強(qiáng)的趨勢(shì)。注意，即使少數(shù)團(tuán)體中的成員并不都遵循同樣的策略，這個(gè)觀點(diǎn)也是對(duì)的。換句話說(shuō)，在任何關(guān)于補(bǔ)償?shù)奶囟☉T例之前，勇敢互惠的一-般慣例就會(huì)自己建立起來(lái)。現(xiàn)在有另一個(gè)觀點(diǎn)，希望演化偏佑勇敢互惠策略。這個(gè)觀點(diǎn)并不要求有臨界數(shù)量的勇敢互惠者:只要有任意一些勇敢互惠者，勇敢互惠慣例就能夠演化出來(lái)。然而，有必要假設(shè)所有的勇敢互惠者遵循同樣的關(guān)于補(bǔ)償?shù)膽T例。注意，可能有謹(jǐn)慎的互惠策略而不是勇敢的互惠策略(- 一個(gè)謹(jǐn)慎的策略就是從來(lái)不會(huì)先去合作，見(jiàn)第二部分)。遵循謹(jǐn)慎互惠策略的個(gè)體會(huì)等待他的對(duì)手采用第-一個(gè)合作的行動(dòng);那樣，并且只有那樣，他才會(huì)合作。這種類型策略的很大的優(yōu)勢(shì)是它會(huì)導(dǎo)致跟勇敢互惠者會(huì)作而又不會(huì)引起被品質(zhì)惡劣的人利用的風(fēng)險(xiǎn)。當(dāng)然，它的主要YH中國(guó)煤化工自身合作:謹(jǐn)慎參與人不能夠從對(duì)手中區(qū)分出誰(shuí)是CNMHG的(參..223●制度經(jīng)濟(jì)學(xué)研究見(jiàn)第二部分)。如果謹(jǐn)慎的策略想要成功，它們就需要進(jìn)行調(diào)整以適應(yīng)在勇敢對(duì)手中流行的補(bǔ)償慣例。舉個(gè)例子，假設(shè)所有勇敢參與人都遵循T1--針?shù)h 相對(duì)策略-一規(guī)定對(duì)每次不合理的不合作只有一個(gè)補(bǔ)償回合(參見(jiàn)第二部分)。因此，一個(gè)在第一-回合沒(méi)有合作卻發(fā)現(xiàn)他的對(duì)手已經(jīng)合作的參與人實(shí)際上確定對(duì)手正在采用T1策略(并不是完全確定，因?yàn)閷?duì)手可能有意不合作，但卻犯了一個(gè)錯(cuò)誤)?，F(xiàn)在謹(jǐn)慎的參與人和T1型參與人處于同樣的位置, T1型參與人幾乎確定他面對(duì)的對(duì)手和他- -樣偶爾在第一回合不合作。所以謹(jǐn)慎的參與人的最好的計(jì)劃是跟T1型參與人正好做得一樣:在下兩回合合作，接著采取針?shù)h相對(duì)。下面是這種類型策略的一個(gè)簡(jiǎn)單表述:“ 在第一回合不合作。如果你的對(duì)手在第- -回合不合作，你就在所有的后續(xù)回合都不合作。如果你的對(duì)手在第一回合合作，你就在所有的后續(xù)回合中采取似乎是T1的策略，把你在第一回合的不合作看成似乎是一一個(gè)錯(cuò)誤?！蔽野堰@個(gè)策略稱為CI ( 很容易看出策略C2, C3, .，可以被設(shè)計(jì)成與勇敢策略T2, T3, ..吻合)?，F(xiàn)在考慮當(dāng)我們假設(shè)唯- -的可得策略為N. T1和C1時(shí)博弈的結(jié)果。這個(gè)博弈表示在圖3中。為了解釋這個(gè)觀點(diǎn)，我將用到數(shù)值b=2, c=1和π=0.9,這給出圖4所示的博弈。然而，并沒(méi)有什么會(huì)依靠這些數(shù)字;對(duì)驗(yàn)證這個(gè)觀點(diǎn)來(lái)說(shuō)重要的是(正像我在通貫本章中假設(shè)的) π>c/b。對(duì)手的策略T1C1N(b-c)/(1-π)(b-c)/(1-π)-b+πc參與人的策略Cl(b-c)/(1 -π) -b+ πc0注意: b>c>0且π>c/b。圖3擴(kuò)展囚徒困境博弈的另一一個(gè)版本r1;1108.9-參與人的策略C19.2注意:這些指數(shù)是通過(guò)令b=2, c=1和u=0.9得到的。圖4圖3 中博弈的說(shuō)明性的效用指數(shù)現(xiàn)在考慮-一個(gè)社區(qū),其中剛開(kāi)始有一些人遵循T1, - -些人遵循C1，一些人遵循N。令與這些策略相聯(lián)系的概率分別為pq. p(1-a)和1-p.換句話說(shuō)，p是- -個(gè)隨機(jī)的對(duì)手采用互惠策略IYH中國(guó)煤化工定- -個(gè)對(duì)手正在采用互惠策略，q是他采用勇敢互CNMHG.224.互惠的博弈分析只要pq>0,最好的策略必定或者是T1或者是C1 (N被CI占優(yōu):在對(duì)付采用T1策略的對(duì)手方面它做得比C1更壞，并且在對(duì)付任何策略方面都至少和C1-樣好)。因此，只要一些人遵循T1，隨著人們通過(guò)經(jīng)驗(yàn)學(xué)習(xí)不去采用N, p的值- -定會(huì)穩(wěn)定上升。但是要注意，T1是對(duì)T1和C1的最好回.應(yīng)。因此，如果p的值足夠地高，T1一定會(huì)是最成功的策略。因此，即使T1剛開(kāi)始并不是最成功的策略，它最終也將變成最成功;并且它將保持最成功，不管多少人轉(zhuǎn)而采用它。轉(zhuǎn)變成更為常識(shí)意義上的話，想象-一個(gè)社區(qū)，其中剛開(kāi)始幾乎所有的人都是品質(zhì)惡劣的人。在這個(gè)社區(qū)中，成為一個(gè)勇敢的互惠者并不會(huì)受益，因?yàn)楹献鞯某h人幾乎總是被擊敗。但是成為一個(gè)謹(jǐn)慎的互惠者并不會(huì)失去任何東西:這允許你與自己碰巧遇見(jiàn)的任何-一個(gè)勇敢互惠者合作，卻能夠保護(hù)你不被品質(zhì)惡劣的人利用。因此人們會(huì)慢慢弄明白，謹(jǐn)慎的互惠能夠獲得好處。但是謹(jǐn)慎的互惠者有可能因?yàn)樘?jǐn)慎而不能相互合作:他們只能夠和勇敢互惠者合作。隨著謹(jǐn)慎互惠者數(shù)量的增長(zhǎng)，并且隨著品質(zhì)惡劣的人的數(shù)量的下降，勇敢會(huì)獲得好處的時(shí)間將會(huì)來(lái)臨。在這個(gè)模型中，謹(jǐn)慎互惠的作用更像是某些類型的生長(zhǎng)在被擾亂的土地上的植物一-這些植物拓殖別的物種發(fā)現(xiàn)不適于生存的生存地，但是它們的出現(xiàn)有助于產(chǎn)生這樣的條件，這些條件偏佑最終占領(lǐng)和接管的其他物種?，F(xiàn)在我已經(jīng)給出了兩個(gè)論據(jù)，認(rèn)為社會(huì)演化的過(guò)程可能偏佑那些勇敢互惠策略。但是，我必須承認(rèn)沒(méi)有任何一個(gè)論據(jù)是完全令人信服的。問(wèn)題是,很難看出任何一個(gè)旨在表明演化將偏佑某些特定類型策略的論據(jù)不只是提示性的。在擴(kuò)展的囚徒困境博弈中有數(shù)不清的數(shù)以億計(jì)的策略;看起來(lái)我們只有限制在一-些基本類型的策略中才能分析這個(gè)博弈，這意味著任何分析都是不完全的。我認(rèn)為，這個(gè)問(wèn)題永遠(yuǎn)不會(huì)被解決;但是阿克塞爾羅德(1981) 給出了一個(gè)具有吸引力的方法，這一方法有某種程度的進(jìn)步。阿克塞爾羅德的方法一他稱之為錦標(biāo)賽方法一就是具體指定- -種特定形式的擴(kuò)展岡徒困境博弈并接下來(lái)讓來(lái)者遞交進(jìn)行博弈的策略。然后讓這些策略在某種類型的錦標(biāo)賽中彼此自由地對(duì)抗，在這種錦標(biāo)賽中所有的策略對(duì)抗所有的策略(allplay against all)，看誰(shuí)將勝出。這種方法的動(dòng)人之處在于，盡管分析的策略是有限的一那當(dāng)然是不可避免的，但并沒(méi)有強(qiáng)加任意的限制。沒(méi)有人會(huì)抱怨分析者通過(guò)排除可能做得更好的特定策略從而固定了他的分析結(jié)果，或者抱怨他因?yàn)樘尖g從而不能認(rèn)識(shí)到特定策略的優(yōu)點(diǎn)進(jìn)而忽略了這些策略。如果你有一個(gè)自己做得好的得意策略,你所做的全部就是讓它進(jìn)入錦標(biāo)賽。僅有的限制是由人類創(chuàng)造力施加的一當(dāng)然那種中國(guó)煤化工活的博弈中。YHCNMHG●225.制度經(jīng)濟(jì)學(xué)研究阿克塞爾歲德組織了一個(gè)這種類型的錦標(biāo)賽。他采用的擴(kuò)展囚徒閑境博弈的版本與我一直分析的博究稍微不同。在我的版本的博究中，一個(gè)參與人(當(dāng)對(duì)手不合作時(shí)不合作，當(dāng)對(duì)手合作時(shí)合作，當(dāng)對(duì)手合作時(shí)不合作，當(dāng)對(duì)手不合作時(shí)合作)的四種可能的結(jié)果的效用指數(shù)是0，b-c, b和-c，且有b>c>0。而阿克塞爾羅德的博弈的效用指數(shù)是1, 3, 5和0。這兩種類型的表述并不能嚴(yán)格地兼容，但是博弈的本質(zhì)結(jié)構(gòu)卻是相同的。π的值被設(shè)定在0.99654，以便博弈的中間數(shù)長(zhǎng)度為200回合;期望長(zhǎng)度為289回合。錦標(biāo).賽根據(jù)回合知更鳥(niǎo)原則( round-robin principle) 組織，策略作為計(jì)算機(jī)程序被遞交。阿克塞爾羅德的錦標(biāo)賽有62個(gè)進(jìn)人者。他報(bào)道說(shuō)，進(jìn)人者包括“經(jīng)濟(jì)學(xué)、心理學(xué)、社會(huì)學(xué)、政治科學(xué)和數(shù)學(xué)的博弈理論家”和“演進(jìn)生物學(xué)、物理學(xué)和計(jì)算機(jī)科學(xué)的教授”(阿克塞爾羅德，1981)。獲勝者是由博弈理論家拉波波特( Anatol Rapoport)遞交的簡(jiǎn)單的針?shù)h相對(duì)策略。在解釋這個(gè)結(jié)果時(shí),我們的腦海中必須想著一些條件。第一，π的值要相當(dāng)高，相對(duì)于謹(jǐn)慎的或不合作策略而言，這會(huì)傾向于偏佑勇敢互惠策略。第二，回合知更鳥(niǎo)錦標(biāo)賽并不跟演化過(guò)程- -樣。在回合知更鳥(niǎo)錦標(biāo)賽中,通過(guò)對(duì)付拙劣的對(duì)手表現(xiàn)優(yōu)異而積累高分是可能的，然而演化過(guò)程卻傾向于在一一個(gè)早期的階段就淘汰那些最不成功的策略。第三，在慣例的演化中，凸顯性(prominence)起到了重要的作用;并且凸顯性有時(shí)事關(guān)想象地跳躍和思想的聯(lián)結(jié)，這些并不能夠輕易地簡(jiǎn)化成數(shù)學(xué)。通過(guò)進(jìn)行抽象的數(shù)學(xué)形式的實(shí)驗(yàn)，并且通過(guò)要求把策略寫(xiě)成計(jì)算機(jī)程序，阿克塞爾羅德不經(jīng)意間形成了對(duì)凸顯性的數(shù)學(xué)概念的偏心(bias)。然而，所有這些都說(shuō)明，阿克塞爾羅德的錦標(biāo)賽中針?shù)h相對(duì)策略的成功是顯著的。它為我們提供了更深層次的基礎(chǔ)，使我們相信:如果擴(kuò)展囚徒困境型的博弈在一個(gè)社區(qū)中重復(fù)地進(jìn)行，勇敢互惠的慣例將傾向于演化出來(lái)。參考文獻(xiàn)1. Axelrod, R.，1981, “The Emergence of Cooperation among Egoists" ,American Political Science Revierw, 75, pp. 306 -318.中國(guó)煤化工MYHCNMHG●226.互惠的博弈分析A Game Theory Approach to ReciprocityRobert Sugden( University of East Anglia)[ Abstract} This paper provides an analysis of the formation of reciprocity and thestable equilibrium strategies of reciprocity from the perspective of game theory.[ Key words ] reciprocity prisoner's dilemma extended game tit-for-tat bravereciprocity cautious reciprocityJEL Classifications: C700 D640中國(guó)煤化工MYHCNMHG227.

論文截圖