“囚徒困境”的内在根源是什么?

越详细越好,最好有出处!急!!!
最好是关于内在根源的出处。

先来说说什么是囚徒困境:
在博弈论中有一个经典案例--囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:1)认罪并供出他的同伙(即与警察合作,从而背叛他的同伙),对方判决10年自己无罪释放。2)或者拒不认罪(也就是与他的同伙合作,而不是与警察合作),双方被判决5年。3)共同认罪,判决10年。
按照牌面上说,双方拒不认罪是最好的。但由于双方都无法保证对方不会指证自己,所以都会选择认罪并指证对方。
其内在根源就是人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
对于个人而言,好像最理性的做法是供出对方,自己就可以获得自由。但是难保对方不供出自己。其实最好的方法是双方保持沉默,那么两人共同获刑最少。只是,在信息不能流通的情况下,个人理性会分析,假设自己保持沉默,1)如果对方出卖自己,那么对方可以自由,自己要坐10年牢;2)如果对方也保持沉默,大家各坐5年牢。而假设自己认罪并供出对方,1)对方出卖自己,那么双方都坐10年牢;2)对方保持沉默,自己可以自由。
最差的结果是坐10年牢,无论自己是否保持沉默,最差的结果都是一定的。而自己先出卖对方,那么自己就可以自由了。基于这种考虑,人都会自作聪明地选择背叛对方。那么就会出现基体非理性了。

详细可参考:
http://www.jjxj.com.cn/news_detail.jsp?keyno=1584
温馨提示:答案为网友推荐,仅供参考
第1个回答  2008-06-16
囚徒困境(Prison Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。

经典的囚徒困境
1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:

甲沉默(合作) 甲认罪(背叛)

乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年

乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年

解说

如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

若对方沉默、背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
究其根源就是西方经济学对“经济人”的假设,即人都是自私的
第2个回答  2019-12-23
囚徒困境的内在根源是特别懒。
相似回答