细说纳什均衡?

请问,约翰纳什的纳什均衡的定律和举例说明?

  约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的 最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。   纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。 编辑本段标准定义  纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1, si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1, sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。 纳什均衡经典案例:囚徒困境  1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。   假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。   囚徒困境博弈    A╲B坦白抵赖坦白-8,-80,-10抵赖-10,0-1,-1  关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2013-08-27
约翰·纳什(John Nash)纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

  1928年6月13日,约翰·纳什出生在西维吉尼亚州勃鲁费尔。

  纳什在卡内基(现在的卡内基—梅隆大学)学习时,享有全额乔治·威斯汀豪斯奖学金。但当了一学期化学工程学生后,他发现自己对机械制图之类课程不感兴趣而转入学习化学,但在学习化学短时间后又遇到定量分析的困难。数学系教师也鼓励他改修数学,所以他又转为一名正式的数学系学生。由此“最后我获得了科学学士和科学硕士”。

  纳什毕业时,有两个学校的奖学金供他选择,哈佛大学和普林斯顿大学。由于普林斯顿大学出的奖学金高,离家近,且德克教授鼓励他去,最后,纳什决定去普林斯顿大学上研究生。德克教授就是发现囚徒困境,并做博弈论研究的人。

  1948年,年仅20岁的约翰·纳什来到普林斯顿大学。他来到数学系,带上卡内基工学院的R�L�达芬的只有一句话的推荐信。这封信简单地说:“此人是一个天才。”作为他的论文导师,德克教授几年后写道:“有时我认为这封推荐信未免夸张,但是我认识纳什愈久,愈倾向于同意达芬的说法。”

  纳什在卡内基的时候上过一门选修课《国际经济学》,对该选修课的学习和思考,以后在《经济计量学》发表文章《谈判问题》。正是这种思考使他在普林斯顿大学做研究生时对那里的博弈论研究充满兴趣。

  1950年,纳什毕业后,先在普林斯顿做了一年讲师。1951年夏,他去了麻省理工学院数学系,做C�L�E�莫尔讲师。在那里,纳什设法解出了一个古典的有关微分几何的未解决的问题,它也与广义相对论中发生的几何问题有关。这是一个关于求证“欧几里得”空间中抽象黎曼流形的等容积可嵌性问题。

  1956~1957学年,纳什获得一笔阿尔弗雷德·P�斯洛安赠款,得以在普林斯顿的高等研究所做临时研究员。在那里他研究了另一个涉及偏微分方程的问题。问题虽然得到解决,但意大利的恩尼奥·德·乔治比他早一点解决了这个难题,并因此获得了斐尔德奖章。

  1959年,纳什被精神病医生诊断为“妄想性精神分裂”,不得不辞去麻省理工学院的教职,在麦克里安医院“观察”50天后,到了欧洲,以后还在非自愿的情况下在新泽西的医院住过几个月。

  医院在长期“观察”之后最终否定了原先对他的诊断,他又获得自由,重新回去做数学研究。在这些遭强制的日子里,纳什仍进行着令他着迷的数学研究。例如对“普通液体微分方程的柯西问题”的研究,这被称为“纳什爆炸变换”的思想以及对“奇点的弧结构”和“有分析数据的隐含函数问题的解析性”的研究。

  纳什的妄想倾向在二十世纪六十年代末曾有反复。对于他的“妄想”思考问题的方式,人们有不同的看法。有人认为这方程式是他作为天才学者的一个不可分割的特质,若使理性代替了他所特有的妄想,也许天才也就不复存在。

【囚犯的两难处境】
话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡.个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。每一方在选择策略时都没有“共谋”(串供),这与传统经济学所言的结论相悖。传统经济学认为市场经济存在“看不见的手”,它调节的结果是每个人的理性选择最终会造成对整个集体的最大利益。实际上,就像囚徒困境一样,这只看不见的手在参与选择的人数只有少数几个的时候会失去作用,因为这个时候,人们决策的过程会考虑其他参与者的想法,就像赌博和下棋的时候一样,这就和买家和卖家数量都巨大时的完全竞争不完全一样,需要新的一套思路进行研究。
在上面的例子中,我们注意到了一个并非最优的结果,就是两人都选择坦白的策略以及因此被判5年的结果,这个结果被称为“纳什均衡”,也叫非合作均衡。博奕论中最基本的概念就是“纳什均衡”,一谈到博奕论,人们说的最多的最著名的也是“纳什均衡”。纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。
当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。同时,它也提示我们:合作是有利的“利己策略”。实际上,如果上述两个囚徒能够串供进行合作,那么他们一定会选择都抵赖从而只因偷盗罪被判1年,当然,正是考虑到了这一点,所以警察才对他们隔离审查从而获知了事实真相,对囚徒而言最有利的合作结果才没有出现。“纳什均衡”描述的就是一种非合作博奕均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博奕理论的重大发展,甚至可以说是一场革命。
今天,纳什均衡被广泛应用于各个领域的研究,尤其在进行制度分析寸,我们可应用它得出一个很重要结论:一种制度(体制)安排要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立。
第2个回答  2013-08-27
自己翻信息经济学的书
第3个回答  2021-04-22

相似回答