博弈论的纳什均衡

如题所述

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。
这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*) ≤ 偶对(a*,b*) ≥偶对(a*,b)。
对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。
有了上述定义,就立即得到纳什定理:
任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。
纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。   纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。
但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。
塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。 囚徒困境
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 囚徒困境博弈 [Prisoner's dilemma]A╲B 坦白 抵赖 坦白 8,8 0,10 抵赖 10,0 1,1 对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。
单从数学角度讲,这个理论是合理的,也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的策发生改变。比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多。而8年到10年间的增加比例会被淡化,人的尊严会使人产生复仇情绪,略打破“行规”。我们正处于大数据时代,向更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人的活动动影像动因复杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体分析。 智猪博弈
一、经济学中的“智猪博弈”(Pigs’payoffs) 这个例子讲的是:
假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽(两猪均在食槽端),另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是在去往食槽的路上会有两个单位猪食的体能消耗,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
智猪博弈由纳什于1950年提出。实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:   小猪    行动 等待 大猪 行动 5,1 4,4  等待 9,-1 0,0 从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。
在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为!
高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。
在智猪博弈中,虽然小猪的“捡现成”的行为从道义上来讲令人不齿,但是博弈策略的主要目的不正是使用谋略最大化自己的利益吗? 美女的硬币
一位陌生美女主动过来和你搭讪,并要求和你一起玩个游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”听起来不错的提议。如果我是男性,无论如何我是要玩的,不过经济学考虑就是另外一回事了,这个游戏真的够公平吗? 绅士/美女 女正面 女反面 正面 3,-3 -2,+2 反面 -2,+2 1,-1 假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)
这个方程通俗的说就是在对手一直出正面你得到的利益,和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入,计算结果是-1/8元。
同样,设美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y)
解得y也等于3/8,而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元
如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。看起来这个博弈模型似乎没有什么用处,但是其实这可能牵涉了金融市场定价中最重要的一个模型:定价权重模型了。
总的来说“博弈论”其本质是将日常生活中的竞争矛盾以游戏的形式表现出来,并使用数学和逻辑学的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在游戏规则的制定者。深入的了解竞争行为的本质,有助于我们分析和掌握竞争中事物之间的关系,更方便我们对规则进行制定和调整,使其最终按照我们所预期的目的进行运作。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2016-12-02

来源:美国资讯网;博弈圣经著作人对纳什的嘲讽

 

博弈圣经著作人的经典名句;0、1、二维平均,称平衡,0、1、2、三维平均,称均衡。(在0、1、二维记录的系统中,有一个极小极大定理,不存在平均律,就是不存在均衡。在纳什的语文学中,就没有出现过一次0、1、2、三维均衡的概念,纳什均衡哪里来。)

 

博弈圣经著作人的经典名句;二维平衡是指生物的竞争行为,三维均衡是指自然的优劣特性。

 

博弈圣经著作人的经典名句;揭开纳什均衡的画皮,露出真相。【如果纳什均衡是以纳什的名字、命名的一个博弈论术语;假如我把纳什名字去掉、只剩下均衡一词、均衡也就是纯净的博弈论术语;倘若所有博弈论的文章中、都把纳什名字去掉只剩下均衡;再读一篇篇博弈论文章、也都是围绕着均衡一词展开的叙述;发现通篇文章逻辑不通、词意变异、不知所云;只要是属于纳什均衡的理论文章、去掉纳什名字之后、纳什的鬼魅就出现了;通篇文章,捕风捉影、张冠李戴、以讹传讹,添油加醋又像是疯言疯语,更不能被常人所理解。】

 

博弈圣经著作人的经典名句;纳什-是纳什,均衡-是均衡。

博弈圣经著作人的经典名句;“纳什均衡” 之所以鬼魅,纳什自己不知道什么是纳什均衡,追随他的门外汉,反而、假装、都懂得什么是纳什均衡。“纳什均衡”把所有的门徒变成了精神病、变成了不懂装懂;任何人谈到纳什均衡,就像掉进了魔鬼坑,开口就是自问自答、自说自话、反复无常、自己感到莫名其妙时,还会自圆其说。

 

博弈圣经著作人的经典名句;如果说纳什均衡是一份学术遗产,那就是学术中、独一份的滑稽遗产,他的滑稽级别、足够七星级。纳什均衡是什么,纳什自己不知道,中国的傻吊全都知道……。

 

博弈圣经著作人的经典名句;“纳什均衡成了中国的一个宗教,追随他的门徒;有无知的青年、有无畏的傻吊、还有无耻的教授。”

 

博弈圣经著作人的经典名句;中国人醒来吧,应该扪心自问;“纳什均衡”理论在哪里?中国人从“纳什均衡”中、学到了什么?

 

博弈圣经著作人的经典名句;【“纳什均衡”一词,像是宗教的“圣言”,追随它的门徒,各自像精神病人一样、在纳什均衡中寻找理由,都想找到合理的理由解释“纳什均衡”,其结果把纳什均衡变成了博弈宗教、纳什变成了教主,门徒解释纳什均衡的疯言疯语,其实就是胡说八道。】

 

博弈圣经著作人的经典名句;如果中国的教授抄袭“纳什均衡”作为标题,捕风捉影、以讹传讹的炒作,是为了编书、售书、挣钱,假如读者想通过“纳什均衡”想占优、想赢钱,就应该先查查纳什50年以来讲过一句“赢钱”吗,他赢过一次吗?【纳什既然是个数学家,他就应该把占优策略给出一个数字量化的数学公式、或者是一个数学模板,让所有的人成功模仿。博弈圣经著作人的经典名句;科学家的博弈功能,是让其傻吊与天才同等水平。显然,人们等到纳什车祸身亡全无结果,历史证明他就没有所谓的占优策略。“纳什均衡”它会是什么?它像UFO一样诡异、令人百思不解。“纳什均衡”的鬼魅让人想入非非,层出不穷的解释让人匪夷所思。】

 

博弈圣经著作人的经典名句;电影《美丽心灵》用构思、杜撰的艺术形式、编造了纳什戏剧性的一生,“纳什均衡”像西方宗教的“经文”一样,演变成了博弈宗教传奇。诺贝尔经济学奖意外地、砸到纳什头上的那种巧合,给了纳什幸运的一生、羞羞答答的一生、不愿见人的一生、学术欺骗的一生、也是他难堪的一生。

 

博弈圣经著作人的经典名句;纳什均衡是半个世纪前,一个“驴头不对马嘴”的概念,纳什之所以一直沉默,是因为他没法说,他不敢说,他到死都不会说。【来源:美国资讯网;麻省理工福布斯纳什-著名大学名人-正文-时间:2013-12-02,从博弈圣经著作人对纳什的嘲讽,到纳什2015年5月23号出车祸死亡,中间有一年半时间他没有作出回应。】

 

博弈圣经著作人的经典名句;纳什均衡,是黑暗中的教唆、无知中的误判、猎奇中的杂耍。

 

博弈圣经著作人的经典名句;几个(因为博弈论)获得诺贝尔经济学奖的得主、管理股票的炒股公司,因亏空、也关门大吉了。

 

瑞典皇家科学院、诺贝尔经济学奖委员会委员,斯塔尔说;纳什均衡是一个博弈取胜的幻想,他自己也不知道怎么均衡、不知道怎么单方占优、不知道怎么取胜。因此,纳什在世期间不会向世人做出博弈如何取胜的解释,所以他一直保持沉默。斯塔尔还说;我们今天既然把纳什均衡带到公众面前,可以断定,未来一定会出现博弈的取胜理论,大家担心纳什均衡可能一败涂地,若干年后将变成一大丑闻。

 

来源:美国资讯网;麻省理工福布斯纳什-著名大学名人-正文-时间:2013-12-02

博弈圣经著作人对纳什的嘲讽

......。

相似回答