用期望简单计算囚徒困境

如题所述

第1个回答  2022-07-26
囚徒困境是博弈论中非常著名的例子,就是说参与者都知道做某件事最后对大家都不利,但仍然会去做。

比如对共享单车的保护,为什么共享单车损坏率很高?要知道所有人不爱惜共享单车,必然增大单车的损坏率,这会导致维修费增高,最终这笔钱也是消费者买单,但人们回想,就算我爱惜,别人也不会爱惜啊,所以就不打算好好使用单车。

现在用期望值来简单计算囚徒困境

假如你和小明被关了监狱

你们一起保密,会被判3年。

一起坦白,会被判5年。

如果是这样,那你和小明肯定选择保密。

但是,稍微添加一条规则,如果一人坦白,另一人却保密,则坦白的人无罪释放,保密者要被重判10年。

因为你不知道小明会如何选择,就假定它是随机选择保密还是坦白,也就是50%的几率。

所以来计算下你保密时候的期望:

0.5*-3+0.5*-10=-6.5年

坦白时候的期望:

0.5*-5+0.5*0=    -2.5年

很明显,坦白的期望只有被关2.5年,而保密则是被关6.5年。

所以两个犯人都只能坦白,最后一起被关5年,而不是都保密,被关3年。
相似回答