1. 如果惩罚增加到 -9,那么右上角会给 Alice (4 * 0.9) + ((-9) * 0.1)。右下角会给出 0 的预期收益。由此得出矩阵
¿¿ | Alice 高 | Alice 低 |
Bob 高 | 3, 3 | 0, 2.7 |
Bob 低 | 2.7, 0 | 0, 0 |
在这种情况下,如果 Alice 作弊,无论 Bob 是否作弊,他获得的收益都相同。因此,从 Bob 的角度来看,右下角和右上角是相同的。如果 Bob 决定不作弊,那么游戏状态将从右上角移动到左上角。为了鼓励这样做,你可以使惩罚甚至略微低于 -9(例如,-9.01)。
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的有影响力的故事。
2. 假设惩罚降低到 -5,并且惩罚的概率提高到 17%。那么,在右下角状态下,Alice 作弊的预期收益为 (0.83 * 1) + (0.17 * -5) = -0.02。在右上角,预期收益将为 (0.83 * 4) + (0.17 * -5) = 2.47。
¿¿ | Alice 高 | Alice 低 |
Bob 高 | 3, 3 | 0, 2.47 |
Bob 低 | 2.47, 0 | -0.02, -0.02 |
因此,唯一的纳什均衡是左上角。
3. 假设有 10% 的可能性被抓住,我们假设惩罚是 -9.01。那么,右下角的有效值为 (-9.01 * 0.1) + (1 * 0.9) = -0.001。右上角(对于 Alice)的值为 (-9.01 * 0.1) + (4 * 0.9) = 2.699,我们将其近似为 2.7。
这产生了一个博弈矩阵
¿¿ | Alice 高 | Alice 低 |
Bob 高 | 5, 2 | 0, 2.7 |
Bob 低 | 2.7, 0 | -0.001, -0.001 |
因此,Alice 会将游戏带到右上角。Bob 可能会抱怨不道德,但 Alice 将这一切都视为一场游戏。
4. 另一方面,如果惩罚增加到 -17(这可能构成砍掉偷面包的贼的手),那么博弈矩阵变为
¿¿ | Alice 高 | Alice 低 |
Bob 高 | 5, 2 | 0, 1.9 |
Bob 低 | 1.9, 0 | -0.8, -0.8 |
唯一的纳什均衡是左上角。