博弈论概论
多年前导师的博弈论,最近想着重温记录下来,便有此文。
博弈论的核心,是掌握「策略化思考」的底层逻辑—— 从 “只算自己的最优解”,变成 预判他人选择、再选自己最优解。
经典场景案例
有两个嫌疑犯 A 和 B,被警察抓住,关在不同房间审讯。警察告诉他们:
| A的选择 \ B的选择 | 沉默 | 招供 |
|---|---|---|
| 沉默 | (1,1) | (5,0) |
| 招供 | (0,5) | (3,3) |
用收益表表示(数字越小越好,因为是刑期)。
方案:纳什均衡
没有任何一个参与者可以通过单独改变自己的策略来提高收益,它只要求 “稳定”,不要求 “最好”。对于A而言,若B沉默,A的最优解时选择招,不用坐牢,若B招供,A的最优解还是选择招,只判三年。针对B也是一样。所以,此处的纳什均衡,就是(3,3)。但是很明显都沉默才是集体的最优解。个体理性 → 导致集体最差结果(纳什均衡),但集体最优结果却不稳定(不是纳什均衡)。
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.
