多年前导师的博弈论,最近想着重温记录下来,便有此文。

博弈论的核心,是掌握「策略化思考」的底层逻辑—— 从 “只算自己的最优解”,变成 预判他人选择、再选自己最优解

经典场景案例

有两个嫌疑犯 A 和 B,被警察抓住,关在不同房间审讯。警察告诉他们:

A的选择 \ B的选择 沉默 招供
沉默 (1,1) (5,0)
招供 (0,5) (3,3)

用收益表表示(数字越小越好,因为是刑期)。

方案:纳什均衡

没有任何一个参与者可以通过单独改变自己的策略来提高收益,它只要求 “稳定”,不要求 “最好”。对于A而言,若B沉默,A的最优解时选择招,不用坐牢,若B招供,A的最优解还是选择招,只判三年。针对B也是一样。所以,此处的纳什均衡,就是(3,3)。但是很明显都沉默才是集体的最优解。个体理性 → 导致集体最差结果(纳什均衡),但集体最优结果却不稳定(不是纳什均衡)。