博弈论概论

多年前导师的博弈论，最近想着重温记录下来，便有此文。

博弈论的核心，是掌握「策略化思考」的底层逻辑—— 从 “只算自己的最优解”，变成 预判他人选择、再选自己最优解。

经典场景案例

有两个嫌疑犯 A 和 B，被警察抓住，关在不同房间审讯。警察告诉他们：

A的选择 \ B的选择	沉默	招供
沉默	（1，1）	（5，0）
招供	（0，5）	（3，3）

用收益表表示（数字越小越好，因为是刑期）。

方案：纳什均衡

没有任何一个参与者可以通过单独改变自己的策略来提高收益，它只要求 “稳定”，不要求 “最好”。对于A而言，若B沉默，A的最优解时选择招，不用坐牢，若B招供，A的最优解还是选择招，只判三年。针对B也是一样。所以，此处的纳什均衡，就是（3，3）。但是很明显都沉默才是集体的最优解。个体理性 → 导致集体最差结果（纳什均衡）,但集体最优结果却不稳定（不是纳什均衡）。