Normal Form 三要素:player,action,utility。
额外要素:timing,information。
分类: 静态博弈、序贯博弈 合作博弈、非合作博弈 完全信息博弈、不完全信息博弈
著名例子: 囚徒困境:纳什均衡与帕累托最优不一致 零和博弈 协调博弈:有多个纯策略纳什均衡
纳什均衡: 每一个玩家在给定了其他玩家的策略后,不能通过改变自己的策略使得自己的利益得到提高的状态。
帕累托最优: 没有其他策略的获益绝对好于当前策略。
在混合策略意义下,任何有限状态的博弈都存在纳什均衡。
minmax 定理:在有限状态、两玩家、零和博弈中,纳什均衡同时也是每个玩家的 maxmin 和 minmax