博弈论(未完成)

Feb 29, 2016

版权声明:本文为博主原创,未经作者许可谢绝转载。
如有任何疑问或者建议,请联系 xiangchen.cs@gmail.com

Normal Form 三要素:player,action,utility。

额外要素:timing,information。

分类: 静态博弈、序贯博弈 合作博弈、非合作博弈 完全信息博弈、不完全信息博弈

著名例子: 囚徒困境:纳什均衡与帕累托最优不一致 零和博弈 协调博弈:有多个纯策略纳什均衡

纳什均衡: 每一个玩家在给定了其他玩家的策略后,不能通过改变自己的策略使得自己的利益得到提高的状态。

帕累托最优: 没有其他策略的获益绝对好于当前策略。

在混合策略意义下,任何有限状态的博弈都存在纳什均衡。

minmax 定理:在有限状态、两玩家、零和博弈中,纳什均衡同时也是每个玩家的 maxmin 和 minmax

二人有限零和博弈