【博弈论】势博弈(potentialgame)、EPG以及最佳响应、Nash均衡和帕累

admin•2025-09-17 12:00:29•数码科技•阅读38

2023年12月5日发(作者：荣耀20s参数配置)

【博弈论】势博弈（potentialgame）、EPG以及最佳响应、Nash均衡和帕累托（。。。文章目录前言本文主要详细讲解potential game的概念以及Exact potential game 的定义和分类，以及这么博弈方法是如何在论文中引入并使用的，本文仅是对自己在该模块学习的一个总结，如果理解有误，还请批评指正，谢谢~一、Potential gamePotential game即势博弈。在一场博弈中，每个用户可以做出自己的策略，并且通过调整策略使自己的效用（utility或者收益payoff）最大，假设这种通过调整策略得到的函数为效用函数，即Utility function，且与策略有关，我们写作f(sn),其中sn表示第n次出牌的策略。由于我们建立该game的目的是让每个用户的效用最大，也就是每个用户对自己策略的改变一定的单调的，所以，假设每个用户的效用函数f(sn)的改变都能映射到一个势函数（Potential function）中，那么potential function也是单调的，此时将这种博弈称作势博弈。定义：如果存在一个函数p:S→R, 满足任意n∈N,有Un(sn,s−n)−Un(sn,s−n)=p(sn,s−n)−p(sn,s−n)其中，sn表示不同于sn的策略，而s−n表示系统中其他用户的策略，具体如果要在代码中实现，可以理解为上一轮其他所有用户的策略集合，再以此得到自己本轮的策略。（不确定这样理解是不是对的，如有不对，望指正谢谢~）′′′二、Nash均衡和Pareto-optimal（帕累托最优）这两种均是得到上述最优策略的方法。均衡用户通过不断改变自己的策略使自身的效用或收益最大，直到所有用户都满意，并不再改变策略为止，此时即为Nash（纳什）均衡，有：∗∗∗Un(sn,s−n)≥Un(sn,s−n)Nash均衡的存在性和唯一性证明：1. 存在性：首先自变量sn是空间上非空闭合有界凸集，其次Un(sn,s−n)是在区间上拟凹或者拟凸的2. 唯一性：分为非负性、单调性以及可伸缩性当然Nash均衡也有细分，分为纯策略（pure-strategy）纳什均衡和混合策略（mixed-strategy）纳什均衡，两者分别是纯策略的用户最优结果实现的均衡以及混合策略的用户最优结果实现的均衡，其中纯策略使指每个用户只做出一个策略选择并始终坚持这个策略；而用户使选择的策略随机化，并根据不同的重要性对每个策略制定一个概率，这种依据概率做出的策略即为混合策略。最优上述讲的势博弈以及nash均衡中的最优都是针对一个用户而言，用户根据自己的策略选择，使自身的效益最大化；但是pareto最优是使整体效益最优，谋求的是一个集体利益或者说社会福利最大化，因此pareto最优是指对每一个和效用最大的策略组合。如果将囚徒困境的例子引入，假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：1. 如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年。2. 如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，共10年，而坦白者有功被减刑8年，立即释放，即0年。3. 如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。两人的选择见下表：表中的数字表示A，B各自的判刑结果：如上所示，当两者都坦白时，是对自己最好的结果，此时针对Nash 均衡点即为（-8，-8）的点，但是如果针对pareto最优，就是两者都抵赖的为该最优点，即（-1，-1）。三、Best response（最佳响应）基于上述Potential game的定义，当通过调整策略使效用最大的点即为最优策略，下式即为最佳响应公式：∗sn=argmaxsnUn(sn,s−n)四、Exact potential game(EPG)针对上述Potential game的定义：如果存在一个函数p:S→R, 满足任意n∈N,有Un(sn,s−n)−Un(sn,s−n)=p(sn,s−n)−p(sn,s−n)如果Un处处可微，则严格势博弈（EPG）的充分条件为：∂2Ui(s)∂si∂sj′′=∂2Uj(s)∂sj∂si,i,j∈N可以理解为严格势博弈是势博弈的一种，并且当满足上式时，为严格势博弈，因此严格势博弈也一样满足效用函数之差等于势函数之差。同时严格势博弈主要分为以下5中博弈：以下参考《博弈论》书籍，具体哪个作者忘记了1.合作-傀儡博弈如果博弈的所有参与者的效用函数可以用Un(s)=C(s)+Dn(s−n)表示，其中C(s)与n无关，则其势函数为：p=C(s)C(s)定义了一个合作函数，所有博弈参与者对于具有的策略s都会得到相应的回报，Dn(s−n)定义了一个傀儡函数，参与者n的结构不依赖于自身的策略，而是依赖于其他参与者的策略由于满足：Un(sn,s−n)−Un(sn,s−n)=C(sn,s−n)−C(sn,s−n),故C(s)为该博弈的势函数。′′2.合作博弈即只有合作函数，因此上述Dn(s−n)=0，即Un(s)=C(s)3.傀儡博弈即只有傀儡函数，Un(s)=Dn(s−n)，C(s)=0，此时傀儡博弈的势函数都是一个常函数。4.自激博弈如果所有的博弈者都有如下的效用函数，那么这种类型的博弈就叫做自激博弈：Un(s)=Kn(sn)其中Kn:sn→R, 由于博弈被定义为一种相互影响的决策过程，而自激博弈确是没有相互影响的交互过程，因此严格上说不算是博弈，其势函数为：P=n∈NKn(sn)∑5.双边对称交互博弈如果每个博弈的参与者的效用函数都可以表达如下的形式：Ui(s)=j∈Nwi,j j(si,sj)−Ki(si)其中wi,j为双边交互函数，Ki为自利函数，如果对于所有(si,sj)∈Si×Sj,有

wi,j(si,sj)=wi,j(sj,si), 那么这种博弈称为双边对称博弈，其势函数为：∑∑∑p(s)=i∈N(j=1wi,j j(si,sj)−Ki(si))其中第一项是交互部分，后一项是仅关于i的部分。i−1使用理解首先要证明建立的游戏理论模型符合势博弈的定义，其次要证明存在Nash均衡点，并根据不断调整策略（迭代的过程）利用最佳响应得到Nash均衡点（即最优策略）以及最大的效用。其中势函数的建立过程可以证明是否符合EPG，并根据具体的博弈模型建立势函数，也可以直接自己找到具体的对应关系。

发布者：admin，转转请注明出处：http://www.yc00.com/num/1701766037a1145095.html

博弈策略用户

admin

网站建设
量化回测bt框架，策略类bt.Strategy详解，不是backtrader！提供bt双均线策略示例，比backtrader还简单
前言也不说那么多了，要用到bt，肯定也知道他是干嘛的，，给博主点点关注点点赞！！！
admin
1月前
160
网站建设
设计模式详解（十）：策略模式——Strategy
什么是Strategy设计模式？ Strategy模式是一种行为型设计模式，它定义了一系列算法，将每种算法封装到独立的类中，使它们可以互换。使用该模式，可以在不修改客户端代码的情况下动态地改变算法的行为。为什么需要Strategy模式
admin
1月前
170
网站建设
策略（Strategy）模式
当实现某一个功能存在多种算法或者策略，我们可以根据环境或者条件的不同选择不同的算法或者策略来完成该功能，如数据排序策略有冒泡排序、选择排序、插入排序、二叉树排序等。如果使用多重条件转移语句实现&
admin
1月前
190
网站建设
C++设计模式-策略模式(Strategy)
动机：在软件构建过程中，某些对象使用的算法可能多种多样，经常改动，如果将这些算法都编码到对象中，将会使对象变得异常复杂&#
admin
1月前
240
网站建设
3.4 策略模式（Strategy Pattern） -《SSM深入解析与项目实战》
文章目录 3.4 策略模式（Strategy Pattern） 3.4.1 策略模式的定义 3.4.2 策略模式的作用 3.4.3 模式结构 3.4.4 场景实例抽象策略角色具体的策略角色上下文角色测试类演示结果总结 3.4 策
admin
1月前
260
网站建设
非合作博弈篇——混合策略博弈(mixed strategy)
摘自 Game Theory, Drew Fudenberg, Page 5the concept of a mixed-strategy Nash equilibrium摘自 Game Theory in Wireless and Co
admin
1月前
180
网站建设
设计模式-策略模式 Strategy
策略模式1) 原理和实现1、策略的定义2、策略的创建3、策略的使用该模式最常见的应用场景是，利用它来避免冗长的 if-else 或 switch 分支判断。不过，它的作用还不止如此。它也可以像模板
admin
1月前
130
网站建设
Java设计模式—策略模式(Strategy)
模式动机完成一项任务，往往可以有多种不同的方式，每一种方式称为一个策略，我们可以根据环境或者条件的不同选择不同的策略来完成该项任务。在软件开发中也常常遇到类似的情况&
admin
1月前
210
网站建设
深入剖析策略模式（Strategy Pattern）
深入剖析策略模式（Strategy Pattern）在软件设计中，策略模式（Strategy Pattern）是一种非常重要的行为
admin
1月前
240
网站建设
【设计模式】【行为型模式（Behavioral Patterns）】之策略模式（Strategy Pattern）
1. 设计模式原理说明策略模式（Strategy Pattern） 是一种行为设计模式，它允许你定义一系列算法，并将每个算法封装起来&#xff0
admin
1月前
200
网站建设
设计模式：策略模式（Strategy Design Pattern）
个人觉得学习设计模式的话，还是应该注重各种设计模式的应用场景，23种设计模式真的挺多的，要靠死记硬背的话还是没那么容易记住。所以我建议可以在自己实际编码时&#xff0
admin
1月前
200
网站建设
Java设计模式之策略（Strategy）模式
策略（Strategy）设计模式定义了一系列算法，将它们封装起来，并且可以相互替换使用，从而使得算法可以独立于使用它的客户而变化。
admin
1月前
210
网站建设
[设计模式-行为型]策略模式(Strategy)
一句话在一个类的对象中维护策略的类的对象.看起来和状态模式很类似。概括解析STRATEGY—跟不同类型的MM约会，要用不同的策略，有的请电影比较好，有的则去吃小吃效果不错&a
admin
1月前
170
网站建设
23种设计模式之策略模式（Strategy Pattern）
前言：大家好，我是小威，24届毕业生，在一家满意的公司实习。本篇文章将23种设计模式中的策略模式，此篇文章为一天学习一个设计模式系
admin
1月前
210
网站建设
【第14节】C++设计模式(行为模式)-Strategy (策略)模式
一、问题的提出Strategy 模式：算法实现与抽象接口的解耦Strategy 模式和 Template 模式要解决的问题是相似的，都是为了将业务逻辑（算法&#xff
admin
1月前
180
网站建设
应急响应计划：网络安全事件后的快速恢复策略
在数字化时代，网络安全威胁日益严峻，任何企业都无法完全避免遭受网络攻击或数据泄露的风险。因此，制定一套完善的应急响应计划，以便在网络安全事件发生后能够迅
admin
1月前
180
网站建设
别让“7zxa.dll损坏”阻碍你！7-Zip用户专属修复指南
对于使用7-Zip压缩软件的用户来说，遇到“7zxa.dll损坏”或缺失的问题可能会让人头疼不已。这个动态链接库文件（DLL）是7-Zip正常运行的关键组件之一&#x
admin
1月前
180
网站建设
Windows 11用户注意：丢失DLL文件的经过测试的修复方法
Windows 11 用户请注意：丢失 DLL 文件可能会导致某些程序无法正常运行，给您带来困扰。不过，经过测试，以下是一些有效的修复方法。方法一：使用系统内置的工具进行修复。首先，以管理员身份打开命令提示符。然后，输入“sfc sc
admin
1月前
280
网站建设
关于在浏览器中监听用户点击返回键
前端时间做了个需求，是关于监听用户点击实体返回键出现挽留弹窗的需求做过混合开发的都知道，要在自己的app内监听返回事件是很简单的，但是在浏览器中呢，我们
admin
1月前
190
网站建设
被用户吐槽多年后，Edge浏览器终于要有这个功能了！
点击上方“CVer”，选择加"星标"置顶重磅干货，第一时间送达来源：扩展迷EXTFANS使用Chrome或Edge浏览器的小伙伴，可
admin
1月前
190

发表回复

评论列表（0条）

暂无评论

【博弈论】势博弈(potentialgame)、EPG以及最佳响应、Nash均衡和帕累

发表回复

评论列表（0条）

联系我们

400-800-8888

【博弈论】势博弈(potentialgame)、EPG以及最佳响应、Nash均衡和帕累

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888