一类Nash均衡问题的信赖域方法研究文献综述

2020-04-14 22:11:53

1．目的及意义

纳什均衡，又名非合作博弈均衡，因著名数学家、经济学家约翰·纳什而得名。有些人认为纳什师从于博弈论的开创者冯·诺依曼，在纳什和冯·诺依曼之前，经济学家古诺、斯坦伯格、埃奇沃思，数学家波雷尔和梅洛等，都曾尝试过博弈论的研究。而早在18世纪大哲学家休谟就曾提出“均衡”的思想。

上世纪50年代，纳什首次论证了“纳什均衡”的思想。相同时期，纳什的导师Tucker提出了著名的“囚徒困境”的概念，由此，师生二人的研究成果开创了现代非合作博弈论。在此均衡中，不论他人的策略如何，始终保持自己的策略是相对于其他人策略选择的最优方案，即让自己的效用函数最小化，当你无法左右他人的选择时，纳什均衡可以让参与各方达成一种暂时的平衡，而相应的策略选择也是最为保险的。20世纪60至70年代则是博弈论的发展时期。1965年，Reinhard Selten提出了完美纳什均衡(subgame perfect Nash Equilibrium)概念。1967至1968年，John C Harsanyi 提出贝叶斯纳什均衡(Bayesian Nash Equilibrium)概念。1982 年 Kreps 和 Wilson 合作建立了关于动态不完全信息博弈的理论。此外，Kreps、Milgrom、Roberts 和 Wilson 于1982年共同创立了“KMRW 声誉模型”。

伴随着与纳什均衡相关实际问题研究的深入，算法也在不断地发展和创新，目前流行的解决方法有：一，转化为等价的拟变分不等式问题进行求解；二，利用NIKAIDO-ISODA 函数、GAP 函数转化为最优化问题求解。近年来信赖域算法逐渐被运用于解决纳什均衡问题。

信赖域方法的研究最早源于Powell于1970年的工作，他提出了一个算法用于求解无约束优化问题，并在一定的条件下证明了该算法的收敛性。与传统优化方法相比，信赖域方法具有两个很好的优势，一是它有良好的可靠性和较强的适应性，二是它有很强的收敛性。

信赖域方法的思想是：每次迭代中，以当前迭代点为中心选取一个小邻域作为信赖域，然后在这个邻域内求解一个子问题，得到试探步，接着用一个评价函数来决定是否接受该试探步以及确定下次迭代的信赖域半径，信赖域半径的大小取决于试探步的好坏，一般地，若试探步较好，则下一信赖域半径增大或保持不变；否则减小信赖域半径。但是应用传统的信赖域算法求解纳什均衡问题，评价函数的构造会十分复杂，导致计算量过大。一些数学家考虑引入Jacobi类型的信赖域算法解决纳什均衡问题，并且在一定条件下，证明该方法的全局收敛和局部收敛性质，如袁亚湘教授的工作。Jacobi类型的思想曾被Facchinei应用于广义纳什均衡中。Jacobi类型与信赖域算法的结合使得不再需要解决内部循环中的优化问题,相反，我们只需要通过求解一个信任域子问题来改变每个参与者的控制变量，这是对应参与者的原效用函数最小化问题的一个近似。研究表明Jacobi类型的信赖域算法可以很好地适用于纳什均衡问题的求解。

{title}

2. 研究的基本内容与方案

{title}

研究的主要内容及目标是给出一种适用于求解纳什均衡问题的Jacobi类型的信赖域算法，并研究该方法在一定条件下的收敛性。

主要内容包括四个部分:

对于纳什均衡问题给出一种Jacobi类型的信赖域算法

该方法对于每个参与者构造不同的信赖域，根据对应的个体效用函数，得到每个参与者控制变量的步长并选择接受或拒绝。基于所有的个体效用函数得到一种评价函数，用于更新信赖域，并提出了一种更新信赖域边界的非标准技术.

该算法(A Jacobi-Type Trust Region Algorithm For NEP)的主要步骤:
剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付

注册

找回密码