信赖域与线搜索技术的结合外文翻译资料
2022-08-06 09:49:31
英语原文共 25 页,剩余内容已隐藏,支付完成后下载完整资料
信赖域与线搜索技术的结合
摘要
我们提出了一种使用信赖域技术和线搜索的非线性优化算法,与传统的信赖域方法不同,如果试验步导致目标函数增加,我们的算法不会解决子问题,而是执行回溯线搜索,从失效点回溯可以沿着直线或曲线完成。我们证明了该新算法保留了信赖域方法的强收敛性,并给出了数值结果。
关键词:信赖域,回溯,无约束最优化,非线性优化
一、引言
在本文中,我们研究了一种新型的信赖域方法来解决无约束优化问题。
(1.1)
我们的目标是设计一种算法,该算法可以保留信赖域方法的收敛性,但是在变量很大时,计算更加简便。信赖域方法通过解决子问题来计算试验步骤
(1.2)
s.t. (1.3)
当是当前近似解中目标函数的梯度,是一个近似于f的Hessian的n x n的对称矩阵。是信赖域半径,与行搜索相比,信赖域方法的优点之一是允许不确定。
在获得(1.1)-(1.2)的精确或近似解的试验步骤dk后,信赖域算法计算函数实际缩减量比率,,和预计的减少,。信赖域半径是根据来确定的。现在如果步骤dk不成功,则,终止算法,减小信赖域半径,并重新计算(1.1)-(1.2)。这个算法对于计算计算量小的已经足够了。
但是,如果变量数量很大,则解决信赖域问题可能会很复杂,因为这需要求解一个或多个线性系统
(1.4)
(参考Dennis 和 Schnabel(1983))
相比之下,线搜索方法只需很少的计算即可确定新的试验点。因此,我们要想如何将回溯线搜索合并到信赖域方法中,从而避免在步骤不成功时解决子问题。
但是,引入线搜索可能会削弱算法的收敛性。因此,我们先讨论实际中可能出现的两种情况以及对应的解决方法。
第一种是当线搜索算法中的搜索方向与最陡的下降方向gk正交时,通常需要减小步长才能接受。在某些情况下,舍入误差可能会导致线搜索失败。 信赖域算法将缩小信赖域,并且新的试验步骤将朝更陡的方向激素按。这个属性使该方法在涉及噪声和舍入误差(Carter(1991))方面更加有效,应当保留。
第二种困难情况是,行搜索算法中的搜索方向或信赖域方法中的尝试步骤过大时,这可能是由一个较小的矩阵Bk引起的。在这种情况下,减小信赖域得到的判断步骤几乎与第一个失败的判断步骤相一致。在这种情况下,信任区域方法的行为与回溯线搜索方法类似,不同之处在于它的计算成本会更高。 此时进行回溯线搜索是有利的。
我们得出结论,如果搜索方向均为下坡,就应该执行回溯。在本文中,我们证明了可以安全地沿直线或曲线路径进行,因为我们找到了一种方法解决(1.1)-(1.2)
因此,试验步骤dk始终是目标函数下降的方向。根据这个,如果gk远离0,那么dk与-gk之间的夹角将远离。这证明了该方法具有很好的收敛性。
Toint(1982)也将线搜索合并到了信赖域方法中,但是在他的算法中,线搜索是在每次迭代时执行的。在我们的算法中,仅当试验点xk dk不能给出最低点时才执行回溯线搜索。
信赖域方法的理论与实现受到了广泛关注,(参考Fletche(1987),Gay(1981),More(1983),More and Sorensen(1983),Powell(1975),Sorensen(1982a,1982b),Powell(1984) and Eisenstat and Walker(1991))。本文参考了以上文献。
文中的符号表示欧几里得向量范数或其诱导矩阵范数,表示矩阵A的广义逆,lt;v1,v2gt;表示向量v1与v2之间的角度。对称矩阵的特征值表示为,我们用A0表示矩阵是半正定的。
二、子问题
在本节中,我们给出关于求解(1.1)-(1.2)的一些子问题,并考虑一些计算它的近似解的技术。我们先看一下已经被证明的结果(参考More and Sorensen(1983) and Gay(1981))。
引理2.1 令向量是下面问题的解,
(2.1)
s.t. , (2.2)
其中是一个对称矩阵,并且Delta;gt;0,当且仅当且存在使得
(2.3)
(2.4)
(2.5)
为了用封闭形式表示信赖域问题的解,可以方便地利用广义逆的一些性质。假设A是一个对称半正定的n x n矩阵,其特征分解
, (2.6)
其中,,Q=[q1,hellip;hellip;,qn]为正交矩阵。我们定义A的广义逆
(2.7)
其中,通过改写A的形式A=,这很容易证明, 对一些向量,如果d是
Ad=-g, (2.8)
的解, 那么
, (2.9)
其中,v在A的零空间中,. 通过这些我们得到
. (2.10)
将这些结果应用于(2.3),对于一些在的零空间中的v,我们得到
, (2.11)
我们也得出.
考虑二次模型在最速下降方向-g的最大下降量, 可以得到在信赖域内的最大下降量的下限
引理2.2(powell,1975)如果为(2.1)-(2.2)的解,则
. (2.12)
信赖域算法的全局收敛理论仅要求计算出的试验步骤dk满足对于任意k,
(2.13)
其中beta;为常数。如果dk为(1.2)-(1.3)的明确解,那么不等式(2.13)显然是符合的。步长dk的其他选择,例如powell提出的折线步,在信赖域内的二维子空间上的最小值(Dennis and Mei (1979);Shultz ,Schnabel and Byrd(1985))也符合(2.13)。对我们算法的主要要求之一是要满足(2.13)。
由于我们的算法将在试验步骤dk增加目标函数时执行回溯线搜索,因此我们将要求dk充分下降。因此,考虑信赖域约束情况下,我们现在研究由信赖域方法形成的搜索方向的下降特性。
引理2.3 如果为(2.1)-(2.2)的解,如果,且满足(2.3)-(2.4)则有
, (2.14)
, (2.15)
其中和为B的最大和最小特征值.
证明 由(2.3)我们得到
, (2.16)
则. (2.17)
因为,通过不等式以及非负得出(2.14).
由方程(2.11)和不等式(2.10),(2.17)得出
(2.18)
. 证毕
当时,根据(2.5)易得。通过等式(2.11)和(2.18),根据(2.10)我们得到
(2.19)
结合(2.15)和(2.19)我们得到以下结论。
引理2.4 如果为(2.1)-(2.2)的解
(2.20)
证明 如果,我们可以看到不等式2.20遵循关系(2.19)和等式.
如果,通过(2.15)以及 得到
. 证毕
此引理表明最优解满足
. (2.21)
现在我们证明了和-g之间的夹角是Delta;的单调函数。为了确定这个结果,我们假设在困难的情况下,我们总是在信赖域的边界处选择一个解。这将在以下结果的证明中说明。
引理2.5 假设gne;0,令Delta;2gt;Delta;1gt;0,并且规定当Delta;=Delta;1并且Delta;=Delta;2时,和为(2.1)-(2.2)的解。则
(2.22)
证明 根据引理2.1,我们知道存在,使得
, (2.23)
(2.24)
为了证明,用反证法,假设. 条件推出,根据这点以及(2.23)-(2.24)
我们能够得出
, (2.25)
显然矛盾,因此。
对于其余的证明,我们考虑三种情况
- 如果(B lambda;2I)正定,引理是正确的,因为可以证明函数
, (2.26)
给出 和-g之间夹角的余弦,该方程对于所有在单调增长。
- 如果B lambda;1I是单数则,必须满足,且
,并且。在这种情况下,通常被称为困难情况,可能会有很多解决方案来解决两个信赖域问题,如More和Soresen(1983)所提那样,我们将在信赖域的边界处选择一个解决方案。因此我们有
. (2.27)
3) 为了完成证明,我们假设B lambda;1I是正定的,并且. 我们发现,根据(2.11),我们可以得到。根据这个式子,结合theta;(lambda;)为单调递增,我们得到
. (2.28)
这也证明了引理的正确,证毕.
所有这些结果都与信任区域问题的精确解有关,我们现在考虑一个(2.1)-(2.2)的近似解,
(2.29)
其中,参数 使得是正定的。让我们假设满足不等式
(2.30)
对于连续gamma;gt;1,引理2.1证明了是(2.1)的解s.t. ,所以(2.12)和(2.20)给出
(2.31)
。 (2.32)
这两个属性((2.31)在模型中下降,(2.32)足够的下降条件)将确保该算法具有良好的收敛性。但是基于(2.30)步长的大小不可能总是合适的,例如牛顿法步长可以比更小,因此,我们现在得出一个替代条件,在不限制步长的下限,该条件将确保(2.31)和(2.32)均满足。
不等式(2.14)对lambda;建议以下上限
, (2.33)
是一个很小的数,确保是正定的。考虑任意,对于是正定的,并且支持(2.33)以及
。 (2.34)
对于任意lambda;,根据(2.29)我们能够得出
。 (2.35)
利用(2.29)和(2.35) 我们得到
。
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[255167],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 腐败与美国各州收入不平等之间的关系:来自专家小组的协整和误差修正模型的证据外文翻译资料
- 内蒙古1962 – 2016年时间序列气候变量的变化特征外文翻译资料
- 残差修正法在季节性ARIMA电力需求预测中的应用:以中国为例外文翻译资料
- 净工资与居民消费价格指数的关系分析外文翻译资料
- 我国鸡蛋价格波动的深入研究与预测外文翻译资料
- 信赖域与线搜索技术的结合外文翻译资料
- 求解奇异非线性方程组的多点LM方法外文翻译资料
- 具有双线性和非单调发病率的关于两个菌株的流行病模型的全局稳定性分析外文翻译资料
- 寻找可伸缩的区块链结构: 工作证明与BFT复制外文翻译资料
- 网络营销中潜在成功人士的结构方程建模外文翻译资料