基于Wasserstein距离的分布稳健均值-方差投资组合选择外文翻译资料
2022-08-03 11:29:20
英语原文共 20 页,剩余内容已隐藏,支付完成后下载完整资料
基于Wasserstein距离的分布稳健均值-方差投资组合选择
何塞·布兰切特 林晨 周迅宇
2018年2月15日
摘要
我们重新考虑了马科维茨的均值-方差投资组合选择模型,考虑了一个分布稳健的版本,其中分布不确定性的区域在经验测度附近,概率测度之间的差异由所谓的Wasserstein距离决定。我们把这个问题转化为一个经验方差最小化问题,并加入一个正则化项。此外,我们扩展了最近的推理方法,以数据驱动的方式选择分布不确定性的大小以及相关的稳健目标收益率。
关键词 均值-方差投资组合选择,稳健模型,Wasserstein距离,稳健Wasserstein轮廓推断
1简介
研究了模型不确定性(或模糊性)下数据驱动的均值-方差投资组合选择问题。经典的Markowitz均值-方差模型(Markowitz 1952)是在d个股票中选择一个组合权重向量phi;isin;R(本文中的所有向量按惯例都是列),以使风险调整后的预期收益最大化。精确公式为[6]d级
, (1)
其中R是股票随机收益的d维向量;P*是R分布的概率测度;EP*和V arP*分别是P*下的期望和方差;rho;是投资组合的目标预期收益。
众所周知,这种模式有一个主要缺点。一方面,它的解对股票的基本参数,即股票的均值和协方差矩阵非常敏感。另一方面,EP*在实践中是未知的;因此,人们不得不求助于均值和协方差矩阵的经验版本,而这通常与真实值有很大的偏差(特别是均值,由于臭名昭著的“均值模糊”问题)。
这推动了马科维茨模型“稳健”表述的发展,该模型承认并试图解释P*与其经验版本之间(潜在重大)差异的影响。这一思想源于控制理论中的鲁棒控制方法(见Peterson,James和Dupuis(2000))。Hansen和Sargent(2008)系统地介绍了鲁棒控制在经济模型中的应用。关于投资组合选择的稳健性也有丰富的文献。Lobo和Boyd(2000)是第一个在Markowitz框架下对二阶矩不确定性进行最坏情况稳健分析的学者。Pflug和Wozabal(2007)基于Wasserstein距离建立了一个具有分布鲁棒性的Markowitz模型,这是一个度量两个概率测度之间差异的度量,我们在本文中也应用了这个度量。然而,它们的公式涉及到一个额外的风险值类型的约束,这导致了一个更复杂的优化问题。更重要的是,他们对不确定性大小的选择是外生的,没有给出最佳选择大小的指导。Esfahani和Kuhn(2017)在以经验测度为中心的基于Wasserstein的模糊集合中提供了最坏情况预期的表示,然后将其结果应用于使用不同风险测度的投资组合选择,从而得出不同于Markowitz模型的模型。不确定性规模的选择是次优的,因为它会随着基础投资组合的规模而急剧恶化。
沿着一条不同于完全分布不确定性的线,Delage和Ye(2010)构建了只涉及返回向量均值和协方差的不确定性区域。Wozabal(2012)还考虑了一个基于预期空头的稳健投资组合模型,该模型具有风险约束,从而产生了一个需要解决多个凸问题的优化问题。再次,这些论文没有考虑不确定性及大小的选择。
在解决稳健投资组合选择问题中涉及不同优化技术(如内点法、二次规划和线性矩阵不等式)的论文包括Halldorsson和Tutuncu(2000)、Costa和Paiva(2001)以及Ghaoui、Oks和Oustry(2003)。最后,我们提到了Goh and Sim(2010)和Wisesmann,Kuhn and Sim(2014)研究不同形式的分布模糊集的工作,以及Goh and Sim(2013)和Jiang and Guan(2016)研究基于Kullback-Leibler分歧的分布稳健公式的工作。值得注意的是,基于Kullback-Leibler散度的公式在经济学中很流行(见Hansen和Sargent(2008))。
在本文中,我们感兴趣的是研究均值-方差问题的分布鲁棒优化(DRO)公式,由
, (2)
式中,Pn是从样本量n的历史信息中得出的经验概率,Udelta;(Pn):=P:Dc(P,Pn)le;delta;}是模糊集,Fdelta;,alpha;′(n)=phi;:phi;t1=是投资组合的可行域,EP和V arP(R)
分别表示P下的均值和协方差矩阵,Dc(·,·)是基于适当定义的Wasserstein距离的两个概率度量之间的差异的概念。[7]
直观地说,公式(2)引入了一个人工对手P(其问题是内部最大化),作为解释经验分布周围模型不确定性影响的工具。在这个公式中有两个关键参数delta;和alpha;,需要仔细选择。参数delta;可以解释为给予对手的力量:delta;值越大,给予的力量就越多。如果delta;相对于证据(即n的大小)太大,那么投资组合选择将趋向于不必要的保守。另一方面,在给定模糊集的情况下,可以将alpha;′重新表示为最低可接收目标回报。当然,alpha;的选择应基于(1)中给出的原始目标rho;;但也需要考虑分布不确定性delta;的大小。使用alpha;prod;=rho;会产生过于激进的投资组合;更明智的做法是选择prod;alpha;rho;,使rho;minus;alpha;prod;自然地由delta;决定。
本文有两个主要贡献。首先,我们证明了(2)等价于一个经验概率测度的(显示)非稳健极小化问题,其中在目标函数中加入了适当的惩罚项或“正则化项”。这与在机器学习文献和实践中广泛使用的方差最小化技术中正则化的直接使用有关。实际上,在套索的启发下,使用均值-方差投资组合选择模型的实践者经常引入正则化惩罚,以增强稀疏性,从而减少投资组合中的股票。我们使用Wasserstein距离来模拟分布不确定性,自然会产生一个正则化项,这表明了在实践中使用它的另一种理论上的正当性。我们的结果表明,我们的鲁棒策略能够提高样本外的性能与标准均值-方差选择的计算可处理性基本相同。
我们的第二个主要贡献为模糊集delta;的大小以及最差平均收益目标delta;alpha;的大小的选择提供了指导。这是通过调整和扩展最近由Blanchet、Kang和Murthy(2016)引入和开发的鲁棒Wasserstein轮廓推断(RWPI)框架来实现的,该框架以数据驱动的方式结合了优化原则和基本统计理论,在适当的历史数据混合条件下。
本文的其余部分组织如下:我们将第2节分为三部分,第一部分讨论了假设,然后是我们的分布鲁棒优化公式的可处理性(以定理1为顶点),以及分布不确定性的选择(见定理2和第3.2节)。第4节给出了一些结论和扩展。我们的结果的技术证明在论文结尾的各种附录中给出。
2模型及主要结果
2.1基本符号和假设
在本小节中,我们将介绍我们的假设和符号,并回顾一些有用的概念。
我们问题的数学公式由(2)给出;但是我们现在需要指定临界测度Dc(·)。设P(Rtimes;R)是Rtimes;R上支持的Borel概率测度空间。给定的元素pi;isin;P(Rtimes;R)与随机向量(U,V)相联系,其中Uisin;Rand Visin;R,形式如下:pi;U(A)=
每一个波雷尔设定一个sub;R、 其中pi;U和pi;V分别是U和pi;V的分布。d级
引入一个代价函数c:Rtimes;R→[0,infin;],我们假设它是下半连续的,对于任意uisin;R,c(u,u)=0。
现在,给定两个概率分布P和Q在Rand上支持一个代价函数c,定义
(P,Q):=inf{Epi;[c(U,W)]:pi;isin;P(pi;U=P,pi;W=Q},(3)
这可以解释为在每单位质量从x到y的成本c(x,y)下,将质量从P移动到Q的最优(最小)运输成本(也称为最优运输差异或Wasserstein差异)。如果对于给定的P0,c1/P(·)是度量,那么Dc1/P也是度量(见Villani)
(2003). 这种度量Dc1/p被称为p阶的Wasserstein距离。在本文中,我们通常选择以下代价函数
(4)
其中qge;1是固定的(这导致了2阶的Wasserstein距离)。[8]最后,我们将模糊集Udelta;(Pn)定义为
Udelta;(Pn)={P:Dc(P,Pn)le;delta;},
其中Pn是样本量为n的经验概率度量,即
其中Ri(i=1,2,hellip;,n)是R的实现,delta;R(·)是指示函数。我
2.2计算可处理性
我们现在以一种计算上易于处理的方式重新表述(2)。第一步是证明在外极小化部分phi;上的可行域可以显示地求出。这在下面的命题中给出,其证明被放在附录中。
命题1对于c(u,w)=| | uminus;w | | 2q,qge;1,我们有
, (5)
具有1/p 1/q=1。
因此,可行域等价于
radic;
T T
Fdelta;,alpha;′(n)={phi;:phi;1=1,EP(phi;R)ge;alpha;′ delta;| |phi;| | p},不
现在可以清楚地看到它是凸的。
接下来,通过在问题(2)的内部最大化部分中固定EP(phi;tr)=alpha;ge;alpha;′,我们得到以下等价的重新公式
. (6)
引入EP(phi;tr)=alpha;是有用的,因为最里面的最大化问题现在在P中是线性的
Maxphi;T EP[RRT]phi;。(7)
isin;Udelta;(Pn),EP(phi;TR)=alpha;
下面的命题用一般的成本函数c来解决这个问题。
提案2对于下半连续非负的任意代价函数c,问题(7)的最优值函数由下式给出
, (8)
哪里
Phi;(Ri):=sup[(phi;tu)2minus;lambda;1c(u,Ri)minus;lambda;2phi;tu]。
u
附录中给出了一个基于双重论证的证明。由于这个命题,我们可以将(2)中的内(无穷维)变分问题化为一个以lambda;1和lambda;2表示的二维优化问题,如果代价函数c具有额外的结构,这个问题可以进一步简化。在二次lq代价的情况下,我们使这个陈述精确。
提案3带qge;1和1/p 1/q=1。如果(alpha;-
phi;T EP不[R] )2minus;delta;| |phi;| | 2ple;0,则(7)的值等于
同样,这个命题的证明在附录中。条件(alpha;-
0是为了确保(7)是可行的,否则最优
值h(alpha;,phi;)=-infin;。命题3最终得出了本文的主要结论,将(2)转化为一个基于经验测度Pn的非稳健投资组合选择问题。
定理1(2)中给出的原始公式等价于下面的对偶问题
, (9)
在这个意义上,这两个问题具有相同的最优解和最优值。
证明请注意
因此,从命题3可以看出
,
最佳alpha;opt=phi;T EP[R]ge;alpha;。结果到此结束。不
由于映射phi;→phi;tv arP(R)phi;是凸的,可行域Fdelta;,alpha;′(n)是凸的,因此(9)和(2)都是凸优化问题。因此,它们是易于处理的优化问题。此外,我们的方法证明了在实际环境中常采用的均值-方差投资组合选择的正则化技术。
3模型参数的选择
公式(2)中有两个关键参数delta;和prod;alpha;,其选择不仅在理论上令人好奇,而且在实际实现和算法的成功中也至关重要。其思想是,这些参数的选择应该根据一些统计原则由数据(即以数据驱动的方式)来决定,而不是随意的。具体地说,我们定义的分布不确定性区域足够大,以便正确的最优投资组合(如果基础分布已知,我们将应用的投资组合)成为具有足够高置信水平的合理选择。
我们需要强加几个统计假设。
lt;
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[266201],资料为PDF文档或Word文档,PDF文档可免费转换为Word