Bootstrap算法设计及其应用研究文献综述
2020-06-26 19:50:15
再抽样(resampling)在统计学上一直是重要的对估计样本统计量的精度等问题的重要解决途径,在1979年美国斯坦福大学的统计学家Efron^([1])提出Bootstrap方法之前,比较常用并且受到认可的再抽样方法是Jackknife(又称刀切法),这是由〖Maurice Quenouille〗^([2])(1949)提出的算法,其基本思想是:当我们需要研究一个估计量的估计值和这个估计量的质量或稳定性的时候,一般在统计上会用偏差、方差等来反映。
若是样本很少,甚至是只有一组时,则仅能计算出一个值,那么就没办法计算这个估计量的方差。
我们在计算偏差的时候也会遇见类似的问题,由于样本极小致使不知道参数真实值,从而无法计算偏差。
Jackknife提供的解决方法是:在一组样本点中,每次剔除一个(或几个)样本点,再通过其余的样本及同样的公式去重新计算,经过逐个删除、计算后,可以得到一组估计值,在这之后通过类比便可求出我们所需要偏差和方差的值,关于Jackknife的研究Miller^([3])在1974年有过系统全面的综述,在此就不赘述了。
而类似这种”类比”也几乎是所有再抽样方法的核心思路,虽然Bootstrap与Jackknife在计算方式上很类似,但其抽样方式不同。
Bootstrap方法在国内一般称作”自助法”、”自举法”等,这是一种根据给定的原始样本复制观测信息 , 无需进行分布假设或增加新的样本信息,对总体的分布特性进行统计推断的一种非参数统计方法。
在此方法提出后,许多统计学家针对这个算法方向进行了研究,比如Hall^[4] (1992)关于Bootstrap和Edgeworth的延展研究,〖 Diebold〗^[5] (1996)关于测试结构稳定性的研究,〖 Shao及Tu〗^[6] (1995)对jackknife和bootstrap理论和应用的研究等等。
研究表明,bootstrap方法不仅为解决误差项分布未知时计量模型问题提供了一种有效的研究途径,也优于基于大样本的渐进理论。
在使用Bootstrap实现计算推理的过程中,计算机的地位是不容忽视的(〖 Diaconis P ,Efron B〗^[12] )。
迫切需要计算机辅助计算的原因是:很多时候,一些关于总体参数的推断(比如均值的方差、均值的分位数、方差的置信区间等)基本上不可能推导出明确的解析式来,虽然在不太复杂的情况下,如回归系数的方差等也是有显式的解析表达式的,但当我们的统计理论变得越来越复杂时,表达式就会变得很难推导出所期望的结果,于是不得不摒弃这种繁琐的理论推导,改由计算机进行Monte-Carlo(蒙特卡洛)模拟计算。
您可能感兴趣的文章
- 腐败与美国各州收入不平等之间的关系:来自专家小组的协整和误差修正模型的证据外文翻译资料
- 内蒙古1962 – 2016年时间序列气候变量的变化特征外文翻译资料
- 残差修正法在季节性ARIMA电力需求预测中的应用:以中国为例外文翻译资料
- 净工资与居民消费价格指数的关系分析外文翻译资料
- 我国鸡蛋价格波动的深入研究与预测外文翻译资料
- 信赖域与线搜索技术的结合外文翻译资料
- 求解奇异非线性方程组的多点LM方法外文翻译资料
- 具有双线性和非单调发病率的关于两个菌株的流行病模型的全局稳定性分析外文翻译资料
- 寻找可伸缩的区块链结构: 工作证明与BFT复制外文翻译资料
- 网络营销中潜在成功人士的结构方程建模外文翻译资料