试述方差概化论述偏态分布数据方差分量置信区间估计大专

更新时间：2024-01-20 点赞:8251 浏览:25355 作者：用户投稿原创标记本站原创

摘要：心理与教育测量的应用领域发生了较大变化，被测群体的知识和能力等特质在一定程度上不再服从偏度为0的分布。利用GH分布性质，模拟生成一定偏度的偏态分布数据，探讨数据的不同偏度对概化理论方差分量置信区间估计的影响。结果表明：（1）偏态分布数据的偏度对Traditional方法、Jackknife 方法和MCMC方法估计方差分量置信区间有显著的影响；（2）校正的Bootstrap的PC和BCa方法估计偏态分布数据方差分量置信区间，要优于未校正的Bootstrap的PC和BCa方法；（3）使用“分而治之”策略，Bootstrap的PC和BCa方法能够找到一种（或几种）策略较好地估计偏态分布数据的方差分量置信区间。
关键词：概化理论；偏态分布数据；方差分量；置信区间估计
1003-5184（2012）05-0397-07
1 引言
随着社会的发展，心理与教育测量的应用领域发生了较大变化，被测群体的知识和能力等特质在一定程度上不再服从偏度为0的分布（焦璨，张敏强，黄庆均，张文怡，黎光明，2008）。Othman（1995，p.8）的研究表明，许多测验数据的分布呈弱偏态，如CAP（California Assesent Program）和UCSB（University of California Santa Barbara），这两个测验数据的分布偏度值介于-0.91～+0.85。
概化理论（Generalizability Theory，GT）是关于行为测量可靠性（dependability）的统计理论（Shelson & Webb，1991，p.1），广泛应用于心理与教育测量中（漆书青，戴海崎，丁树良，2002；杨志明，张雷，2003）。当数据为偏态分布时，适合于概化理论正态分布数据的方差分量置信区间估计方法不一定适合于偏态分布数据。
在样本统计量研究中，仅用一个（次）样本平均数来估计总体均值，存在较大的风险，因为样本平均数容易受抽样的影响。例如，某班某次考试平均分为70分，用这个成绩估计这个班的能力水平，必然存在较大风险，这个班下次考试成绩的平均分有可能变为75分。为了降低这种风险，通常的做法是用标准误或置信区间等变异量来估计这个班的实际水平，如70±10或＼[60，80＼]。与平均数做法类似，概化理论下所估计的方差分量，也受到抽样的影响，用某个（次）样本方差分量来估计总体方差分量（参数），存在一定误差。为了降低这种误差带来的风险，需要报告方差分量对应的变异量（如标准误或置信区间），来反映可能存在的变化程度。Gao和Brennan（2001）认为，估计的方差分量、误差方差和概化系数等统计量受限于抽样，不同的抽样样本估计的统计量可能不一样，应该重视考察方差分量及其相关统计量的变异量（如置信区间）。
虽然Othman（1995）已经考虑到数据分布具有（弱）偏态，但是Othman并没有进行偏态分布数据的方差分量置信区间估计，显得不足。本文旨在探讨偏态分布数据偏度如何影响概化理论方差分量置信区间估计。
2 方法

2.1 数据产生

基于p×i设计概化理论模型，根据GH分布的性质使用蒙特卡洛数据模拟技术产生偏态分布数据。

2.2 比较标准

比较标准为“偏差”（bias），计算方法是i表示方差分量置信区间的包含率估计值，θ为参数（0.800），偏差的绝对值（称为“绝对偏差”）越大，表明估计值与参数的差异越大，结果越不可靠。

2.3 分析工具

分析工具为R软件、WinBUGS 软件、R2WinBUGS软件包、Coda软件包和HyperbolicDist软件包。借助这些软件或软件包，自编完成研究程序。
3 结果
3.1 β=-

2.0的偏态分布数据估计的方差分量置信区间及其包含率

对β=-2.0的偏态分布模拟数据，分别计算Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法估计的方差分量置信区间及其80%置信区间包含率，结果如表1所示。
在表1中，lower表示方差分量的下限，为方差分量10%分位数，upper表示方差分量的上限，为方差分量90%分位数，80%表示“80%置信区间包含率（coverage）”，其值与10%和90%两分位点对应的方差分量有关。
在表1中，satterthwaite和TBGJL分别表示用Satterthwaite和TBGJL方法估计的方差分量置信区间包含率。jack-p、jack-i、jack-pi表示Jackknife方法的三种再抽样策略。MCMC inf和 MCMC non-inf分别表示有先验信息的MCMC方法和无先验信息的MCMC方法。PC和BCa分别表示用Bootstrap的PC和BCa方法估计的方差分量置信区间及其包含率，对PC和BCa两种方法分别实施不同的Bootst怎么写论文www.618jyw.com
rap策略（6种），Bootstrap还可分为校正的和未校正的两种情况，这样每种方法共有2×6=12种情况。例如，PC：boot-pi表示采取未校正的boot-pi策略使用PC方法估计的方差分量置信区间及其包含率，PC：boot-piadj表示采取校正的boot-pi策略使用PC方法估计的方差分量置信区间及其包含率，BCa：boot-pi表示采取未校正的boot-pi策略使用BCa方法估计的方差分量置信区间及其包含率，BCa：boot-piadj表示采取校正boot-pi策略使用BCa方法估计的方差分量置信区间及其包含率，其余类似解释。3.2 β=-

1.0的偏态分布数据估计的方差分量置信区间及其包含率

对β=-1.0的偏态分布模拟数据，分别计算Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法估计的方差分量置信区间及其80%置信区间包含率，结果如表2所示。3.3 β=0的偏态分布数据估计的方差分量置信区间及其包含率[HT]
对β=0的偏态分布模拟数据，分别计算Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法估计的方差分量置信区间及其80%置信区间包含率，结果如表3所示。
4 分析与讨论
4.1 Traditional、Jackknife、MCMC方法估计的方差分量置信区间包含率分析
根据表1～表3中Traditional方法（包括Satterthwaite和TBGJL方法）、Jackknife方法和MCMC方法估计三种偏态分布数据的方差分量80%置信区间包含率，可以绘出三种方法对应的方差分量80%置信区间包含率图，如图1（a）～图1（c）所示。
在图1（a）～图1（c）中，Sa表示Satterthwaite，TB表示TBGJL，jp表示jack-p，ji表示jack-i，jpi表示jack-pi，mi表示MCMC inf，mni表示MCMC non-inf。在图1（a）～图1（c）中，p-coverage_2、p-coverage_1和p-coverage_0分别表示β为-2、-1和0偏态分布数据Traditional、Jackknife和MCMC方法估计的人的方差分量置信区间包含率，其余类似解释。
Jackknife方法估计的方差分量置信区间包含率，远离参数0.800，包含率严重偏低，表明Jackknife方法估计方差分量置信区间不准确。Traditional方法（包括Satterthwaite和TBGJL方法）与MCMC方法（包括MCMC inf和MCMC non-inf方法）估计三个方差分量的置信区间包含率，结果相当。
对比图1（a）～图1（c）可以发现，随着偏度减小，Traditional和MCMC方法的三个方差分量置信区间包含率越来越接近参数0.800，但接近的速度“先快后慢”，速度越来越小。当偏度远离0时，方差分量的置信区间包含率偏离参数0.800越来越大，表明Traditional方法和MCMC方法受偏度影响。在偏度为0时结果较好（离参数0.800相对较小），偏度较大时结果不好。这样，可以认为Traditional和MCMC方法仅是尚可，因为受偏度影响，需要分情况对待，并没有达到“令人满意”的结果，界于准确与不准确之间，不是十分理想，仅为“适中”。对于正态分布数据，Traditional方法和MCMC方法估计方差分量置信区间结果较好（黎光明，张敏强，2009）。对于偏态分布数据，偏度为0结果较好，佐证了正态分布数据所得的结论，因为偏度为0是正态分布的一个属性。当然，偏度为0仅是正态分布一个“属性”，正态分布还受峰度、尾部厚度等条件影响，通过改变GH分布形式，促使GH分布形成正态分布，那么偏态分布的结果就成了正态分布的结果。当偏度趋近于0时，结果越来越好，这表明偏态分布数据的偏度影响Traditional和MCMC方法对方差分量置信区间的估计，偏度越大，方差分量置信区间包含率偏离参数越大，反之亦然。

4.2 Bootstrap的PC和BCa方法估计的方差分量置信区间包含率分析

根据表1～表3中Bootstrap的PC方法估计三种偏态分布数据的方差分量80%置信区间包含率，可以绘出Bootstrap的PC方法对应的方差分量80%置信区间包含率图，如图2（a）～图2（c）所示。
在图2（a）～图2（c）中，Ppi表示PC：boot-pi，Ppia表示PC：boot-piadj，其余类似解释。从图2（a）～图2（c）可以看出，对于三个方差分量置信区间包含率，随着偏度减小，越来越接近参数0.800。但是，接近的速度随着偏度减小而越来越慢，这表明偏态分布数据的偏度影响Bootstrap的PC方法对方差分量置信区间的估计，偏度越大，方差分量置信区间包含率偏离参数的幅度越大，反之亦然。三条不同偏度的方差分量包含率折线相当相似，可以认为，偏度仅对方差分量置信区间包含率大小有影响，对其方向影响较小，说明Bootstrap的PC方法估计不同偏态分布数据方差分量置信区间包含率“步调”趋于一致。
对比校正的和未校正的Bootstrap的PC方法，发现对于p和i的方差分量置信区间估计，两种方法估计的包含率相当，不论在何种偏度下两者结果几乎一致，而对于pi的方差分量置信区间估计，两种方法存在相当大的差异。校正的Bootstrap的PC方法优于未校正的Bootstrap的PC方法，未校正的Bootstrap的PC方法在大多数策略上的包含率都远离参数值0.800。对于不同偏度的Bootstrap的PC方法（包括校正的和未校正的），总能找到一种策略较好地估计方差分量置信区间。但是，没有任何一种Bootstrap的PC方法能够同时较好地估计三个方差分量的置信区间。对于偏度分布数据，Bootstrap的PC方法也需要使用“分而治之”策略。
根据表1～表3中Bootstrap的BCa方法估计三种偏态分布数据的方差分量80%置信区间包含率，可以绘出Bootstrap的BCa方法对应的方差分量80%置信区间包含率图，如图3（a）～图3（c）所示。
在图3（a）～图3（c）中，Bpi表示BCa：boot-pi，Bpia表示BCa：boot-piadj，其余类似解释。对于图3（a）～图3（c）的结果解释可参考图2（a）～图2（c）的结果解释。在图3（a）中，对比校正的和未校正的Bootst优秀论文查重www.618jyw.com
rap的BCa方法，发现对于p的方差分量置信区间估计，校正的Bootstrap的BCa方法在boot-pi、boot-pir、boot-pr上优于未校正的Bootstrap的BCa方法。在图3（b）和图3（c）中，对于i和pi的方差分量置信区间估计，校正的Bootstrap的BCa方法在boot-ir、boot-i的估计上明显优于未校正的Bootstrap的BCa方法。从总体趋势看，校正的Bootstrap的BCa方法相对好些。源于：论文的标准格式范文www.618jyw.com