首页 理论教育 置换检验:一种非参数检验方法

置换检验:一种非参数检验方法

时间:2023-06-25 理论教育 版权反馈
【摘要】:置换检验是费希尔于20世纪30年代提出的一种统计检验方法,它能称为非参数检验是因为我们不需要对总体的分布任何先验知识。读者将会看到,即使样本不大,但是为了达到一定的精度,涉及的运算量很大,一般适用于总体分布未知的小样本数据,以及某些难以用参数检验方法的检验问题。置换检验克服了分布未知的障碍。在置换检验中抽取样本X1,X2,…因此在做置换检验之前确定采样方法也是很重要的。

置换检验:一种非参数检验方法

置换检验是费希尔(Fisher)于20世纪30年代提出的一种统计检验方法,它能称为参数检验是因为我们不需要对总体的分布任何先验知识。读者将会看到,即使样本不大,但是为了达到一定的精度,涉及的运算量很大,一般适用于总体分布未知的小样本数据,以及某些难以用参数检验方法的检验问题。

假设有两个总体X,Y,检验的目的是要判别它们的均值是否相等。从X,Y中分别独立抽取了n和m个样本X1,X2,…,Xn,和Y1,Y2,…,Ym,然后求它们的均值。前文已经提及,所有的Xi,Yj以及它们的均值都是随机变量,因而也是随机变量。按照一般的检验程序,对于给定显著性水平α,先求取P(|μ|>c)=α,就是求取拒绝域,最后对采样值,计算是否在拒绝域中。然而由于不知道μ满足的分布,因而这个过程无法进行下去。置换检验克服了分布未知的障碍

置换检验的步骤如下:

一是设H0:μ=E(X)-E(Y)=0,H1:μ≠0;

二是从X,Y中各取出一组样本X1,X2,…,Xn和Y1,Y2,…,Ym,计算μ0称为原始误差;

三是将X1,X2,…,Xn和Y1,Y2,…,Ym混合在一起组成一个集合,然后随机地将它们分成两组W(a1,…,an)和Z(b1,…,bm),其中ai,bj∈{X1,…,Xn,Y1,…,Ym},i=1,…,n;j=1,…,m,那么共有种不同的分组方法,记第k次分组的结果为Wk和Zk

四是计算,其中

再算出

五是将计算结果按照的增长写成分布列(表2-1)。(www.xing528.com)

表2-1 利用分组生成的分布列

注意:这里的是将μ1,μ2,…,μn按照递增顺序重新排列,上面的序号根据重新排定后的编号,它们已经与中的编号k无关了;

六是对于给出的显著性水平α,计算[(1-α)N]([A]表示实数A的整数部分);

七是如果,则拒绝H0,否则接受H0

置换检验的实质是用抽样制造出一个有限分布,然后应用假设检验的一般方法完成检验。特别需要指出的是可能是一个很大的数,这里需要计算2N次均值和N次误差。在第一节给出从A、B两个班级抽取5名同学进行数学测试,如果目的是要比较哪个班级的数学基础好一点,那么

就是我们得到的表1中有252对数字,用人工计算的话工作量很大。有人估计过如果显著性水平α取0.01,那么要使得H0具有较高的可信度,N就要在500~1 000之间。不过应用计算机这些工作量就不在话下了,这是我们今天可以研究数据可视化的原因。

在置换检验中抽取样本X1,X2,…,Xn和Y1,Y2,…,Ym关键。最常用的抽样方法是随机抽象,用计算机随机抽样或者根据随机数表用人工取样。另一种方法是分组随机取样,用表示总体X中最大值与最小值的差,称为极差。如果希望分成k组,那么就用作为组距,于是就是第k组。然后随机地从第k组中抽取n/k个样本。对于差距明显的总体,例如要考察中国的经济情况,分成经济发达地区,经济较发达地区,经济欠发达地区和经济相对不发达地区,这样分组选出的样本才能比较全面地代表总体水平。因此在做置换检验之前确定采样方法也是很重要的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈