置换检验：一种非参数检验方法

时间：2023-06-25 理论教育版权反馈

【摘要】：置换检验是费希尔于20世纪30年代提出的一种统计检验方法，它能称为非参数检验是因为我们不需要对总体的分布任何先验知识。读者将会看到，即使样本不大，但是为了达到一定的精度，涉及的运算量很大，一般适用于总体分布未知的小样本数据，以及某些难以用参数检验方法的检验问题。置换检验克服了分布未知的障碍。在置换检验中抽取样本X1，X2，…因此在做置换检验之前确定采样方法也是很重要的。

置换检验：一种非参数检验方法

置换检验是费希尔（Fisher）于20世纪30年代提出的一种统计检验方法，它能称为非参数检验是因为我们不需要对总体的分布任何先验知识。读者将会看到，即使样本不大，但是为了达到一定的精度，涉及的运算量很大，一般适用于总体分布未知的小样本数据，以及某些难以用参数检验方法的检验问题。

假设有两个总体X，Y，检验的目的是要判别它们的均值是否相等。从X，Y中分别独立抽取了n和m个样本X1，X2，…，Xn，和Y1，Y2，…，Ym，然后求它们的均值和。前文已经提及，所有的Xi，Yj以及它们的均值都是随机变量，因而也是随机变量。按照一般的检验程序，对于给定显著性水平α，先求取P（|μ|＞c）＝α，就是求取拒绝域，最后对采样值，计算是否在拒绝域中。然而由于不知道μ满足的分布，因而这个过程无法进行下去。置换检验克服了分布未知的障碍。

置换检验的步骤如下：

一是设H0：μ＝E（X）-E（Y）＝0，H1：μ≠0；

二是从X，Y中各取出一组样本X1，X2，…，Xn和Y1，Y2，…，Ym，计算μ0＝称为原始误差；

三是将X1，X2，…，Xn和Y1，Y2，…，Ym混合在一起组成一个集合，然后随机地将它们分成两组W（a1，…，an）和Z（b1，…，bm），其中ai，bj∈｛X1，…，Xn，Y1，…，Ym｝，i＝1，…，n；j＝1，…，m，那么共有种不同的分组方法，记第k次分组的结果为Wk和Zk；

四是计算和，其中

pagenumber_ebook=56,pagenumber_book=46

再算出；

五是将计算结果按照的增长写成分布列（表2-1）。(www.xing528.com)

表2-1　利用分组生成的分布列

pagenumber_ebook=56,pagenumber_book=46

注意：这里的是将μ1，μ2，…，μn按照递增顺序重新排列，上面的序号根据重新排定后的编号，它们已经与和中的编号k无关了；

六是对于给出的显著性水平α，计算［（1-α）N］（［A］表示实数A的整数部分）；

七是如果，则拒绝H0，否则接受H0。

置换检验的实质是用抽样制造出一个有限分布，然后应用假设检验的一般方法完成检验。特别需要指出的是可能是一个很大的数，这里需要计算2N次均值和N次误差。在第一节给出从A、B两个班级抽取5名同学进行数学测试，如果目的是要比较哪个班级的数学基础好一点，那么

就是我们得到的表1中有252对数字，用人工计算的话工作量很大。有人估计过如果显著性水平α取0.01，那么要使得H0具有较高的可信度，N就要在500～1 000之间。不过应用计算机这些工作量就不在话下了，这是我们今天可以研究数据可视化的原因。

在置换检验中抽取样本X1，X2，…，Xn和Y1，Y2，…，Ym是关键。最常用的抽样方法是随机抽象，用计算机随机抽样或者根据随机数表用人工取样。另一种方法是分组随机取样，用表示总体X中最大值与最小值的差， pagenumber_ebook=57,pagenumber_book=47 称为极差。如果希望分成k组，那么就用作为组距，于是就是第k组。然后随机地从第k组中抽取n／k个样本。对于差距明显的总体，例如要考察中国的经济情况，分成经济发达地区，经济较发达地区，经济欠发达地区和经济相对不发达地区，这样分组选出的样本才能比较全面地代表总体水平。因此在做置换检验之前确定采样方法也是很重要的。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

研究成果

注意事项

解决方案

计算方法

发展趋势

中国古代

社会主义

心理健康

控制系统

建筑工程

经济发展

传统文化

民事诉讼

中国传统

程序设计

轨道交通

解决方法

工程施工

研究结果

建设工程

文史资料

持续发展

计算机网

使用方法

置换检验：一种非参数检验方法

相关推荐

置换检验：一种非参数检验方法

有关数据分析及可视化研究的文章

相关推荐