首页 理论教育 参数检验的重要性:了解t检验

参数检验的重要性:了解t检验

时间:2023-06-25 理论教育 版权反馈
【摘要】:假设检验分成参数检验和非参数检验,如果对总体的统计特性有一定了解,在这种前提下做假设检验称为参数检验;否则称为非参数检验。所谓t检验是利用t分布进行的检验。设μ为2016年的平均误点时间,建立检验假设如下。t检验是统计分析中最常用的检验方法之一,它有以下两个特点:首先是要求总体服从正态分布;其次是样本容量较小,这就决定了t检验适用于小规模抽样统计中。

参数检验的重要性:了解t检验

假设检验分成参数检验非参数检验,如果对总体的统计特性有一定了解,在这种前提下做假设检验称为参数检验;否则称为非参数检验。最基本的总体的统计特征是分布,其次是分布涉及的参数。在参数检验中,绝大多数情况是假定总体服从正态分布N(μ,σ2),而其中的均值μ和方差σ可以知道也可以不知道。

所谓t检验是利用t分布进行的检验。t分布是英国人戈塞特(Gosset)在1908年提出的,当时他用笔名Student(学生)发表论文,提出t分布,因此后人就称它为“学生氏分布”,又因为他用的统计量记号是t,为了简便人们将这个分布称为t分布。t分布带有一个参数n,代表样本的容量,即样本集中元素的个数。戈塞特证明了t(n)的密度函数fn(x)如下。

其中的Γ(·)是Γ函数,它的表达式在一般数学手册上可以查到。要按照密度公式计算t分布的值非常复杂,人们总是通过软件或者查表得到t分布的值。图2-34给出不同n的fn(x)曲线,图中的平均值等于0。它们与标准正态分布的密度有点相似,但是相对平坦,当n>30时,fn(x)和标准正态分布的密度很接近了。

图2-34 t分布趋近于正态分布的过程

定理 (t检验基本定理Ⅰ)设总体服从正态分布N(μ,σ2),从总体独立抽取样本X1,X2,…,Xn,记和S分别是样本均值和标准差,那么

定理 (t检验基本定理Ⅱ)设有两个总体X,Y分别服从正态分布,从X中独立抽取样本X1,X2,…,Xn,从Y中独立抽取样本Y1,Y2,…,Ym,记和S1,S2分别是两个样本均值和标准差,那么

(1)

(2)当时,

其中

在第二个定理的第二个结论中,我们只要知道两个分布的方差相等,而不需要知道它们等于几。

这两个定理在下面的假设检验中扮演了重要角色,这里先给出一个例子来说明如何应用这些定理。

例1 设总体X服从N(3.4,62),X1,X2,…,Xn是一个样本,如果要求样本均值满足P(1.4<<5.4)≥0.95,问n应该是几?

解:我们需要用到一个事实,这个事实在今后很有用。如果X~N(μ,σ2),那么有n个样本的样本均值。所以在本题中,要求1.4<,就是,这等价于

根据正态分布的标准化,可得,就是,从3σ准则可看出(图2-32)是充分的,因此,就是n≥36。

我们从这个例子给出两个注释:首先n≥36未必一定能够保证,我们只是说当样本容量不小于36时,有95%的可能样本均值在区间[1.4,5.4]中;其次概率条件可以导出自变量的一个不等式。当不等号右面不是0.95时,我们可以从正态分布表查出对应的不等式。由概率条件导出变量条件是解决概率问题的基本途径。

例2 设某航空公司从上海到北京航班误点时间X满足正态分布,统计资料显示,2010年前平均误点时间为31.4分钟。从2016年的记录中随机抽取20个该航空公司从上海到北京航班误点情况,计算得到平均误点时间为33.0分钟,标准差为3分钟。问与2010年前情况相比,该航空公司从上海到北京航班误点情况是否有显著变化(取α=0.01)?

解:这是一个典型的由样本判断总体均值的题目,已知样本均值与标准差,要求分析总体的均值。题目给出显著性水平为0.01。

设μ为2016年的平均误点时间,建立检验假设如下。

H0:μ=31.4,H1:μ≠31.4。

根据定理1,构造统计量(式(2-12))(www.xing528.com)

其中取零假设为真,即μ=31.4,根据题目有S=3,n=20。这是一个双侧检验问题,要求

从参数为19的t分布表上查到P(2.861)=0.01,因此t0.005(19)=2.861,从而拒绝域为|T|≥2.861。计算当前的T值:

应该接受零假设,即航班误点情况没有显著变化。

t检验是统计分析中最常用的检验方法之一,它有以下两个特点:首先是要求总体服从正态分布;其次是样本容量较小(n<30),这就决定了t检验适用于小规模抽样统计中。通过科学抽取少量样本,在运算步骤正确的前提下,可以快速且较为准确地得到设想假设的结果,可以说是十分方便且高效的检验方法之一。

本节介绍的t检验在一个总体或两个总体情况下都可以采用,例2给出的是一个总体情况,下面会进一步讨论t检验在两个总体情况下的应用。

思考:如果希望尝试定理2,可以在假设A、B两个班级方差相等的前提下,用本节开始给出的各抽取5名同学的检测结果来比较它们的水平是否相等(取α=0.05)?

解:根据题目我们可知,且

A班:n=5,

B班:m=5,

设A班总体均值为μA,B班为μB,建立检验假设如下

H0:μA=μB,H1:μA≠μB

根据定理2,构造统计量

其中取零假设H0为真,0.632代入公式得

T≈-0.25~t(8)

这是一个双侧检验问题,要求

从参数为8的t分布表上查到P(2.897)=0.05,因此t0.005(8)=2.897,从而拒绝域为|T|≥2.897。则:

|T|≈0.25<2.897

应该接受零假设,即A、B班水平相当。

从参数为19的t分布表上查到P(2.861)=0.01,因此t0.005(19)=2.861,从而拒绝域为|T|≥2.861,计算当前的T值。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈