首页 理论教育 卡方检验:计数资料统计推断的常用方法

卡方检验:计数资料统计推断的常用方法

时间:2023-07-18 理论教育 版权反馈
【摘要】:卡方检验是计数资料进行统计推断的一种常用假设检验方法,以χ2分布为理论依据,可以用于检验两个或两个以上率或构成比之间是否有差异,或两变量之间是否有关联。表8-2甲、乙两种药物治疗某种疾病的疗效(一) 卡方检验的基本思想以四格表资料为例,介绍χ2检验的基本思想。

卡方检验:计数资料统计推断的常用方法

卡方检验(χ2检验)是计数资料进行统计推断的一种常用假设检验方法,以χ2分布为理论依据,可以用于检验两个或两个以上率或构成比之间是否有差异,或两变量之间是否有关联。

一、四格表资料的卡方检验

[例8.4]某研究者用甲、乙两种药物治疗某种疾病,甲药物治疗65例,有效59例;乙药物治疗56例,有效45例,结果见表82,问这两种药的有效率是否有差别?

表8-2甲、乙两种药物治疗某种疾病的疗效

95


(一) 卡方检验的基本思想

以四格表资料为例,介绍χ2检验的基本思想。

χ2检验基本公式为

96

式中:A为实际频数;T为理论频数,是根据假设检验推算出来的。

理论频数T的计算公式为

97

TRC为R行C列的理论频数,nR为相应行的合计,nC为相应列的合计。例如第一行第一列格子的理论频数T11=65×104121=55.89,其余格子依此类推,其理论频数见表82中括号中数字。

自由度ν=(行数-1)(列数-1)=(R-1)(C-1)(810)

由上述卡方检验基本公式可以看出:χ2反映了实际频数与理论频数之间的吻合程度。若检验假设H0成立,实际频数与理论频数的差值较小,则χ2也会小;反之若检验假设H0不成立,实际频数与理论频数的差值较大,则χ2也会增大。χ2还取决于格子数目的多少,格子数目又与自由度联系在一起,自由度越大,χ2会愈大,因此,只有考虑了自由度的影响,χ2才能正确地反映实际频数和理论频数的吻合程度。χ2检验时,要根据自由度查χ2界值表。当χ2≥χ2α,υ时,P≤α,拒绝H0,接受H1;当χ2<χ2α,υ时,P>α,不拒绝原假设H0。

(二) 四格表资料χ2检验的基本步骤

以[例8.4]资料说明检验步骤。

(1) 建立检验假设,确定检验水准。

H0:π1=π2,即甲药物与乙药物的有效率相同。

H1:π1≠π2,即甲药物与乙药物的有效率不相同。

α=0.05。

(2) 计算检验统计量χ2值。

理论频数已经算出,代入公式88中得到

98

计算自由度υ=(2-1)×(2-1)=1。

(3) 确定概率P值,作出统计推断。

本例ν=1,查χ2界值表得到χ20.05,1=3.84;本题χ2=2.69<3.84,故P>0.05,按照α=0.05的检验水准,不拒绝原假设H0,差异无统计学意义,根据现有资料尚不能认为甲乙两种药物的有效率有差别。

(三) 四格表资料专用公式

(1) 当总例数n≥40且所有格子的T≥5时,用χ2检验的基本公式或四格表资料χ2检验的专用公式。

99

(2) 当总例数n≥40且有一个格子的1≤T<5时,用四格表资料χ2检验的校正公式。

100

(3) 当n<40或T<1时,用四格表资料的Fisher确切概率法。

[例8.5]为了观察甲乙两药对治疗胃溃疡的疗效,将70名患者随机分为两组,一组30人服用甲药,一组40人服用乙药,结果见表83。问两种药物治疗胃溃疡效果有无差别?


101

检验步骤如下。

(1) 建立检验假设,确定检验水准。

H0:π1=π2,即甲药与乙药治疗胃溃疡的治愈率相同。

H1:π1≠π2,即甲药与乙药治疗胃溃疡的治愈率不相同。

α=0.05。

(2) 计算检验统计量χ2值。

计算最小理论频数T=30×1170=4.71<5,且n=70>40,需用校正公式,代入公式812中得到

102

(3) 确定概率P值,作出统计推断。

本例ν=1,查χ2界值表得到χ20.05,1=3.84;本题χ2=3.42<3.84,故P>0.05,按照α=0.05的检验水准,不拒绝H0,差异无统计学意义,尚不能认为甲乙两种药物治疗胃溃疡的治愈率有差别。

二、配对四格表资料的χ2检验

配对四格表资料常用于对同一个各个观察单位分别用两种检测方法、两种诊断方法或两种细菌培养方法进行检测或处理。观察结果有四种情况:两种处理方法结果均为阳性的计数为a,两种处理方法结果均为阴性的计数为d,一种处理方法检测为阳性而用另一种检测呈现阴性的计数为b,一种处理方法检测为阴性而用另一种检测呈现阳性的计数为c。显然,分析两种检测处理方法有无差别,只需要考虑结果不同部分的差异,即b和c的计数,如果两种处理方法无差别,即总体的B=C,但由于有抽样误差影响,可能样本的b≠c,为此,需要进行假设检验。

配对四格表计算公式如下:

(1) 当b+c≥40时,不需校正,用下列公式。

103

(2) 当b+c<40时,用校正公式。

104

[例8.6]现有178份尿液标本,每份标本分别用A、B两种培养基培养某种菌,结果见表84。请问A、B两种培养基的阳性率是否相同?

表84两种培养基培养某种菌的结果

105

本例的检验步骤如下。

(1) 建立检验建设,确定检验水准。

H0:B=C,即两种培养基的阳性率相同。

H1:B≠C,即两种培养基的阳性率不相同。

α=0.05。

(2) 计算统计量χ2值。

本例b+c=30+20=50>40,代入公式813中得到

106


(3) 确定概率P值,作出统计推断。

查χ2界值表得到χ20.05,1=3.84,本题χ2=2<3.84,故P>0.05,按照α=0.05的检验水准,不拒绝H0,差异无统计学意义,尚不能认为两种培养基的阳性率不相同。(www.xing528.com)

三、行×列表资料的χ2检验

四格表资料基本数据是两行两列,当分析的表格行数或者列数大于2时,即为行×列表资料或称R×C表资料。行×列表资料的χ2检验可用于多个率或构成比的比较。行×列表资料专用公式为

107

式中:n是总例数;A是每个格子的实际频数;nR、nC分别为A所对应的行合计和列合计。

(一) 多个样本率的比较

[例8.7]将133例尿路感染患者随机分为3组,分别接受三种治疗方法,一个疗程后观察疗效,结果见表85,问三种疗法治疗尿路感染的转阴率有无差别?


108

(1) 建立检验假设,确定检验水准。

H0:三种疗法治疗尿路感染的转阴率相同。

H1:三种疗法治疗尿路感染的转阴率不同或不全相同。

α=0.05。

(2) 计算检验统计量χ2值:将表85数据代入公式815中得到

109

(3) 确定P值,作出推断结论。

本例ν=(3-1)×(2-1)=2,查χ2界值表得χ20.05,2=5.99,本题χ2=30.63>5.99,故P<0.05,按照α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义,可以认为三种疗法治疗尿路感染的转阴率不同或不全相同。

(二) 多个构成比的比较

[例8.8]某医院研究急性组白血病患者和慢性组白血病患者的血型构成情况,资料见表86。问两组血型构成是否相同?


110


组别血型A型B型O型AB型合计急性组58495918184慢性组4327338111合计101769226295

(1) 建立检验假设,确定检验水准。

H0:急性组与慢性组白血病患者血型构成比相同。

H1:急性组与慢性组白血病患者血型构成比不同。

α=0.05。

(2) 计算检验统计量χ2值。

将表86中数据代入公式815中得到

111

(3) 确定P值,作出推断结论。

本例ν=(2-1)×(4-1)=3,查χ2界值表得χ20.05,3=7.81,本题χ2=1.84<7.81,故P>0.05,按照α=0.05的检验水准,不拒绝H0,差异无统计学意义,尚不能认为急性组白血病患者与慢性组白血病患者血型构成不同。

(三) 行×列表资料χ2检验的注意事项

(1) 行×列表资料进行χ2检验时一般要求理论频数不宜太小,要求不能有1/5以上格子的理论频数小于5,或者不能有一个格子的理论频数小于1。若理论频数太小,有三种处理方法:①最好增大样本含量以增大理论频数;②从专业上如果允许,可将太小的理论频数所在的行或列的实际频数与性质相邻的行或列的实际频数合并;③删去理论频数太小的行或列。

(2) 当多个样本率或构成比进行比较的χ2检验时,结论为拒绝无效假设H0,只能认为各总体率或构成比之间总的来说有差别,但不能推论为它们彼此之间都有差别,或者任意两个总体间都有差别,如果想说明某两组间是否有差别,则需要用χ2分割法进行两两比较。

 小     结

(1) 计数资料统计描述指标有率、构成比、相对比。相对数应用注意事项:计算相对数时分母不能过小;不能以构成比代替率进行分析;正确计算平均率;注意资料的可比性;对样本率或构成比的比较应做假设检验。

(2) 总体率估计分为点估计和区间估计,区间估计方法分两种:查表法和u分布法。

(3) 四格表资料卡方检验用于两个率的比较,掌握公式的使用条件:当总例数n≥40且所有格子的T≥5时,用χ2检验的基本公式或四格表资料χ2检验的专用公式;当总例数n≥40且有一个格子的1≤T<5时,用四格表资料χ2检验的校正公式;当n<40或T<1时,用四格表资料的Fisher确切概率法。

(4) 配对四格表:当b+c≥时,不需校正;当b+c<40时,用校正公式。

(5) 行×列表资料用于多个率或构成比的比较。

 思    考   题

1. 应用相对数需要注意哪些事项?

2. 四格表资料和配对四格表资料有何不同?

 自   测   题

一、A1型题(单项选择题)

1. 对两种治疗高血压的药物疗效进行比较分析,一组有效人数57人,有效率75%,另一组有效人数为75人,有效率83%,该资料类型属于(   )。


A.计数资料   B.计量资料   C.有序分类变量资料   D.都不是

2. 用以反映某个现象发生频度的指标为(  )。

A.率    B.构成比    C.相对比   D.平均数

3. 率与构成比之间(    )。

A.可以相互替代    B.可以用率动态变化代替构成比动态变化

C.两者意义不同,不能替代    D.以上都不对

4. 构成图的作用(    )。

A.反映某个现象频度   B.反映事物内部构成情况

C.反映事物发展趋势    D.比较数据之间差别

5. χ2检验时,在下列哪种情况下拒绝原假设(    )。

A.P>α   B.P<α   C.P=α   D.都不对

二、X型题(多项选择题)

6. 计数资料的统计描述常用的指标有(   )。

A.率   B.构成比  C.相对比  D.方差

7. 统计表的基本组成有(   )。

A.标题  B.表目  .线条  D.数据

8. 计数资料统计推断常用的方法为(   )。

A.四格表χ2检验    B.配对四格表χ2检验

C.t检验    D.R×C列表统计分析

                                                                                                                    (贺卫卫)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈