首页 理论教育 基于R的统计学:正态总体均值差与方差比的区间估计

基于R的统计学:正态总体均值差与方差比的区间估计

时间:2023-11-22 理论教育 版权反馈
【摘要】:我们需要知道这些变化有多大,这就需要考虑两个正态总体均值之差与方差之比的估计问题。假定改革前后线纱断裂强度分别服从正态分布,其方差分别为21.82和1.762,试求改革前后线纱平均断裂强度之差的置信度为95%的置信区间。现要对两个总体均值之差μ1-μ2作区间估计。设σ2A和σ2B分别是A和B两化验员测量数据总体的方差,且总体服从正态分布,求总体方差之比的置信度为95%的置信区间。

基于R的统计学:正态总体均值差与方差比的区间估计

在实际中,经常遇到下面的问题:已知产品的某一质量指标服从正态分布,但由于原料、设备条件、操作人员不同,或工艺过程的改变等因素,总体均值、总体方差有所改变。我们需要知道这些变化有多大,这就需要考虑两个正态总体均值之差与方差之比的估计问题。

1.两个正态总体均值之差的区间估计

设有两个正态总体N(μ1,σ21)和N(μ2,σ22),分别从中抽取容量为n1和n2的样本,样本均值分别为,样本方差分别为S21和S22,并设这两个样本是互相独立的。下面就总体方差的不同情况,来讨论μ12置信区间

(1)总体方差σ21和总体方差σ22都已知

的独立性以及,知

从而有

对于给定的置信度1-α,查标准正态分布表得的值,使

其中是标准正态分布的分位数。把u的表达式代入上式得

故μ1-μ2的置信区间是

而置信度为1-α。

例3.4.4 为考察工艺改革前后所纺线纱的断裂强度的变化大小,分别从改革前后所纺线纱中抽取容量为80和70的样本进行测试,算得=5.32,=5.76。假定改革前后线纱断裂强度分别服从正态分布,其方差分别为21.82和1.762,试求改革前后线纱平均断裂强度之差的置信度为95%的置信区间。

解 由题意知,α=5%。查标准正态分布表得u0.975=1.96。则置信下限为

置信上限为

故μ1-μ2置信度为95%的置信区间是(-1.07,0.19)。

(2)总体方差σ21和总体方差σ22未知,但已知σ21222

由式(2.3.12)知

上面结论可改写为

给定置信度1-α,从t分布表可查得的值。使

所以,对置信度为1-α,两总体均值之差μ1-μ2的置信区间是

例3.4.5 为了估计磷肥对某种农作物增产的作用,现选20块条件大致相同的地块。10块不施磷肥,另外10块施磷肥,得亩产量(单位:500 g)如下:

不施磷肥亩产

560 590 560 570 580 570 600 550 570 550

施磷肥亩产

620 570 650 600 630 580 570 600 600 580

设不施磷肥亩产和施磷肥亩产都具有正态分布,且方差相同,取置信度为0.95,试对施磷肥平均亩产和不施磷肥平均亩产之差作区间估计。

解 不施磷肥亩产看成总体X~N(μ1,σ2),施磷肥亩产看成总体Y~N(μ2,σ2)。由题意知,n1=n2=10,经计算得

由1-α=0.95,查表得,所以μ2-μ1的置信下限为

置信上限为

故施磷肥平均亩产与不施磷肥平均亩产之差的置信区间是(9,51)。

基于R的求解方法之一如下:

(3)大样本时对两个总体均值之差的区间估计

设两个总体X与Y的分布是任意的,分别具有有限的非零方差。记E(X)=μ1,D(X)=σ21,E(Y)=μ2,D(Y)=σ22,它们都是未知的。今独立地从各总体中抽得一个样本,分别为(X1,X2,…,Xn1)和(Y1,Y2,…,Yn2),即两个相互独立的随机向量。记分别是两个样本的均值,S21和S22分别是两个样本的方差。现要对两个总体均值之差μ12作区间估计。(www.xing528.com)

利用中心极限定理,当n1和n2都很大时,分别近似地服从正态分布。由样本的独立性知是独立的,因而

经标准化后,可得

近似地服从标准正态分布,而其中σ21和σ22都是未知的。当n1和n2都很大时,可分别用样本方差代替总体方差。在上式中,σ21和σ22分别用S21和S22代替后,仍近似地服从标准正态分布,即

给定1-α(0<α<1),可查标准正态分布表得使

把u的表达式代入上式得

所以,μ1-μ2的置信区间是

而置信度为1-α。

例3.4.6 两台机床加工同一种轴,分别抽得加工200根和150根轴测量其椭圆度,经计算得到:

·第一台机床n1=200=0.081 mm,s1=0.025 mm

·第二台机床n2=150=0.062 mm,s2=0.062 mm给定置信度为95%,试求两台机床平均椭圆度之差的置信区间。

解 此题中取得的两个样本都是大样本,根据上面的公式,可得μ1-μ2的置信下限

置信上限

故μ12置信度95%的置信区间是(0.008 5,0.029 5)。

2.两个正态总体方差之比的区间估计

设两个正态总体的分布分别是N(μ1,σ21)和N(μ2,σ22),其中μ1、μ2、σ21、σ22都是未知的。从两个总体中独立地各取一个样本,样本方差分别记为S21和S22。下面对两个总体方差之比作区间估计。

由前面的定理式(2.3.3)知分别服从自由度为n1-1和n2-1的χ2分布。且S21与S22相互独立,由F分布的定义知

服从自由度为(n2-1,n1-1)的F分布。

给定置信度1-α,在F(n2-1,n1-1)分布密度图3.4.3中取左右两侧面积都等于,即由F分布表可查得的数值使

图3.4.3 F分布双侧分位数图

于是,中间部分面积等于1-α,即

把式(3.4.10)中的F代入上式,经变化可得

故得的置信度为1-α的置信区间是

根据F分布的性质,的置信区间还可以表示为

方差之比的置信区间的含义是:若的置信上限小于1,则说明总体N(μ1,σ21)的波动性较小;若的置信下限大于1,则说明总体N(μ1,σ21)的波动性较大;若置信区间包含1,则难以从这次实验中判断两个总体波动性的大小,可以认为σ2122

例3.4.7 两名化验员A和B独立地对某种聚合物的含氯量用相同的方法各做了10次测定,其测定值的方差S2A=0.541 9,S2B=0.606 5。设σ2A和σ2B分别是A和B两化验员测量数据总体的方差,且总体服从正态分布,求总体方差之比的置信度为95%的置信区间。

解 由题意知,

1-α=0.95,α/2=0.025,n1-1=n2-1=9,F0.025(9,9)=4.03

的置信下限

置信上限

所以,的置信度为95%的置信区间为(0.222,3.601)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈