首页 理论教育 样本均值的抽样分布及其优化方法

样本均值的抽样分布及其优化方法

时间:2023-07-03 理论教育 版权反馈
【摘要】:◎定义5.4:从总体中重复随机抽取容量为n的样本时,由样本平均数的所有可能取值形成的频数分布,称为样本平均数的抽样分布。表5.3样本均值的分布通过比较总体分布和样本均值的抽样分布,不难看出它们的区别。总体分布为均匀分布,而样本均值的抽样分布在形状上是对称的。样本容量越大,样本均值的抽样分布与正态分布的近似程度越高。关于样本均值抽样分布的特征要注意结合中心极限定理,如果是正态总体,则样本均值服从正态分布。

样本均值的抽样分布及其优化方法

◎定义5.4:从总体中重复随机抽取容量为n的样本时,由样本平均数的所有可能取值形成的频数分布,称为样本平均数的抽样分布。

下面举一个简单的例子来介绍样本平均数抽样分布的形成过程。

【例5.1】 设一个总体,含有4个元素(个体),即总体单位数N=4。4个单位具体变量值分别为x1=5,x2=6,x3=7,x4=8。求总体的均值、方差及分布。

解 总体4个元素每个出现一次,每个取值概率为1/4,属均匀分布

依题意可计算总体参数如下:

总体均值

总体方差

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果见表5.1。

表5.1 16个可能的样本

根据表5.1可计算出各样本的均值,计算结果见表5.2。

表5.2 16个可能样本的均值x

由于每个样本被抽中的概率相同,均为1/16。将样本均值经整理后见表5.3。

通过比较总体分布和样本均值的抽样分布,不难看出它们的区别。总体分布为均匀分布,而样本均值的抽样分布在形状上是对称的。

样本均值的形成过程和基本分布形状可从上面例子的演算过程中得知,但要深入分析样本均值抽样分布和总体的分布之间的对应关系,还要了解样本均值分布的性质和特征,并进一步总结出其中的规律。

统计中我们用得最多是现实生活中普遍存在的正态分布。如果原有总体是正态分布,那么,不管你抽取样本容量为多少,样本均值的抽样分布都服从正态分布。但是,如果原有总体不服从正态分布的话,样本均值的分布就与所抽取的样本容量有关了。

统计学上著名的中心极限定理就对这一规律进行了描述。

◎定义5.5:中心极限定理(central limit theorem)可以表述为设从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,在样本容量n足够大(通常要求n≥30)时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。

3)样本均值抽样分布的特征

就像前面几章学到的,我们关心样本的特征值主要是数学期望和方差。这两个特征一方面与总体的均值和方差有关,另一方面也与抽样的方法是重复抽样还是不重复抽样有关。

4)样本均值的数学期望与方差

(1)样本均值的数学期望

(2)样本均值的方差

①重复抽样

②不重复抽样

5)统计量的标准误

样本统计量是用来推断对应总体参数的依据,推断的误差用什么特征值来度量呢?打个比方,用样本均值来估计总体均值,两者的接近程度如何度量?前面我们刚刚论证得出样本均值的数学期望等于总体均值,那么,反映各变量与其均值之间差异程度的指标标准差就可以达到这一目的了。

◎定义5.6:统计量的标准误(standard error)是指样本统计量的抽样分布的标准差,也称标准误差

以样本均值估计总体均值为例,所有可能的样本均值的标准差(均方差)即是样本均值的抽样标准误差,可测度所有样本均值的离散程度,也称标准误差(抽样平均误差)。(www.xing528.com)

在重复抽样条件下,n为样本容量,抽样平均误差为

6)估计标准误差

◎定义5.7:估计标准误差(standard error of estimation)是指当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误,也称估计标准误差。

如上例中,当总体标准差σ未知时,可用样本标准差s代替,则样本均值的估计标准误差为

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈