首页 理论教育 离散趋势指标及其重要性

离散趋势指标及其重要性

时间:2023-08-05 理论教育 版权反馈
【摘要】:离散趋势指标是用来说明观察值的离散程度或变异程度。例7.9现有甲、乙两组排球队员的身高测量结果如下:甲组:183 187 187 191 192乙组:179 184 188 193 196两组排球队员的平均身高都是188cm,但是甲组球员的身高比较集中,乙组球员的身高比较分散。因此,必须把集中趋势指标和离散趋势指标结合起来才能全面反映数据的分布特征。(三)方差为了克服极差和四分位数间距的缺点,需计算每个观察值x与总体均数μ之差,即xμ,称为离均差。

 离散趋势指标及其重要性

离散趋势指标是用来说明观察值的离散程度或变异程度。

例7.9 现有甲、乙两组排球队员的身高(cm)测量结果如下:

甲组:183 187 187 191 192

乙组:179 184 188 193 196

两组排球队员的平均身高都是188cm,但是甲组球员的身高比较集中,乙组球员的身高比较分散。因此,必须把集中趋势指标和离散趋势指标结合起来才能全面反映数据的分布特征。

(一)极差

亦称全距(简记为R),即一组观察值中最大值与最小值之差。极差越大,说明变异程度越大,数据分布比较分散;极差越小,说明变异程度越小,数据分布比较集中。全距只考虑了极大值和极小值,不能反映其他数据的变化情况。

如例7.9中,R=192-183=9(cm)

R=196-179=17(cm)

说明乙组球员身高的变异程度较大。

(二)四分位数间距

简记为Q,是上四分位数即第75百分位数(用QU表示)与下四分位数即第25百分位数(用QL表示)之差。计算公式是:

算得的Q值越大,变异程度越大,反之,变异度越小。但是四分位数间距仍然没有考虑到每一个观察值。

(三)方差

为了克服极差和四分位数间距的缺点,需计算每个观察值x与总体均数μ之差,即xμ,称为离均差。

由于离均差有正有负,Σ(x-μ)=0,无法反映变异程度的大小,因此用离均差平方和Σ(x-μ)2反映。但观察值的个数N也同样影响Σ(x-μ)2,所以为了消除这一影响可取均数,称为总体方差,用σ2表示。

但是在实际工作中,总体均数μ一般是未知的,只能用样本均数作为总体均数μ的估计值,用样本含量n代替N,根据数理统计证明,用样本资料这样算出的方差总是比实际σ2小,1908年英国统计学家W.S.Gosset提出用n-1代替n,因此样本方差的公式是:

式中,n-1称为自由度,一般用希腊字母υ表示。

(四)标准差

方差的度量单位是原观察值度量单位的平方。将方差开方后使其与原数据的度量单位相同,得到的就是标准差。

总体标准差用σ表示,计算公式是:

样本标准差用s表示,计算公式是:(www.xing528.com)

1.标准差的计算 标准差的计算根据样本量的大小有直接法和加权法两种方法。

(1)直接法:小样本资料可采用直接法,用公式7-14计算。

数学推导证明:,代入公式7-14,得出样本标准差的计算公式也可以写成:

例7.10 计算例7.9中甲、乙两组排球队员身高的标准差。

甲组代入公式7-15:

同理得s=6.82cm,从标准差的计算结果看出,两组中乙组的变异程度较大,甲组的变异程度较小。

(2)加权法:用于观察值较多时的频数表资料,计算公式为:

式中:x为各组段的组中值;f为相应的频数。

例7.11 试求例7.1中101例健康男子血清总胆固醇标准差。

本例观察值较多,可用加权法。由表7-2已知:Σf=101,Σfx=425.0,Σfx2=2 057.08,代入公式7-16,得出

2.标准差的应用

(1)表示观察值的变异程度(或离散程度):在两组(或几组)资料均数相近、度量单位相同的条件下,标准差大,表示观察值的变异度大,即各观察值离均数较远,均数的代表性较差;反之,表示各观察值多集中在均数周围,均数的代表性较好。

(2)结合均数描述正态分布的特征和估计医学正常值范围。

(3)结合样本含量n计算标准误,详见第三节。

(五)变异系数

变异系数是标准差与均数之比,简记为CV。计算公式是:

可用于比较计量单位不同或者均数相差悬殊的两组(或多组)资料的离散程度。

例7.12 某地10岁男生的平均体重为33.60kg,标准差为6.70kg;7岁男生的平均体重为23.30kg,标准差为2.56kg。试分析两个年龄段男生的体重变异程度。

由变异系数计算的结果可见,10岁男生体重的变异程度大于7岁男生。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈