离散趋势指标及其重要性

时间：2023-08-05 理论教育版权反馈

【摘要】：离散趋势指标是用来说明观察值的离散程度或变异程度。例7．9现有甲、乙两组排球队员的身高测量结果如下：甲组：183 187 187 191 192乙组：179 184 188 193 196两组排球队员的平均身高都是188cm，但是甲组球员的身高比较集中，乙组球员的身高比较分散。因此，必须把集中趋势指标和离散趋势指标结合起来才能全面反映数据的分布特征。（三）方差为了克服极差和四分位数间距的缺点，需计算每个观察值x与总体均数μ之差，即xμ，称为离均差。

离散趋势指标及其重要性

离散趋势指标是用来说明观察值的离散程度或变异程度。

例7．9　现有甲、乙两组排球队员的身高（cm）测量结果如下：

甲组：183 187 187 191 192

乙组：179 184 188 193 196

两组排球队员的平均身高都是188cm，但是甲组球员的身高比较集中，乙组球员的身高比较分散。因此，必须把集中趋势指标和离散趋势指标结合起来才能全面反映数据的分布特征。

（一）极差

亦称全距（简记为R），即一组观察值中最大值与最小值之差。极差越大，说明变异程度越大，数据分布比较分散；极差越小，说明变异程度越小，数据分布比较集中。全距只考虑了极大值和极小值，不能反映其他数据的变化情况。

如例7．9中，R甲＝192－183＝9（cm）

R乙＝196－179＝17（cm）

说明乙组球员身高的变异程度较大。

（二）四分位数间距

简记为Q，是上四分位数即第75百分位数（用QU表示）与下四分位数即第25百分位数（用QL表示）之差。计算公式是：

算得的Q值越大，变异程度越大，反之，变异度越小。但是四分位数间距仍然没有考虑到每一个观察值。

（三）方差

为了克服极差和四分位数间距的缺点，需计算每个观察值x与总体均数μ之差，即xμ，称为离均差。

由于离均差有正有负，Σ（x－μ）＝0，无法反映变异程度的大小，因此用离均差平方和Σ（x－μ）2反映。但观察值的个数N也同样影响Σ（x－μ）2，所以为了消除这一影响可取均数，称为总体方差，用σ2表示。

pagenumber_ebook=113,pagenumber_book=100

但是在实际工作中，总体均数μ一般是未知的，只能用样本均数 pagenumber_ebook=113,pagenumber_book=100 作为总体均数μ的估计值，用样本含量n代替N，根据数理统计证明，用样本资料这样算出的方差总是比实际σ2小，1908年英国统计学家W．S．Gosset提出用n－1代替n，因此样本方差的公式是：