首页 理论教育 绘制直方图:科学研究原理,实验的多少与结果呈现数量成正比

绘制直方图:科学研究原理,实验的多少与结果呈现数量成正比

时间:2023-07-29 理论教育 版权反馈
【摘要】:事物的多少取决于实验,一般来说,直方图呈现的是一个特定的类别或者范围内中结果的数量。当数据值有清晰的分类时,就可以根据类别绘制直方图了。类别和区间在直方图中有时称为集合单元。在绘制连续数据的直方图时,科学家对集合单元的选择取决于实验的特征和需要回答的问题。表6.10居民冲洗坐便器数据要绘制这份数据的直方图,我们首先需要确定分类的集合单元。绘制的直方图是什么样子?

绘制直方图:科学研究原理,实验的多少与结果呈现数量成正比

直方图是用来回答“多少”的问题的。事物的多少取决于实验,一般来说,直方图呈现的是一个特定的类别或者范围内中结果的数量(如丽莎的木桩例子中木桩的数量)。

当数据值有清晰的分类时,就可以根据类别绘制直方图了。例如,丽莎的木桩长度总是7,7,7,8,8,8或9,我们用这些长度给她的木桩进行分类。这种数据叫做非连续数据。而当数据值可以取区间内的任何值时,这种数据叫做连续数据。类别和区间在直方图中有时称为集合单元。在绘制连续数据的直方图时,科学家对集合单元的选择取决于实验的特征和需要回答的问题。

关于取值范围、均值、中位数和众数的解释

在先前部分,我们已经稍稍谈论了均值、众数和取值范围。中位数(median)是科学家用来描述数据集的一种方式。在用直方图表示数据集时,科学家常常会提到数据的取值范围、均值、众数和中位数。

取值范围(range)

又称值域,被计数或测量的变量的范围,是由变量的最高值和最低值来决定,包括区间内的所有数字。[1]

均值(mean)

当科学家讨论数据集中变量的均值,指的是那个变量所有值的平均数,不管变量是计数的还是测量。均值是平均数(average)的另一种说法。

中位数(median)

当科学家们讨论变量的中位数时,他们指的是一串有序的值的中间值。例如,x的一串取值是“1、2、3、3、4、5、5、5、6、6、6、6、8、8、10”,那么中位数是5。这是因为在这串数中有15项,5是第8项。如果一串数有偶数项,中位数是中间两个值的平均数。计数或测量的变量有一个中位数。(www.xing528.com)

众数(mode)

当科学家们讨论数据集中的众数时,他们指的是变量出现率最高的值。上面一串数的众数是6。[2]

让我们回到渗漏水管的实验。我们让房子里的居民记录他们冲洗坐便器的时间。我们得到的数据如表6.10。

表6.10 居民冲洗坐便器数据

要绘制这份数据的直方图,我们首先需要确定分类的集合单元(这组数据并不是连续的,因为房子里的居民记录他们冲洗坐便器,没有精确到秒或二分之一秒,如果我们每一秒画一个集合单元,我们要用很多纸)。对于这份数据,最简单的集合单元选择是小时。

绘制的直方图是什么样子?(见图6.20)

图6.20 表6.10中数据的直方图

从数据集我们能判断众数(即冲洗坐便器最普遍的时间)是7:00—8:00。我们还能看到,冲洗集中发生在7:00—11:00,白天和晚上有些时间段没有冲洗(这些时间最适宜修复水管漏孔)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈