首页 理论教育 如何利用散布图判断变量之间的相关性?

如何利用散布图判断变量之间的相关性?

时间:2023-05-23 理论教育 版权反馈
【摘要】:散布图又叫相关图,它是使用收集到的资料将两个可能相关的变量数据用点画在坐标图上,表示一组成对的数据之间是否有相关性。如果需要了解它,就可借助散布图统计手法来判断它们之间的相关关系。散布图是于1750~1800年间开始使用的,因为它有X、Y轴,所以又称为X-Y plot。图3-16散布图相关示意正相关:当原因变量X值上升时,结果变量Y值相应增加。

如何利用散布图判断变量之间的相关性?

散布图又叫相关图,它是使用收集到的资料将两个可能相关的变量数据用点画在坐标图上,表示一组成对的数据之间是否有相关性。这种成对的数据或许是特性—原因、特性—特性、原因—原因的关系。通过对其观察分析,来判断两个变量之间的相关关系,散布图的使用使人们能大概掌握原因与结果之间是否有相关及相关程度如何。

当相关关系虽然存在,但难以用精确的公式或函数关系表示时,在这种情况下用散布图来分析就非常有效。假定有一对变量x和y,x表示某一种影响因素,y表示某一质量特征值,通过实验或调查收集到的x和y的数据可以在坐标图上用点表示出来,根据点的分布特点就可以判断x和y的相关情况。

现实中的许多现象和原因常常相互之间存在着联系,它们之间有些呈规则的关联,有些则呈不规则的关联。如果需要了解它,就可借助散布图统计手法来判断它们之间的相关关系。

散布图是于1750~1800年间开始使用的,因为它有X、Y轴,所以又称为X-Y plot。散布图包括水平(X)和垂直(Y)两个轴,用以代表成对的两变量。如果两变量有原因与结果的关系,则通常将原因(或称自变量)放在X轴,而将结果(应变量)放在Y轴。

从散布图可以观察出变量X与Y之间呈现怎样的关系(散布图的方向和强度)。

数据图案方向可能是正向、负向和无相关,如图3-16所示。

图3-16 散布图相关示意

正相关:当原因变量X值上升时,结果变量Y值相应增加。如图3-16(a)所示为向上倾斜的点的椭圆

负相关:当原因变量X值上升时,结果变量Y值会下降。如图3-16(b)所示为向下倾斜的点的椭圆。(www.xing528.com)

无相关:Y值与X值之间没有关系可循。也就是如图3-16(c)所示未能显示出向上或向下倾斜的图案。

当两变量相关时,无论是正相关还是负相关都可用强度来说明。点聚集得越像直线其相关关系越强。0.8<r<1高度相关;0.5<r<0.8中度相关;r<0.5低度相关。

1.散布图的用途

使用散布图的一个重要作用是当作业现场所发生的问题相当复杂时,常常会出现没有头绪,不知问题所在,甚至不知有哪些因素相互关联的情况,因此需要在导致问题的原因与结果之间找出其相关性,通过此种途径来了解问题发生的原因。

①确认变量类型之间是否存在因果关系的推测。

②显示关系的方向(正向、负向等)。

③显示关系的强度。

2.制作散布图的步骤

先利用柏拉图找出影响质量特性的因素,其次决定可能相关的对应因素,作为散布图X轴与Y轴代表的变量。然后搜集一组有关员工、作业流程或产品的二维数据,建成一个数据汇总表。画一个标有水平和垂直轴的图。通常原因变量为X轴,结果变量为Y轴。数值垂直方向向上增加,水平方向向右增加。X轴和Y轴上的比例应能表示出表中的最大值和最小值。

在相应的X、Y交叉点上画出数据对。对所获得的资料进行分析整理,以便了解控制情况或采取必要措施。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈