首页 理论教育 使用描述性统计分析进行方差分析的步骤及双因素实验结果

使用描述性统计分析进行方差分析的步骤及双因素实验结果

时间:2023-05-24 理论教育 版权反馈
【摘要】:图9-11抽取样本的过程2.描述性统计分析在进行方差分析前,使用描述性统计分析,通过计算“峰度系数”和“偏度系数”的方法来实现。图9-15双因素方差分析结果

使用描述性统计分析进行方差分析的步骤及双因素实验结果

方差分析(ANOVA)用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,一是研究中施加的对结果形成影响的可控因素。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。在财经实践与研究中,应用Excel做方差分析也较为广泛。

9.2.2.1 单因素方差分析

单因素方差分析用于完全随机设计的多个样本间的比较,从而推断各样本所代表的总体均数是否完全相等。

【例9-4】 图9-9为某电商近半年的销售记录,包括交易来源、会员ID、交易时间、交易金额四个字段。为了了解会员营销现状,要通过销售数据对会员购买额单价(平均每位顾客购买商品的金额)和会员购买频率二者的相关性进行分析。其分析过程如下。

1.抽样

图9-9 电商销售记录(局部)

Step 1:在销售记录表里添加购买频次字段。在E2单元格输入公式“=COUNTIF($B$2:B2,B2)”,向下复制到最大数据行。

Step 2:根据频次,设置频次条件框,以高级筛选(其操作参见数据管理一章)的方式,将数据按频次分为1、2和3以上的三个数据表,分别将之命名为“首次购买”“二次购买”和“多次购买”(图9-10)。

图9-10 工作表拆分

Step 3:在工作簿中新建“单因素方差分析”工作表→点击【数据】/【数据分析】→在弹出的对话框中,选择【抽样】→单击【确定】。

Step 4:在弹出的【抽样】对话框中,【输入区域】选择“首次购买”工作表中的$A$1:$E$21919区域→勾选【标志】,【抽样方法】选择“随机”,【样本数】设置为5000,【输出区域】选择“单因素方差分析”表中的A1单元格→单击【确定】按钮

Step 5:重复如上的步骤,【输入区域】分别选择“二次购买”和“多次购买”的购买金额区域,【输出区域】分别选择“单因素方差分析”表中的B1和C1单元格,结果如图9-11所示。

图9-11 抽取样本的过程

2.描述性统计分析

在进行方差分析前,使用描述性统计分析,通过计算“峰度系数”和“偏度系数”的方法来实现。

Step 1:点击【数据】/【数据分析】→在弹出的对话框中,选择【描述性统计】→单击【确定】。

Step 2:在弹出的对话框里,【输入区域】选择“A1:C5001”单元格区域;【分组方式】选择“逐列”;勾选【标志位于第一列】;输出区域选择“新工作表组”;勾选【汇总统计】;勾选【平均数置信度】设为95%;勾选【第K大值】和【第K小值】均为1(图9-12①)。然后单击【确定】。这时在新工作表中展示三个层级的描述性统计结果(图9-12②)。

(www.xing528.com)

图9-12 描述性统计对话框及运算结果

根据统计学理论,当偏度系数接近于0、峰度系数接近于3时,可以认为样本数据服从正态分布。从描述性统计结果看,峰度系数与偏度系数均偏离较大,故三组数据均不服从正态分布。此时需要对样本数据进行重新抽样或数据转换,使之服从正态分布,以便后续的数据分析。

3.单因素方差分析

为了比较完全随机抽取的多个(一般总体个数大于3)样本间的均值,统计推断各样本所代表的总体均值是否相等,可用单因素方差分析。方差分析也是一种检验假设,它通过对全部数据的差异进行分解,将某因素下各组样本间可能存在的系统性误差和随机误差加以比较,从而推断出各总体间是否存在显著差异。接上例的资料,单因素方差分析的步骤如下。

Step 1:点击【数据】/【数据分析】→在弹出的对话框中,选择【单因素方差分析】→单击【确定】。

Step 2:设置有关参数。【输入区域】选择$A$1:$C$5001;【分组方式】选择“列”;勾选【标志值位于第一行】;【ɑ】值输入0.05;输出区域【选择新建工作表组】(图9-13①)。然后单击【确定】。这时在新工作表中展示方差分析的结果(图9-13②)。

图9-13 单因素方差分析对话框及运算结果

根据图9-13②所显示的分析结果,从样本的均值看,存在着显著的差异。P-Value接近于0小于0.05,故拒绝均值相等的原假设。也就是说,三组数据的均值存在明显的差异。购买次数对于购买的客单价的影响显著,二次及多次购买的会员客单价远高于一次购买的会员,这也证明了会员营销的重要性。

同时,多次购买的客单价相比二次购买有所下降,可能是因为多次购买的会员已经成为忠实客户,并形成特定的购买习惯和购买频率,他们不再一次性购买大量的商品。当然,还可以从购买频率、金额等角度作深度分析,探究对老会员的营销与客单价间的关系。

9.2.2.2 双因素方差分析

在财经分析中,常常一个结果受多个因素影响。如果研究两个因素对一个结果产生的影响,可以用【数据分析】/【双因素方差分析】工具。如果不能分解出二因素的交互作用,则用无重复的双因素方差分析;如果除了二因素对结果的影响之外,还可以进一步分析二因素的交互作用对结果的影响,则用重复的双因素方差分析。

【例9-5】 图9-14①为某电商2017年在重庆部分区各月销售A产品的情况。由于无法直观地判断该产品是否具有季节性和地区差异,故可以针对这两个可能对A产品销售额产生影响的因素进行双因素方差分析。其操作步骤如下。

图9-14 某电商在重庆部分区县的各月销售情况

Step 1:点击【数据】/【数据分析】→在弹出的对话框中,选择【方差分析:无重复的双因素分析】→单击【确定】(图9-14②)。

Step 2:设置有关参数。在弹出的【方差分析:无重复的双因素分析】对话框里,选择数据区域A1:M12;勾选【标志】,【ɑ】值设为0.05;【输出区域】设置为【新工作表组】(图9-14③)→单击【确定】按钮,生成方差分析结果(图9-15)。

双因素方差分析的原假设为行因素与列因素都没有显著性差异。从输出的结果看,行差异概率与列差异概率【P-Value】均小于设定的置信水平0.05,所以应该拒绝原假设。认为季节因素和地域因素均对A产品的销售产生显著性影响。

图9-15 双因素方差分析结果

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈