首页 理论教育 变量描述统计和检验分析

变量描述统计和检验分析

时间:2023-11-20 理论教育 版权反馈
【摘要】:描述性统计分析的思路和技术方法。描述性统计是以揭示数据分布特性的方式汇总并表达定量数据的方法。常见的描述性统计适用于能够收集到定量数据的所有领域。计算的统计量包括检验统计量、自由度、双侧近似概率。表4.1各变量的描述性统计和皮尔森相关系数分析续表注:**表示在0.001 水平上显著相关,*表示在0.05 水平上显著相关。表4.2返迁移民与适应移民差异显著性检验汇总表续表

变量描述统计和检验分析

为了全面深入地把握外迁移民社会适应性问题的整体情况,首先对采集的数据进行描述性统计分析和相应的检验,通过数据的统计分析,我们在进行数学模型推理研究之前对适应性移民和返迁移民的基本情况和两者的差异性有了一个定性的倾向性的了解和把握,对进一步的推理研究有了较为全面的认识,对准确地把握、解读和诠释数学模型的推理结论与外迁移民的客观实际相符合奠定了前提条件和基础。在数据采集的过程中,为了把握外迁移民社会适应性的普遍性规律,从采集样本类型的设计上看,设计了具有对比性的“适应性移民”和“返迁移民”两大类型的样本数据,本描述性统计分析就按照这两大类型进行对比分析,可以更加清晰地把握两类移民安置效果产生的原因或者影响因素的共性。

描述性统计分析的思路和技术方法。描述性统计是以揭示数据分布特性的方式汇总并表达定量数据的方法。其主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据分布以及一些基本统计图形。

常见的描述性统计方法可分为三类:用数据的统计量来描述,如均值、标准差等;用图示技术来描述,如直方图、散布图、趋势图、排列图、条形图和饼状图等;用文字语言分析和描述,如统计分析表、分层、因果图、亲和图和流程图等。

常见的描述性统计适用于能够收集到定量数据的所有领域。它能提供有关产品、过程或质量管理体系的信息,也可用于管理。

数据的检验。定类与定序变量均进行频数统计,包括频数(Frequency)、百分比(Percent)、有效百分比(Valid Percent)、累积百分比(Cumulative Percent)。以移民类型为控制变量,全部按返迁移民和适应移民进行分别统计;凡包含返迁移民与适应移民的数据均进行卡方检验,以推断返迁移民与适应移民之间是否存在显著差异。其一,2×2 列联表给出五种检验方法,依次为皮尔森卡方检验(Pearson Chi-Square)、似然比卡方检验(Likelihood Ratio)、费希尔精确概率检验(Fisher’s Exact Test)、有效记录数检验(N of Valid Cases)。计算的统计量包括检验统计量(Value)、自由度(df)、双侧近似概率[Asymp.Sig.(2-Sided)]、双侧精确概率[Exact Sig. (2-Sided)]、单侧精确概率[Exact Sig. (1-Sided)]。其二,对其他类型列联表可能给出五种检验方法,依次为皮尔森卡方检验、连续性校正卡方检验(Continuity Correction)、似然比卡方检验、线性相关卡方检验(Linear-by-Linear Association)、有效记录数检验。计算的统计量包括检验统计量、自由度、双侧近似概率。对检验方法选择的一般准则为:

n≥40 且T≥5,用皮尔森卡方检验;

n≥40 且1≤T<5,用连续性校正卡方检验或似然比卡方检验;

n<40 或T<1,用费希尔精确概率检验。

本调查数据样本量983,远大于40,因此若理论频数不小于5,看皮尔森卡方检验的P 值(双尾);若理论频数存在小于5 的,看似然比卡方或连续校正卡方的P 值(双尾);若理论频数小于1,看费希尔精确概率检验。

计算描述性统计中变量的均值和标准差,计算皮尔森相关系数(Pearson Correlation Coefficient),对所有的变量进行了相关分析,其分析结果为部分研究假设提供了初步支持。具体的研究分析结果见表4.1。

表4.1 各变量的描述性统计和皮尔森相关系数分析(N=983)(www.xing528.com)

续表

注:**表示在0.001 水平上显著相关(双尾检验),*表示在0.05 水平上显著相关(双尾检验)。

自变量因变量安置方式、政策扶持情况、政策落实情况、是否愿意搬迁、生活条件、社会关系、家庭经济收入、耕地质量、农业灌溉设施、语言差距等显著相关,其中移民样本类型与安置方式、政策扶持情况、政策落实情况和耕地质量等四个自变量之间的相关系数大于0.7,除与农业灌溉设施和语言差距等两个自变量在0.05 水平上显著相关(双尾检验)外,其余都在0.001 水平上显著相关(双尾检验),说明因变量与自变量之间存在高相关性。

②自变量中的安置方式与生活条件、安置方式与社会关系、政策扶持情况与生活条件、政策扶持情况与家庭经济收入、政策落实情况与家庭经济收入、政策落实情况与耕地质量和农业灌溉设施、家庭经济收入与耕地质量、生活条件与政策落实情况存在低等或中等程度的相关性,其余自变量之间都不存在相关性,见表4.2。

表4.2 返迁移民与适应移民差异显著性检验汇总表

续表

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈