首页 理论教育 变量相关关系统计案例分析

变量相关关系统计案例分析

时间:2023-08-08 理论教育 版权反馈
【摘要】:考点一两个变量间的相关关系【例1】解析①中,回归方程中x的系数为正,不是负相关;④方程中的x的系数为负,不是正相关,故①④一定不正确.答案D【训练1】解析由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点整体呈递增趋势,u与v正相关.答案C考点二线性回归方程及其应用考点三独立性检验【例3】解析由7.8>6.635知,有1-0.010即99%以上的把握认为“爱好该

变量相关关系统计案例分析

考点一 两个变量间的相关关系

【例1】解析 ①中,回归方程中x的系数为正,不是负相关;④方程中的x的系数为负,不是正相关,故①④一定不正确.

答案 D

【训练1】解析 由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点整体呈递增趋势,u与v正相关.

答案 C

考点二 线性回归方程及其应用

考点三 独立性检验

【例3】解析 由7.8>6.635知,有1-0.010即99%以上的把握认为“爱好该项运动与性别有关”.

答案 A

【训练3】解 (1)2×2列联表如下:

所以有99%的把握认为其亲属的饮食习惯与年龄有关.

方法优化——求回归直线方程的方法技巧

【典例】解析 [优美解法](1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,先将数据处理如下:

(2)利用所求得的直线方程,可预测2012年的粮食需求量为6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(万吨).

【自主体验】解析 数据处理如下:

基础过关题

答案 C

5.解析 因为K2=7.069>6.635,所以P(K2>6.635)=0.010,所以说有99%的把握认为“学生性别与支持该活动有关系”.

答案 C

二、填空题

6.解析 因为散点图能直观地反映两个变量是否具有相关关系,所以画出散点图如图所示:

通过观察图像可知,变量x与变量y是正相关.

答案 正

7.解析 回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.

答案 0.15

8.解析 因K2≈4.844,根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.

答案 5%

三、解答题

9.解析 (1)

(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).

能力提高题

一、选择题

1.解析 ①是系统抽样;对于④,随机变量K2的观测值k越小,说明两个相关变量有关系的把握程度越小.

答案 D(www.xing528.com)

2.解析 对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,所以选C.

答案 C

二、填空题

答案 68

三、解答题

4.解析 (1)由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25,

“非体育迷”人数为75,从而2×2列联表如下:

将2×2列联表的数据代入公式计算:

因为2.706<3.030<3.841,所以有90%的把握认为“体育迷”与性别有关.

直通高考

1.B 2.A 3.A 4.分层抽样 5.B 6.C 7.0.98 8.C 9.A

10.解析 (1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数

(2)利用模型②得到的预测值更可靠.

理由如下:

(i)从折线图可以看出,2000—2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000—2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010—2016年的数据对应的点位于一条直线的附近,这说明从2010年开始,环境基础设施投资额的变化规律呈线性增长趋势,利用2010—2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.

(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.

13.解析 (1)第二种生产方式效率更高.

理由如下:

(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.

(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.

(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.

(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.

以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.

(2)由茎叶图知.

列联表如下:

(3)由于,所以有99%的把握认为两种生产方式的效率有差异.

所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.

16.解析(1)由已知得0.70=a+0.20+0.15,故a=0.35.

b=1-0.05-0.15-0.70=0.10.

(2)甲离子残留百分比的平均值的估计值为

2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.

乙离子残留百分比的平均值的估计值为

3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈