- 2021-05-12 发布 |
- 37.5 KB |
- 40页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2020届二轮复习相关性最小二乘估计统计案例课件(40张)(全国通用)
知 识 梳 理 1. 变量间的相关关系 (1) 常见的两变量之间的关系有两类:一类是函数关系,另一类是 ___________ ;与函数关系不同, ___________ 是一种非确定性关系 . (2) 从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为 ______ ,点散布在左上角到右下角的区域内,两个变量的相关关系为 ______ . 相关关系 相关关系 正相关 负相关 2. 回归分析 对具有 __________ 的两个变量进行统计分析的方法叫回归分析 . 其基本步骤是: ( ⅰ ) 画散点图; ( ⅱ ) 求 _____________ ; ( ⅲ ) 用回归直线方程作预报 . (1) 回归直线:如果散点图中点的分布从整体上看大致在 _________ 附近,就称这两个变量之间具有线性相关关系,这条直线叫作回归直线 . 相关关系 回归直线方程 一条直线 中心 (3) 相关系数 当 r > 0 时,表明两个变量 ; 当 r < 0 时,表明两个变量 . r 的绝对值越接近于 1 ,表明两个变量的线性相关性 . r 的绝对值越接近于 0 ,表明两个变量之间几乎不存在线性相关关系.通常 | r | 大于 0.75 时,认为两个变量有很强的线性相关性. 正相关 负相关 越强 B A B 1 B 2 总计 A 1 a b a + b A 2 c d c + d 总计 a + c b + d a + b + c + d a + b + c + d 有关联 [ 微点提醒 ] 基 础 自 测 1. 判断下列结论正误 ( 在括号内打 “√” 或 “×” ) (1) “ 名师出高徒 ” 可以解释为教师的教学水平与学生的水平成正相关关系 .( ) (3) 因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验 .( ) (4) 事件 X , Y 关系越密切,则由观测数据计算得到的 χ 2 值越大 .( ) 答案 (1) √ (2) √ (3) × (4) √ 2. ( 选修 1 - 2P21 问题提出 改编 ) 为调查中学生近视情况,测得某校男生 150 名中有 80 名近视,在 140 名女生中有 70 名近视 . 在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力 ( ) A. 回归分析 B. 均值与方差 C. 独立性检验 D. 概率 解析 “ 近视 ” 与 “ 性别 ” 是两类变量,其是否有关,应用独立性检验判断 . 答案 C 3. ( 选修 1 - 2P7 讲解改编 ) 两个变量 y 与 x 的回归模型中,分别选择了 4 个不同模型,它们的相关 系 数 r 如下,其中拟合效果最好的模型是 ( ) A. 模型 1 的相关 系 数 r 为 0.98 B. 模型 2 的相关 系 数 r 为 0.80 C. 模型 3 的相关 系 数 r 为 0.50 D. 模型 4 的相关 系 数 r 为 0.25 解析 在两个变量 y 与 x 的回归模型中,它们的相关 系 数 r 越近于 1 ,模拟效果越好,在四个选项中 A 的相关 系 数最大,所以拟合效果最好的是模型 1. 答案 A 4. (2019· 焦作模拟 ) 已知变量 x 和 y 的统计数据如下表: x 3 4 5 6 7 y 2.5 3 4 4.5 6 答案 C 5. (2015· 全国 Ⅱ 卷 ) 根据下面给出的 2004 年至 2013 年我国二氧化硫年排放量 ( 单位:万吨 ) 柱形图,以下结论不正确的是 ( ) A. 逐年比较, 2008 年减少二氧化硫排放量的效果最显著 B.2007 年我国治理二氧化硫排放显现成效 C.2006 年以来我国二氧化硫年排放量呈减少趋势 D.2006 年以来我国二氧化硫年排放量与年份正相关 解析 对于 A 选项,由图知从 2007 年到 2008 年二氧化硫排放量下降得最多,故 A 正确 . 对于 B 选项,由图知,由 2006 年到 2007 年矩形高度明显下降,因此 B 正确 . 对于 C 选项,由图知从 2006 年以后除 2011 年稍有上升外,其余年份都是逐年下降的,所以 C 正确 . 由图知 2006 年以来我国二氧化硫年排放量与年份负相关, D 不正确 . 答案 D 6. (2019· 丹东教学质量监测 ) 某校为了研究学生的性别和对待某一活动的态度 ( 支持与不支持 ) 的关系,运用 2 × 2 列联表进行独立性检验,经计算 χ 2 = 6.705 ,则所得到的统计学结论是:有 ________ 的把握认为 “ 学生性别与支持该活动有关系 ” ( ) A.99% B.95% C.1% D.5% 解析 因为 6.705>6.635 ,因此有 99% 的把握认为 “ 学生性别与支持该活动有关系 ” ,故选 A. 答案 A 考点一 相关关系的判断 【例 1 】 (1) 观察下列各图形, 其中两个变量 x , y 具有相关关系的图是 ( ) A. ①② B. ①④ C. ③④ D. ②③ (2) 甲、乙、丙、丁四位同学各自对 A , B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数 r 与残差平方和 m 如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则哪位同学的试验结果体现 A , B 两变量有更强的线性相关性 ( ) A. 甲 B. 乙 C. 丙 D. 丁 解析 (1) 由散点图知 ③ 中的点都分布在一条直线附近 . ④ 中的点都分布在一条曲线附近,所以 ③④ 中的两个变量具有相关关系 . (2) 在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于 1 ,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了 A , B 两变量有更强的线性相关性 . 答案 (1)C (2)D 【训练 1 】 (1) 已知变量 x 和 y 满足关系 y =- 0.1 x + 1 ,变量 y 与 z 正相关 . 下列结论中正确的是 ( ) A. x 与 y 正相关, x 与 z 负相关 B. x 与 y 正相关, x 与 z 正相关 C. x 与 y 负相关, x 与 z 负相关 D. x 与 y 负相关, x 与 z 正相关 (2) x 和 y 的散点图如图所示,则下列说法中所有正确命题的序号为 ________. 解析 (1) 由 y =- 0.1 x + 1 ,知 x 与 y 负相关,即 y 随 x 的增大而减小,又 y 与 z 正相关,所以 z 随 y 的增大而增大,减小而减小,所以 z 随 x 的增大而减小, x 与 z 负相关 . 答案 (1)C (2) ①② 考点二 线性回归方程及应用 【例 2 】 (2018· 西安 调研 ) 某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款 ( 年底余额 ) ,如下表 1 : 年份 x 2013 2014 2015 2016 2017 储蓄存款 y ( 千亿元 ) 5 6 7 8 10 表 1 为了研究计算的方便,工作人员将上表的数据进行了处理, t = x - 2 012 , z = y - 5 得到下表 2 : 时间代号 t 1 2 3 4 5 z 0 1 2 3 5 表 2 (1) 求 z 关于 t 的线性回归方程; (2) 通过 (1) 中的方程,求出 y 关于 x 的回归方程; (3) 用所求回归方程预测到 2022 年年底,该地储蓄存款额可达多少? 所以预测到 2022 年年底,该地储蓄存款额可达 15.6 千亿元 . 【训练 2 】 (2018· 全国 Ⅱ 卷 ) 如图是某地区 2000 年至 2016 年环境基础设施投资额 y ( 单位:亿元 ) 的折线图 . (2) 利用模型 ② 得到的预测值更可靠 . 理由如下: ( ⅰ ) 从折线图可以看出, 2000 年至 2016 年的数据对应的点没有随机散布在直线 y =- 30.4 + 13.5 t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型 ① 不能很好地描述环境基础设施投资额的趋势 .2010 年相对 2009 年的环境基础设施投资额有明显增加, 2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势, ( ⅱ ) 从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型 ① 得到的预测值 226.1 亿元的增幅明显偏低,而利用模型 ② 得到的预测值的增幅比较合理,说明利用模型 ② 得到的预测值更可靠 . 以上给出了 2 种理由,考生答出其中任意一种或其他合理理由均可得分 . 考点三 独立性检验 【例 3 】 (2019· 湖南长沙雅礼中学、河南省实验中学联考 ) 环境问题是当今世界共同关注的问题,我国环保总局根据空气污染指数 PM2.5 浓度,制定了空气质量标准: 空气污染指数 (0 , 50] (50 , 100] (100 , 150] (150 , 200] (200 , 300] (300 ,+ ∞ ) 空气质量等级 优 良 轻度污染 中度污染 重度污染 严重污染 某市政府为了打造美丽城市,节能减排,从 2010 年开始考察了连续六年 11 月份的空气污染指数,绘制了频率分布直方图,经过分析研究,决定从 2016 年 11 月 1 日起在空气质量重度污染和严重污染的日子对机动车辆限号出行,即车牌尾号为单号的车辆单号出行,车牌尾号为双号的车辆双号出行 ( 尾号是字母的,前 13 个视为单号,后 13 个视为双号 ). 王先生有一辆车,若 11 月份被限行的概率为 0.05. (1) 求频率分布直方图中 m 的值; (2) 若按分层抽样的方法,从空气质量良好与中度污染的天气中抽取 6 天,再从这 6 天中随机抽取 2 天,求至少有一天空气质量是中度污染的概率; (3) 该市环保局为了调查汽车尾气排放对空气质量的影响,对限行两年来的 11 月份共 60 天的空气质量进行统计,其结果如下表: 空气质量 优 良 轻度污染 中度污染 重度污染 严重污染 天数 11 27 11 7 3 1 根据限行前 6 年 180 天与限行后 60 天的数据,计算并填写 2 × 2 列联表,并回答是否有 90% 的把握认为空气质量的优良与汽车尾气的排放有关 . 空气质量优、良 空气质量污染 总计 限行前 限行后 总计 解 (1) 因为限行分单双号,王先生的车被限行的概率为 0.05 , 所以空气重度污染和严重污染的概率应为 0.05 × 2 = 0.1 , 由频率分布直方图可知 (0.004 + 0.006 + 0.005 + m ) × 50 + 0.1 = 1 ,解得 m = 0.003. (2) 因为空气质量良好与中度污染的天气的概率之比为 0.3 ∶ 0.15 = 2 ∶ 1 , 按分层抽样的方法从中抽取 6 天,则空气质量良好的天气被抽取的有 4 天,记作 A 1 , A 2 , A 3 , A 4 ,空气中度污染的天气被抽取的有 2 天,记作 B 1 , B 2 , 记事件 A 为 “ 至少有一天空气质量是中度污染 ” ,则事件 A 所包含的事件有 ( A 1 , B 1 ) , ( A 1 , B 2 ) , ( A 2 , B 1 ) , ( A 2 , B 2 ) , ( A 3 , B 1 ) , ( A 3 , B 2 ) , ( A 4 , B 1 ) , ( A 4 , B 2 ) , ( B 1 , B 2 ) ,共 9 个, 从这 6 天中随机抽取 2 天,所包含的基本事件有 ( A 1 , A 2 ) , ( A 1 , A 3 ) , ( A 1 , A 4 ) , ( A 1 , B 1 ) , ( A 1 , B 2 ) , ( A 2 , A 3 ) , ( A 2 , A 4 ) , ( A 2 , B 1 ) , ( A 2 , B 2 ) , ( A 3 , A 4 ) , ( A 3 , B 1 ) , ( A 3 , B 2 ) , ( A 4 , B 1 ) , ( A 4 , B 2 ) , ( B 1 , B 2 ) ,共 15 个, (3)2 × 2 列联表如下: 空气质量优、良 空气质量污染 总计 限行前 90 90 180 限行后 38 22 60 总计 128 112 240 所以有 90% 的把握认为空气质量的优良与汽车尾气的排放有关 . 【训练 3 】 为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取 50 名学生,得到如下 2 × 2 列联表: 理科 文科 男 13 10 女 7 20 解析 χ 2 ≈ 4.844>3.841 , 则有 95% 的把握认为 是否选修文科与性别之间有关系 . 答案 9 5%查看更多