- 2021-04-15 发布 |
- 37.5 KB |
- 26页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2021版高考数学一轮复习第十章统计与统计案例10-3变量的相关性与统计案例课件新人教B版
第三节 变量的相关性与统计案例 内容索引 必备知识 · 自主学习 核心考点 · 精准研析 核心素养 · 微专题 核心素养测评 【教材 · 知识梳理】 1. 变量间的相关关系 (1) 常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系; 与函数关系不同,相关关系是一种 _____________ 关系 . (2) 从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相 关关系称为 ___________ ,点散布在从左上角到右下角的区域内,两个变量的相 关关系为 ___________. 非确定性 正相关 负相关 2. 两个变量的线性相关 (1) 从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的 _____________ 附近,称两个变量之间具有 _________________ ,这条直线叫做 回归直线 . (2) 回归方程为 =bx+a ,其中 (3) 通过求 Q= 的最小值而得到回归直线的方法,即使得样本数 据的点到回归直线的距离的离差平方和最小,这一方法叫做最小二乘法 . 一条直线 线性相关关系 (4) 相关系数: 当 r>0 时,表明两个变量 ___________ ;当 r<0 时,表明两个变量 ___________. r 的绝对值越接近于 1 ,表明两个变量的线性相关性 _________ ; r 的绝对值越接 近于 0 ,表明两个变量之间 ___________________________. 3. 独立性检验 (1)2×2 列联表:假设有两个分类变量 X 和 Y ,它们的值域分别为 {x 1 , x 2 } 和 {y 1 , y 2 } ,其样本频数列联表 ( 称 2×2 列联表 ) 为: 正相关 负相关 越强 几乎不存在线性相关关系 y 1 y 2 合计 x 1 n 11 n 12 n 1+ x 2 n 21 n 22 n 2+ 合计 n +1 n +2 n (2)χ 2 统计量 χ 2 = ( 其中 n=n 11 +n 12 +n 21 +n 22 为样本容量 ). 【常用结论】 1. 函数关系与相关关系的区别与联系 (1) 区别: ① 函数关系是一种确定性关系,相关关系是一种非确定性关系 . ② 函数关系是一种因果关系,相关关系不一定是一种因果关系,也可能是伴随关系 . (2) 联系:对于线性相关关系,求出线性回归方程后,可以通过确定的函数关系进行两个变量取值的预测 . 2. 回归直线及其方程的性质 (1) 回归直线不一定过样本点,但是一定过样本中心点 ( ). (2) 在回归直线方程 =bx+a 中, >0 时,两个变量呈正相关关系; <0 时,两个变量呈负相关关系 . 【知识点辨析】 ( 正确的打“ √”, 错误的打“ ×”) (1)“ 名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系 . ( ) (2) 散点图是判断两个变量是否相关的一种重要方法和手段 . ( ) (3) 通过回归直线方程 可以估计预报变量的取值和变化趋势 .( ) (4) 回归直线方程 至少经过点 (x 1 ,y 1 ),(x 2 ,y 2 ), … ,(x n ,y n ) 中的一个点 . ( ) (5) 因为由任何一组观测值都可以求得一个线性回归方程 , 所以没有必要进行相关性检验 . ( ) (6) 事件 X , Y 关系越密切,则由数据计算得到的 χ 2 的值越大 . ( ) 提示 : (1)√. 名师出高徒显示的是正相关关系 . (2)√. 散点图可以直观反映是否相关 . (3)√. 由回归直线方程的意义可知其正确 . (4)×. 回归直线可能不经过任意一个数据点 . (5)×. 由任何一组观测值都可以求得一个线性回归方程 , 但可能没有任何意义 . (6)√. χ 2 的值越大,有关的可能性越大 . 【易错点索引】 序号 易错警示 典题索引 1 相关系数 r 与相关性强弱的关系 考点一、 T2 , 3 2 χ 2 的值越大,相关的可能性越大 . 考点二、典例 3 先由散点图、相关系数确定相关性,再计算回归方程,预测才有意义 考点三、角度 2 【教材 · 基础自测】 1. ( 必修 3P74 例 1 改编 ) 某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析 , 所得数据如表 : x 6 8 10 12 y 2 3 5 6 则 y 对 x 的线性回归直线方程为 ( ) A. =2.3x-0.7 B. =2.3x+0.7 C. =0.7x-2.3 D. =0.7x+2.3 【解析】 选 C. 易求 =9, =4, 样本点的中心 (9,4) 代入验证 , 满足 =0.7x-2.3. 2.( 选修 2-3P86 例 2 改编 ) 两个变量 y 与 x 的回归模型中,分别选择了 4 个不同模型, 它们的相关系数 r 如下,其中拟合效果最好的模型是 ( ) A. 模型 1 的相关系数 r 为 0.98 B. 模型 2 的相关系数 r 为 0.80 C. 模型 3 的相关系数 r 为 0.50 D. 模型 4 的相关系数 r 为 0.25 【解析】 选 A. 在两个变量 y 与 x 的回归模型中,它们的相关系数 r 越接近于 1 , 拟合效果越好,在四个选项中 A 的相关系数最大,所以拟合效果最好的是模型 1. 3.( 必修 3P76 例 2 改编 ) 设某大学的女生体重 y( 单位 :kg) 与身高 x( 单位 :cm) 具有 线性相关关系 , 根据一组样本数据 (x i ,y i )(i=1,2, … ,n), 用最小二乘法建立的回 归方程为 =0.85x-85.71, 则下列结论中不正确的是 ( ) A.y 与 x 具有正的线性相关关系 B. 回归直线过样本点的中心 ( , ) C. 若该大学某女生身高增加 1 cm, 则其体重约增加 0.85 kg D. 若该大学某女生身高为 170 cm, 则可断定其体重必为 58.79 kg 【解析】 选 D. 由于线性回归方程中 x 的系数为 0.85, 因此 y 与 x 具有正的线性相关 关系 , 故 A 正确 ; 又线性回归方程必过样本点的中心 ( , ), 故 B 正确 ; 由线性回 归方程中系数的意义知 ,x 每增加 1 cm, 其体重约增加 0.85 kg, 故 C 正确 ; 当某女生 的身高为 170 cm 时 , 其体重估计值是 58.79 kg, 而不是具体值 , 故 D 不正确 . 4.( 选修 2-3P81 习题 3-1AT1 改编 ) 为了判断高中三年级学生是否选修文科与性别的关系 , 现随机抽取 50 名学生 , 得到如下 2×2 列联表 : 理科 文科 男 13 10 女 7 20 已知 P(χ 2 ≥3.841)≈0.05. 根据表中数据,得到 χ 2 = ≈4.844. 则认为选修文科与性别有关系出错的可能性为 _________. 【解析】 χ 2 ≈4.844 ,这表明小概率事件发生 . 根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为 5%. 答案: 5% 核心素养 数据分析 —— 线性回归方程应用中的数据分析能力 【素养诠释】 在现实生活中有许多问题应当先做调查研究 , 收集数据 , 通过分析作出判断 , 体会数据中蕴涵的信息 ; 对于同样的数据可以有多种分析的方法 , 需要根据问题的背景选择合适的方法 ; 通过数据分析体验随机性 , 一方面 , 对于同样的事情每次收集到的数据可能不同 ; 另一方面 , 只要有足够的数据就可能从中发现规律 . 数据分析是统计的核心 . 【典例】 某电视厂家准备在五一举行促销活动 , 现在根据近七年的广告费与销售量的数据确定此次广告费支出 . 广告费支出 x( 万元 ) 和销售量 y( 万台 ) 的数据如下 : 年份 2012 2013 2014 2015 2016 2017 2018 广告 费支 出 x 1 2 4 6 11 13 19 销售 量 y 1.9 3.2 4.0 4.4 5.2 5.3 5.4 (1) 若用线性回归模型拟合 y 与 x 的关系 , 求出 y 关于 x 的线性回归方程 ( 其中 x i y i =279.4; ) (2) 若用模型 y=c+d 拟合 y 与 x 的关系 , 可得回归方程 =1.63+0.99 , 经计算线性回归模型和该模型的相关系数 r 分别约为 0.75 和 0.88 ,请用 r 说 明选择哪个回归模型更好 . (3) 已知利润 z 与 x,y 的关系为 z=200y-x. 根据 (2) 的结果回答 : 当广告费 x=20 时 , 销售量及利润的预测值是多少 ?( 精确到 0.01) 参考数据 : ≈2.236. 【素养立意】 将数据代入相关公式计算,运用获得的结果结合相关系数的意义进行解释,通过回归方程进行预测 . 【解析】 (1) 由题意有 =8, =4.2, x i y i =279.4, =708, 所以 =0.17, 所以 y 关于 x 的线性回归方程为 =0.17x+2.84; (2) r 越接近于 1, 模型的拟合效果越好 , 故选用 =1.63+0.99 更好 ; (3) 广告费 x=20 时 , 销售量预测值为 =1.63+0.99 ≈6.057≈6.06( 万台 ), 故利润的预测值为查看更多