- 2021-05-09 发布 |
- 37.5 KB |
- 8页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
人教版高中数学选修2-3练习:第三章3-1第2课时残差分析word版含解析
第三章 统计案例 3.1 回归分析的基本思想及其初步应用 第 2 课时 残差分析 A 级 基础巩固 一、选择题 1.甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做 实验,并用回归分析方法分别求得相关系数 r 与残差平方和 m 如下表 所示: 分类 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则哪位同学的试验结果体现 A、B 两变量有更强的线性相关性 ( ) A.甲 B.乙 C.丙 D.丁 解析:r 越接近 1,相关性越强,残差平方和 m 越小,相关性越强, 所以选 D 正确. 答案:D 2.为了表示 n 个点与相应直线在整体上的接近程度,我们常用的 表示法为( ) 解析:由回归直线方程 可知,为一个量的估计值,而 yi 为它的实际值,在最小二乘估计中(yi-a-bxi)2,即(yi- )2. 答案:C 3.甲、乙、丙、丁 4 位同学各自对 A,B 两变量进行回归分析,分 别得到散点图与残差平方和 如下表所示: 分类 甲 乙 丙 丁 散点图 残差平方和 115 106 124 103 哪位同学的试验结果体现拟合 A,B 两变量关系的模型拟合精度 高( ) A.甲 B.乙 C.丙 D.丁 解析:根据线性相关的知识,散点图中各样本点条状分布越均匀, 同时保持残差平方和越小(对于已经获取的样本数据,R2 的表达式中 为确定的数,则残差平方和越小,R2 越大),由回归分 析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些. 答案:D 4.通过残差图我们发现在采集样本点过程中,样本点数据不准确 的是( ) A.第四个 B.第五个 C.第六个 D.第八个 解析:由题图可知,第六个的数据偏差最大,所以第六个数据不 准确. 答案:C 5.如图所示,5 个(x,y)数据,去掉 D(3,10)后,下列说法错误 的是( ) A.相关系数 r 变大 B.残差平方和变大 C.相关指数 R2 变大 D.解释变量 x 与预报变量 y 的相关性变强 解析:由散点图知,去掉 D 后,x 与 y 的相关性变强,且为正相 关,所以 r 变大,R2 变大,残差平方和变小. 答案:B 二、填空题 6.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足 yi=bxi +a+ei(i=1,2,…, n),且 ei 恒为 0,则 R2 为________. 解析:由 ei 恒为 0,知 yi=y ^ i,即 yi-y ^ i=0, 答案:1 7.x,y 满足如下表的关系: x 0.2 0.6 1.0 1.2 1.4 1.6 1.8 2.0 2.2 y 0.04 0.36 1 1.4 1.9 2.5 3.2 3.98 4.82 则 x,y 之间符合的函数模型为________. 解析:通过数据发现 y 的值与 x 的平方值比较接近,所以 x,y 之 间的函数模型为 y=x2. 答案:y=x2 8.关于 x 与 y,有如下数据: x 2 4 5 6 8 y 30 40 60 50 70 有如下的两个模型:(1)y ^=6.5x+17.5;(2)y ^=7x+17.通过残差分 析发现第(1)个线性回归模型比第(2)个拟合效果好.则 R21________R22, Q1________Q2(用大于,小于号填空,R,Q 分别是相关指数和残差平 方和). 解析:根据相关指数和残差平方和的意义知 R21>R22,Q1<Q2. 答案:> < 三、解答题 9.在实验中得到变量 y 与 x 的数据如下表所示: x 0.066 7 0.038 8 0.033 3 0.027 3 0.022 5 y 39.4 42.9 41.0 43.1 49.2 由经验知,y 与1 x 之间具有线性相关关系,试求 y 与 x 之间的回归 曲线方程,并预测 x0=0.038 时,y0 的值. 解:令 u=1 x ,由题目所给数据可得下表所示的数据: 序号 ui yi u2i uiyi 1 15.0 39.4 225 591 2 25.8 42.9 665.64 1 106.82 3 30.0 41.0 900 1 230 4 36.6 43.1 1 339.56 1 577.46 5 44.4 49.2 1 971.36 2 184.48 合计 151.8 215.6 5 101.56 6 689.76 计算得b ^=0.29,a ^=34.32. 所以y ^=34.32+0.29u. 所以试求回归曲线方程为y ^=34.32+0.29 x . 当 x0=0.038 时,y0=34.32+0.29 0.38 ≈41.95. 10.关于 x 与 y 有以下数据: x 2 4 5 6 8 y 30 40 60 50 70 已知 x 与 y 线性相关,由最小二乘法得b ^=6.5. (1)求 y 与 x 的线性回归方程; (2)现有第二个线性模型:y ^=7x+17,且 R2=0.82.若与(1)的线性 模型比较,哪一个线性模型拟合效果比较好,请说明理由. 解:(1)依题意设 y 与 x 的线性回归方程为y ^=6.5x+a ^ . — x =2+4+5+6+8 5 =5,— y =30+40+60+50+70 5 =50,因为y ^ =6.5x+a ^经过(— x ,— y ),所以 y 与 x 的线性回归方程为y ^=6.5x+17.5 . 所以 50=6.5×5+a ^ .所以a ^=17.5. (2)由(1)的线性模型得 yi-yi 与 yi-— y 的关系如下表所示: yi-yi -0.5 -3.5 10 -6.5 0.5 yi-— y -20 -10 10 0 20 由于 R21=0.845,R2=0.82 知 R21>R2,所以(1)的线性模型拟合效 果比较好. B 级 能力提升 1.在研究身高和体重的关系时,得到的结论是“身高解释了 64% 的体重变化,而随机误差贡献了剩余的 36%,所以身高对体重的效应 比随机误差的效应大得多”,则求得的相关指数 R2≈( ) A.0.36 B.0.64 C.0.32 D.0.18 解析:根据相关指数的意义知 R2≈0.64. 答案:B 2.若某函数型相对一组数据的残差平方和为 89,其相关指数为 0.95,则总偏差平方和为________,回归平方和为________. 解析:因为 R2=1- 残差平方和 总偏差平方和, 0.95=1- 89 总偏差平方和,所以总偏差平方和为 1 780;回归平方 和=总偏差平方和-残差平方和=1 780-89=1 691. 答案:1 780 1 691 3.某运动员训练次数与成绩之间的数据关系如下: 次数 x 30 33 35 37 39 44 46 50 成绩 y 30 34 37 39 42 46 48 51 (1)作出散点图; (2)求出回归方程; (3)作出残差图; (4)计算相关指数 R2; (5)试预测该运动员训练 47 次及 55 次的成绩. 解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所 示,由散点图可知,它们之间具有线性相关关系. (2)— x =39.25,— y =40.875, = 13 180, a ^=— y -b ^— x =-0.003 88. 所以回归方程为y ^=1.0415x-0.003 88. (3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平 带状区域中,说明选用的模型比较合适. (4)计算得相关指数 R2=0.985 5,说明了该运动员的成绩的差异有 98.55%是由训练次数引起的. (5)由上述分析可知,我们可用回归方程y ^=1.041 5x-0.003 88 作 为该运动员成绩的预报值. 将 x=47 和 x=55 分别代入该方程可得 y≈49 和 y≈57. 故预测该运动员训练 47 次和 55 次的成绩分别为 49 和 57.查看更多