- 2021-04-13 发布 |
- 37.5 KB |
- 56页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2019届二轮复习回归分析的基本思想及其初步应用课件(56张)(全国通用)(全国通用)
回归分析的基本思想及其初步应用 考纲下载 1. 了解随机误差、残差、残差图的概念 . 2 . 会通过分析残差判断线性回归模型的拟合效果 . 3 . 掌握建立线性回归模型的步骤 . 知识复习 达标检测 题型探究 内容索引 知识复习 思考 某电脑公司有 5 名产品推销员,其工作年限与年推销金额数据如下表: 知识点一 线性回归模型 推销员编号 1 2 3 4 5 工作年限 x / 年 3 5 6 7 9 推销金额 y / 万元 2 3 3 4 5 请问如何表示推销金额 y 与工作年限 x 之间的相关关系? y 关于 x 的线性回归方程是什么? 答案 画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示变量之间的相关关系 . 梳理 (1) 函数关系是一 种 关系 ,而相关关系是一 种 ____ _ ____ 关系 . (2) 回归分析是对 具有 关系 的两个变量进行统计分析的一种常用方法 . 确定性 非确定性 相关 (4) 线性回归模型 y = bx + a + e ,其中 a 和 b 是模型的未知参数, e 称为 _____ , 自变量 x 称为 , 因变量 y 称为 . 随机 解释变量 误差 预报变量 知识点二 线性回归分析 答案 不一定 . 答案 越小越好 . (2) 残差图法 残差 点 落 在水平的带状区域中,说明选用的模型比较合适 . 这样的带状区域的 宽度 , 说明模型拟合精度越高,回归方程的预报精度越高 . 比较均匀地 越窄 R 2 越接近于 1 知识点三 建立回归模型的基本步骤 1. 确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量 . 2. 画出解释变量和预报变量的散点图,观察它们之间的关系 ( 如是否存在线性关系等 ). 3. 由经验确定回归方程的类型 ( 如观察到数据呈线性关系,则选用线性回归方程 ). 4. 按一定规则 ( 如最小二乘法 ) 估计回归方程中的参数 . 5. 得出结果后分析残差图是否有异常 ( 如个别数据对应残差过大,残差呈现不随机的规律性等 ). 若存在异常,则检查数据是否有误,或模型是否合适等 . 1. 求线性回归方程前可以不进行相关性检验 .( ) 2. 在残差图中,纵坐标为残差,横坐标可以选为样本编号 .( ) 3. 利用线性回归方程求出的值是准确值 .( ) × √ × [ 思考辨析 判断正误 ] 题型探究 例 1 某研究机构对高三学生的记忆力 x 和判断力 y 进行统计分析,得下表数据: 类型一 求线性回归方程 解 答 x 6 8 10 12 y 2 3 5 6 (1) 请画出上表数据的散点图 ; 解 如图: 解答 (3) 试根据求出的线性回归方程,预测记忆力为 9 的同学的判断力 . 预测记忆力为 9 的同学的判断力约为 4. 解答 反思与感悟 (1) 求线性回归方程的基本步骤 ① 列出散点图,从直观上分析数据间是否存在线性相关关系 . ④ 写出线性回归方程并对实际问题作出估计 . (2) 需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义 . 跟踪训练 1 假设关于某设备的使用年限 x ( 年 ) 和所支出的维修费用 y ( 万元 ) 有如下的统计数据: 解答 x 2 3 4 5 6 y 2.2 3.8 5.5 6.5 7.0 由此资料可知 y 对 x 呈线性相关关系 . (1) 求线性回归方程; 解 由上表中的数据可得 (2) 求使用年限为 10 年时,该设备的维修费用为多少? 解答 即使用年限为 10 年时,该设备的维修费用约为 12.38 万元 . 命题角度 1 线性回归分析 类型二 回归分析 解答 求出 y 对 x 的线性回归方程,并说明拟合效果的程度 . 例 2 在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组数据为: x 14 16 18 20 22 y 12 10 7 5 3 列出残差表: 所以回归模型的拟合效果很好 . 反思与感悟 (1) 该类题属于线性回归问题,解答此类题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数 R 2 来分析函数模型的拟合效果,在此基础上,借助线性回归方程对实际问题进行分析 . (2) 刻画回归效果的三种方法 ① 残差图法,残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适 . 跟踪训练 2 关于 x 与 y 有如下数据: 解答 x 2 4 5 6 8 y 30 40 60 50 70 ∴ (1) 的拟合效果好于 (2) 的拟合效果 . 例 3 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x ( 单位:千元 ) 对年销售量 y ( 单位: t) 和年利润 z ( 单位:千元 ) 的影响 . 对近 8 年的年宣传费 x i 和年销售量 y i ( i = 1,2 , … , 8) 数据作了初步处理,得到下面的散点图及一些统计量的值 . 命题角度 2 非线性回归分析 解答 (1) 根据散点图判断, y = a + bx 与 y = c + d 哪 一个适宜作为年销售量 y 关于年宣传费 x 的回归方程类型? ( 给出判断即可,不必说明理由 ) 解 由散点图可以判断, y = c + d 适宜 作为年销售量 y 关于年宣传费 x 的回归方程类型 . (2) 根据 (1) 的判断结果及表中数据,建立 y 关于 x 的回归方程; 解答 (3) 已知这种产品的年利润 z 与 x , y 的关系为 z = 0.2 y - x . 根据 (2) 的结果回答下列问题: ① 年宣传费 x = 49 时,年销售量及年利润的预报值是多少? 解答 ② 年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据 ( u 1 , v 1 ) , ( u 2 , v 2 ) , … , ( u n , v n ) ,其回归直线 v = α + βu 的斜率和截距的最小二乘估计分别为 解答 解 根据 (2) 的结果知,年利润 z 的预报值 故年宣传费为 46.24 千元时,年利润的预报值最大 . 反思与感悟 求非线性回归方程的步骤 (1) 确定变量,作出散点图 . (2) 根据散点图,选择恰当的拟合函数 . (3) 变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程 . (4) 分析拟合效果:通过计算相关指数或画残差图来判断拟合效果 . (5) 根据相应的变换,写出非线性回归方程 . 跟踪训练 3 在一次抽样调查中测得样本的 5 个样本点,数值如下表: 试建立 y 与 x 之间的回归方程 . x 0.25 0.5 1 2 4 y 16 12 5 2 1 解答 解 由数值表可作散点图如图, 由置换后的数值表作散点图 如 右 : 根据散点图可知 y 与 x 近似地呈反比例函数关系, t 4 2 1 0.5 0.25 y 16 12 5 2 1 由散点图可以看出 y 与 t 呈近似的线性相关关系,列表如下: i t i y i t i y i t 1 4 16 64 16 2 2 12 24 4 3 1 5 5 1 4 0.5 2 1 0.25 5 0.25 1 0.25 0.062 5 ∑ 7.75 36 94.25 21.312 5 达标检测 1. 下列两个变量之间的关系不是函数关系的是 A. 角度和它的余弦 值 B . 正方形的边长和面积 C. 正 n 边形的边数和内角度数 和 D . 人的年龄和身高 解析 函数关系就是变量之间的一种确定性关系 . A , B , C 三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为 f ( θ ) = cos θ , g ( a ) = a 2 , h ( n ) = ( n - 2)π . D 选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选 D. 答案 解析 √ 1 2 3 4 5 答案 解析 2. 设有一个线性回归 方程 = 2 - 1.5 x ,当变量 x 增加 1 个单位时 A. y 平均增加 1.5 个 单位 B. y 平均增加 2 个单位 C. y 平均减少 1.5 个 单位 D. y 平均减少 2 个单位 解析 由回归方程中两个变量之间的关系可以得到 . 1 2 3 4 5 √ 答案 3. 如图四个散点图中,适合用线性回归模型拟合其中两个变量的是 1 2 3 4 5 A. ①② B. ①③ C . ②③ D . ③④ √ 解析 解析 由图易知 ①③ 两个图中样本点在一条直线附近,因此适合用线性回归模型 . 4. 某产品在某零售摊位的零售价 x ( 单位:元 ) 与每天的销售量 y ( 单位:个 ) 的统计资料如下表所示: x 16 17 18 19 y 50 34 41 31 A.51 个 B.50 个 C.54 个 D.48 个 √ 解析 1 2 3 4 5 答案 解答 5. 已知 x , y 之间的一组数据如下表: 1 2 3 4 5 x 0 1 2 3 y 1 3 5 7 x 1 y 1 + x 2 y 2 + x 3 y 3 + x 4 y 4 = 0 × 1 + 1 × 3 + 2 × 5 + 3 × 7 = 34 , 解答 (2) 已知变量 x 与 y 线性相关,求出线性回归方程 . 1 2 3 4 5 回归分析的步骤: (1) 确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2) 画出确定好的解释变量和预报变量的散点图,观察它们之间的关系 ( 如是否存在线性关系等 ) ; (3) 由经验确定回归方程的类型 ( 如果呈线性关系,则选用线性回归 方程 ) ; (4) 按一定规则估算回归方程中的参数; (5) 得出结果后分析残差图是否有异常 ( 个别数据对应的残差过大,或残差呈现不随机的规律性等 ) ,若存在异常,则检查数据是否有误或模型是否合适等 . 规律与方法查看更多