- 2024-05-25 发布 |
- 37.5 KB |
- 15页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2020版高中数学 第三章 统计案例章末检测试卷 新人教A版选修2-3
第三章 统计案例 章末检测试卷(三) (时间:120分钟 满分:150分) 一、选择题(本大题共12小题,每小题5分,共60分) 1.对有线性相关关系的两个变量建立的线性回归方程=+x中,回归系数 ( ) A.可以小于0 B.大于0 C.能等于0 D.只能小于0 考点 线性回归分析 题点 回归直线的概念 答案 A 解析 ∵=0时,则r=0,这时不具有线性相关关系,但可以大于0也可以小于0. 2.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为=7.19x+73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是( ) A.身高一定为145.83 cm B.身高大于145.83 cm C.身高小于145.83 cm D.身高在145.83 cm左右 考点 线性回归分析 题点 线性回归方程的应用 15 答案 D 解析 用线性回归方程预测的不是精确值,而是估计值.当x=10时,y=145.83,只能说身高在145.83左右. 3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是( ) x 4 5 6 7 8 9 10 y 14 18 19 20 23 25 28 A.线性函数模型 B.二次函数模型 C.指数函数模型 D.对数函数模型 考点 回归分析 题点 建立回归模型的基本步骤 答案 A 解析 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型. 4.如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( ) A.性别与喜欢理科无关 B.女生中喜欢理科的比例约为80% C.男生比女生喜欢理科的可能性大些 D.男生中不喜欢理科的比例约为60% 考点 定性分析的两类方法 题点 利用图形定性分析 答案 C 解析 由图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些. 5.为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算K2≈0.99,根据这一数据分析,下列说法正确的是( ) 15 A.有99%的人认为该电视栏目优秀 B.有99%的人认为该电视栏目是否优秀与改革有关系 C.有99%的把握认为该电视栏目是否优秀与改革有关系 D.没有理由认为该电视栏目是否优秀与改革有关系 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 D 解析 只有K2≥6.635时才能有99%的把握认为该电视栏目是否优秀与改革有关系,而即使K2≥6.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的推论,与是否有99%的人等无关. 15 6.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( ) A.相关系数r变大 B.残差平方和变大 C.R2变大 D.解释变量x与预报变量y的相关性变强 考点 残差分析与相关指数 题点 残差及相关指数的应用 答案 B 解析 由散点图知,去掉D后,x,y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小. 7.某车间加工零件的数量x与加工时间y的统计数据如下表: 零件数x(个) 10 20 30 加工时间y(分钟) 21 30 39 现已求得上表数据的回归方程=x+中的值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( ) A.84分钟 B.94分钟 C.102分钟 D.112分钟 考点 线性回归分析 题点 线性回归方程的应用 答案 C 解析 由已知可得=20,=30, 又=0.9,∴=-=30-0.9×20=12. ∴回归方程为=0.9x+12. ∴当x=100时,=0.9×100+12=102. 故选C. 8.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) A.x与y正相关,x与z负相关 15 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关 考点 线性回归分析 题点 线性回归方程的应用 答案 C 解析 因为y=-0.1x+1,-0.1<0,所以x与y负相关.又y与z正相关,故可设z=ay+b(a>0),所以z=-0.1ax+a+b,-0.1a<0,所以x与z负相关.故选C. 9.根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn)的散点图分析存在线性相关关系,求得其线性回归方程=0.85x-85.7,则在样本点(165,57)处的残差为( ) A.54.55 B.2.45 C.3.45 D.111.55 考点 残差分析与相关指数 题点 残差及相关指数的运算 答案 B 解析 把x=165代入=0.85x-85.7,得y=0.85×165-85.7=54.55,由57-54.55=2.45,故选B. 10.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的回归直线(如图所示),以下结论中正确的是( ) A.x和y的相关系数为直线l的斜率 B.x和y的相关系数在0到1之间 C.当n为偶数时,分布在l两侧的样本点的个数一定相同 D.直线l过点(,) 考点 线性回归分析 题点 线性回归方程的应用 答案 D 解析 两个变量的相关系数不是直线的斜率,有专门的计算公式,所以A错误;两个变量的相关系数在-1到0之间,所以B错误;C中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以C错误;根据线性回归方程一定经过样本点中心可知D正确. 15 11.某大学体育部为了解新生的身高与地域是否有关,在全校一年级学生中进行了抽样调查,调查结果如下表所示: 不低于170 cm 低于170 cm 合计 北方学生 60 20 80 南方学生 10 10 20 合计 70 30 100 则下列说法正确的是( ) A.有95%的把握认为“学生的身高是否超过170 cm与地域有关” B.没有90%的把握认为“学生的身高是否超过170 cm与地域有关” C.有97.5%的把握认为“学生的身高是否超过170 cm与地域有关” D.没有95%的把握认为“学生的身高是否超过170 cm与地域有关” 附:K2=,其中n=a+b+c+d. P(K2≥k0) 0.25 0.15 0.10 0.05 0.025 k0 1.323 2.072 2.706 3.841 5.024 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 A 解析 将2×2列联表中的数据代入公式计算,得 K2==≈4.762, 由于4.762>3.841,所以有95%的把握认为“学生的身高是否超过170 cm与地域有关”.故选A. 12.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1 成绩 性别 不及格 及格 总计 男 6 14 20 女 10 22 32 总计 16 36 52 15 表2 视力 性别 好 差 总计 男 4 16 20 女 12 20 32 总计 16 36 52 表3 智商 性别 偏高 正常 总计 男 8 12 20 女 8 24 32 总计 16 36 52 表4 阅读量 性别 丰富 不丰富 总计 男 14 6 20 女 2 30 32 总计 16 36 52 A.成绩 B.视力 C.智商 D.阅读量 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 D 解析 结合各列联表中数据,得K2的观测值分别为k1,k2,k3,k4. 因为k1==, k2==, k3==, k4==, 15 则k4>k2>k3>k1,所以阅读量与性别有关联的可能性最大. 二、填空题(本大题共4小题,每小题5分,共20分) 13.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温度数,并制作了对照表: 气温(℃) 18 13 10 -1 杯数(杯) 24 34 38 64 由表中数据算得线性回归方程=x+中的≈-2,预测当气温为-5 ℃时,热茶销售量大约为________杯. 考点 线性回归分析 题点 线性回归方程的应用 答案 70 解析 根据表格中的数据可求得=×(18+13+10-1)=10,=×(24+34+38+64)=40, ∴=-=40-(-2)×10=60, ∴线性回归方程为=-2x+60, 当x=-5时,=-2×(-5)+60=70. 14.在评价建立的线性回归模型刻画身高和体重之间关系的效果时,R2=________,可以叙述为“身高解释了64%的体重变化,而随机变量贡献了剩余的36%”. 考点 残差分析与相关指数 题点 残差及相关指数的概念 答案 0.64 解析 当R2=0.64时,说明体重的差异有64%是由身高引起的,所以身高解释了64%的体重变化,而随机变量贡献了剩余的36%. 15.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________. ①在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,则他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; 15 ④这种血清预防感冒的有效率为5%. 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 ① 解析 查对临界值表知P(K2≥3.841)≈0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”.95%仅是指“血清与预防感冒有关”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能.故答案为①. 16.已知x,y之间的一组数据如下表: x 2 3 4 5 6 y 3 4 6 8 9 对于表中数据,现给出如下拟合直线:①y=x+1;②y=2x-1;③y=x-;④y=x.其中拟和效果最好的是________. 考点 两个模型拟合效果的比较 题点 两个模型拟合效果的比较 答案 ④ 解析 根据最小二乘法得变量x与y间的线性回归直线必过点(,), 则==4, ==6, 拟合直线①②不过点(4,6). 对于③,y=x-,当x=4时,y=6, 当x=6 时,y=9.2, 对于④,y=x,当x=4时,y=6,当x=6时,y=9. 综上可知,拟合效果最好的直线是④. 三、解答题(本大题共6小题,共70分) 17.(10分)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果: 表1:男生上网时间与频数分布表 上网时间(分) [30,40) [40,50) [50,60) [60,70) [70,80] 15 人数 5 25 30 25 15 表2:女生上网时间与频数分布表 上网时间(分) [30,40) [40,50) [50,60) [60,70) [70,80] 人数 10 20 40 20 10 (1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数; (2)完成下面的2×2列联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”. 上网时间少于60分钟 上网时间不少于60分钟 总计 男生 女生 总计 附:K2=,其中n=a+b+c+d为样本容量. P(K2≥k0) 0.50 0.40 0.25 0.15 0.10 k0 0.455 0.708 1.323 2.072 2.706 P(K2≥k0) 0.05 0.025 0.010 0.005 0.001 k0 3.841 5.024 6.635 7.879 10.828 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 (1)设上网时间不少于60分钟的人数为x, 依题意有=,解得x=225, 所以估计其中上网时间不少于60分钟的人数是225. (2)填2×2列联表如下: 上网时间少于60分钟 上网时间不少于60分钟 总计 男生 60 40 100 女生 70 30 100 总计 130 70 200 15 由表中数据可得到K2=≈2.20<2.706, 故没有90%的把握认为“大学生上网时间与性别有关”. 18.(12分)某地随着经济的发展居民收入逐年增长,下表是该地某银行连续五年的储蓄存款(年底余额),如下表1: 年份x 2011 2012 2013 2014 2015 储蓄存款y (千亿元) 5 6 7 8 10 为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 010,z=y-5得到下表2: 时间代号t 1 2 3 4 5 z 0 1 2 3 5 (1)求z关于t的线性回归方程; (2)通过(1)中的方程,求出y关于x的线性回归方程; (3)用所求线性回归方程预测到2020年年底,该地储蓄存款可达多少? (附:对于线性回归方程=x+,其中=,=-) 考点 线性回归方程 题点 求线性回归方程 解 (1)=3,=2.2,izi=45,=55, ==1.2,=- =2.2-1.2×3=-1.4, ∴=1.2t-1.4. (2)将t=x-2 010,z=y-5,代入=1.2t-1.4, 得y-5=1.2(x-2 010)-1.4,即=1.2x-2 408.4. (3)∵=1.2×2 020-2 408.4=15.6, ∴预测到2020年年底,该地储蓄存款额可达15.6千亿元. 15 19.(12分)某校团对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的,若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人? 考点 独立性检验思想的应用 题点 独立性检验在分类变量中的应用 解 设男生人数为x,依题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 x 女生 总计 x 若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则K2>3.841, 由K2==x>3.841, 解得x>10.24, ∵,为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人. 20.(12分)为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表: x 1 2 3 4 5 y 7.0 6.5 5.5 3.8 2.2 (1)求y关于x的线性回归方程=x+; (2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保留两位小数) 参考公式:==, =-. 考点 线性回归分析 15 题点 线性回归方程的应用 解 (1)由题知=3,=5,iyi=62.7,=55, ===-1.23, =-=5-(-1.23)×3=8.69, 所以y关于x的线性回归方程为=-1.23x+8.69. (2)年利润z=x(-1.23x+8.69)-2x=-1.23x2+6.69x =-1.232+1.23×2, 即当x=≈2.72时,年利润z最大. 21.(12分)为研究某种图书每册的成本费y(元)与印刷数x(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值. (xi-)2 (xi-) ·(yi-) (ui-)2 (ui-) ·(yi-) 15.25 3.63 0.269 2085.5 -230.3 0.787 7.049 表中ui=,=i. (1)根据散点图判断:y=a+bx与y=c+哪一个更适宜作为每册成本费y(元)与印刷数x(千册)的回归方程类型?(只要求给出判断,不必说明理由) (2)根据(1)的判断结果及表中数据建立y关于x的回归方程;(回归系数的结果精确到0.01) (3)若每册书定价为10元,则至少应该印刷多少千册才能使销售利润不低于78 840元?(假设能够全部售出,结果精确到1) 15 (附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn)),其回归直线=+ω的斜率和截距的最小二乘估计分别为=,=- . 考点 非线性回归分析 题点 非线性回归分析 解 (1)由散点图判断,y=c+适宜作为每册成本费y与印刷册数x的回归方程. (2)令u=,先建立y关于u的线性回归方程, 由于==≈8.96. ∴=-·=3.63-8.96×0.269≈1.22, ∴y关于u的线性回归方程为=1.22+8.96u, 从而y关于x的回归方程为=1.22+, (3)假设印刷x千册,由题意,得10x-·x≥78.840. 即8.78x≥87.8,∴x≥10,∴至少印刷10千册. 22.(12分)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.并根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”. (1)根据已知条件完成下面的2×2列联表,据此资料你是否认为“体育迷”与性别有关? 非体育迷 体育迷 总计 男 女 10 55 15 总计 (2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列、均值E(X)和方差D(X). 附:K2= P(K2≥k0) 0.05 0.01 k0 3.841 6.635 考点 独立性检验思想的应用 题点 独立性检验与线性回归方程、均值的综合应用 解 (1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下: 非体育迷 体育迷 总计 男 30 15 45 女 45 10 55 总计 75 25 100 将2×2列联表中的数据代入公式计算,得 K2的观测值k===≈3.030. 因为3.030<3.841,所以没有理由认为“体育迷”与性别有关. (2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为.由题意知X~B,从而X的分布列为 X 0 1 2 3 P E(X)=np=3×=, D(X)=np(1-p)=3××=. 15查看更多