- 2021-06-21 发布 |
- 37.5 KB |
- 43页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
专题42+抽样方法与统计分析(检测)-2019年高考数学(文)名师揭秘之一轮总复习
【学习目标】 1.了解三种抽样方法:简单随机抽样、分层抽样、系统抽样. 2.掌握“一表三图”:频率分布表、频率分布直方图、折线图、茎叶图. 3.会求“六种数”:众数、中位数、平均数、极差、方差、标准差. 【知识要点】 1.抽样方法 (1)抽样要具有随机性、等可能性,这样才能通过对样本的分析和研究更准确的反映总体的情况,常用的抽样方法有 、 、 . (2)简单随机抽样是指一个总体的个数为N(较小的有限数),通过逐个抽取一个样本,且每次抽取时每个个体被抽取的概率相等.简单随机抽样的两种常用方法为 . (3)分层抽样是总体由差异明显的几部分组成,常将总体按差异分成几个部分,然后 ,其中所分成的各部分叫做 . (4)系统抽样是当总体中的个数较多时,将总体均分成几部分,按事先 在各部分抽取. 2.总体分布的估计 (1)作频率分布直方图的步骤: ①求极差(即一组数据中最大值与最小值的差) ②决定组距与组数 ③将数据分组 ④列频率分布表(下图) 分组 频数 频率 累计频率 [t0,t1) r1 f1 f1 [t1,t2) r2 f2 f1+f2 … … … … [tk-1,tk] rk fk f1+f2+…+fk=1 ⑤画频率分布直方图,将区间[a,b)标在横轴上,纵轴表示频率与组距的比值,以每个组距为底,以各频率除以组距的商为高,分别画矩形,共得k个矩形,这样得到的图形叫做 . 频率分布直方图的性质:①第i个矩形的面积等于样本值落入区间[ti-1,ti)的频率;②由于f1+f2+…+fk=1,所以所有小矩形的面积的和为1. (2)连接频率分布直方图中各小长方形上边的中点,就得到频率分布折线图,随着样本容量的增加,折线图会越来越近似于一条光滑曲线,称之为 . (3)统计中还有一种被用来表示数据的图叫茎叶图,茎是 ,叶是从 . 用茎叶图表示数据有两个突出的优点:一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录,方便记录与表示. 3.平均数和方差的计算 (1)如果有n个数据x1,x2,…,xn,则= 叫做这组数据的平均数,s2= 叫做这组数据的方差,而s叫做标准差. (2)公式s2= . 【高考模拟】 一、单选题 1.滴滴公司为了调查消费者对滴滴打车出行的真实评价,采用系统抽样方法从2000人中抽取100人做问卷调查,为此将他们随机编号1,2,,2000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的100人中,编号落入区间的人做问卷,编号落入区间的人做问卷,其余的人做问卷,则抽到的人中,做问卷的人数为( ) A. B. C. D. 【答案】B 【解析】 【分析】 根据系统抽样可知抽到的号码构成以9为首项,20为公差的等差数列,得,由,进而求解即可. 【详解】 【点睛】 本题主要考查系统抽样的方法,属于简单题. 系统抽样适合抽取样本较多且个体之间没有明显差异的总体,系统抽样最主要的特征是,所抽取的样本相邻编号等距离,可以利用等差数列的性质解答. 2.已知变量与负相关,且由观测数据算得样本平均数,则由该观测的数据算得的线性回归方程可能是 A. B. C. D. 【答案】C 【解析】 【分析】 根据与负相关可知b为负数,将样本平均数点带入选项检验,可求得回归直线方程。 【详解】 因为变量与负相关,所以,排除A、B选项; 因为,代入检验即可得到C是正确选项 所以选C 【点睛】 本题考查了回归直线方程的简单应用,属于基础题。 3.如右饼图,某学校共有教师120人,从中选出一个30人的样本,其中被选出的青年女教师的人数为( ) A. 12 B. 6 C. 4 D. 3 【答案】D 【解析】 【分析】 根据饼图得到青年教师的人数,进而得到青年女教师的人数,然后根据抽样比得到所要抽取的人数. 【详解】 【点睛】 (1)对于总体是由明显区别的几个层组成的情况,在抽样时可采用分层抽样的方法.分层抽样即按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比. (2)读懂饼形图的含义也是解答本题的关键之一. 4.某教育局为了解“跑团”每月跑步的平均里程,收集并整理了2017年1月至2017年11月期间“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了下面的折线图. 根据折线图,下列结论正确的是( ) A. 月跑步平均里程的中位数为6月份对应的里程数 B. 月跑步平均里程逐月增加 C. 月跑步平均里程高峰期大致在8、9月 D. 1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳 【答案】D 【解析】 由折线图知,月跑步平均里程的中位数为5月份对应的里程数; 月跑步平均里程不是逐月增加的; 月跑步平均里程高峰期大致在9,l0月份,故A,B,C错. 本题选择D选项. 5.下列表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归直线方程为,后因某未知原因使第5组数据的值模糊不清,此位置数据记为(如下表所示),则利用回归方程可求得实数的值为( ) 196 197 200 203 204 1 3 6 7 A. 8.3 B. 8.2 C. 8.1 D. 8 【答案】D 【解析】 【分析】 首先求得样本中心点,然后利用回归方程的性质整理计算即可求得最终结果. 【详解】 由题意可得: ,, 回归方程过样本中心点,则: ,解得:. 本题选择D选项. 【点睛】 (1)正确理解计算的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程必过样本点中心. (3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测. 6.已知x与y之间的一组数据: x 0 1 2 3 y 1 3 5 7 则y与x的线性回归方程为y=bx+a必过点 ( ) A. (2,2) B. (1.5,0) C. (1.5,4) D. (1, 2) 【答案】C 【解析】 【分析】 由回归直线方程必过样本点中心,从而得解. 【详解】 【点睛】 (1)正确理解计算的公式和准确的计算是求线性回归方程的关键. (2)回归直线方程必过样本点中心. (3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具 7.某单位有职工160人,其中业务员有104人,管理人员32人,后勤服务人员24人,现用分层抽样法从中抽取一容量为20的样本,则抽取管理人员( ) A. 3人 B. 4人 C. 7人 D. 12人 【答案】B 【解析】 【分析】 先求出每个个体被抽到的概率,再用管理人员的总人数乘以此概率,即得所求. 【详解】 每个个体被抽到的概率等于,由于管理人员共计32人, 故应抽取管理人员的人数为, 故选B. 【点睛】 本题主要考查了分层抽样的知识,属于基础题. 8.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( ) A. 40 B. 45 C. 48 D. 50 【答案】C 【解析】 【分析】 根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】 从左到右个小组的频率之比为,其中第2小组的频数为12, 从左到右个小组的频数分别为,共有人, 第4,5小组的频率之和为, 则前3小组的频率之和为, 则该校报名学生的总人数为,故选C. 【点睛】 本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数. 9.已知一组数据(1,2),(3,5),(6,8),(,)的线性回归方程为,则的值为( ) A. -3 B. -5 C. -2 D. -1 【答案】A 【解析】 【分析】 利用平均数公式计算样本中心点的坐标,根据回归直线必过样本的中心点可得结论. 【详解】 【点睛】 本题主要考查回归方程的性质,属于简单题. 回归直线过样本点中心是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 10.已知下表所示数据的回归直线方程为y,则实数a的值为 x 2 3 4 5 6 y 3 7 11 a 21 A. 16 B. 18 C. 20 D. 22 【答案】B 【解析】 【分析】 求得,再根据回归直线方程过样本中心,求得能数。 【详解】 由表中数据可知,回归直线方程过样本中心,所以,解得,选B. 【点睛】 对于加归直线方程,需要注意的是回归直线方程过样本中心。 11.某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据: 2 4 5 6 8 30 40 60 50 70 根据上表可得回归方程,则的值为( ) A. 17.5 B. 27.5 C. 17 D. 14 【答案】A 【解析】 【分析】 先求,再根据回归直线方程恒过点得的值 【详解】 因为,所以,,选A. 【点睛】 函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,写出回归方程,回归直线方程恒过点. 12.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从下面的随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 A. 08 B. 07 C. 02 D. 01 【答案】D 【解析】 【分析】 按照要求从随机数表读数,第一个是65,第二个72,依次类推,大于20或者重复的数跳过,直至读出5个符合要求的数即可. 【详解】 按随机数表读数,5个数分别是08,02,14,07,01,故选D. 【点睛】 本题主要考查了简单随机抽样中按照随机数表抽样的方法,属于容易题. 13.某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为 ( ) A. 11 B. 12 C. 13 D. 14 【答案】B 【解析】 考点:系统抽样 14.A,B两名同学在5次数学考试中的成绩统计如下面的茎叶图所示,若A,B两人的平均成绩分别是,,观察茎叶图,下列结论正确的是 A. ,B比A成绩稳定 B. ,B比A成绩稳定 C. ,A比B成绩稳定 D. ,A比B成绩稳定 【答案】A 【解析】 【分析】 根据茎叶图看出和的五次成绩离散程度,计算出和的平均数,比较大小即可 【详解】 的成绩为,的平均数为 的成绩为的平均数为 从茎叶图上看出的数据比的数据集中,比成绩稳定 故选 【点睛】 本题考查了茎叶图的应用问题,考查了平均数的求法,解题时应该观察茎叶图中的数据,根据数据解答问题,属于基础题。 15.将容量为100的样本数据分为8个组,如下表: 组号 1 2 3 4 5 6 7 8 频数 10 13 x 14 15 13 12 9 则第3组的频率为 A. B. C. D. 【答案】C 【解析】 【分析】 由频率分布表求出第三组的频数,由此能求得答案 【详解】 由频率分布表可得第组的频数为: 第组的频率为 故选 【点睛】 本题主要考查了频率分布表,考查了样本容量,频数和频率之间的关系,三者可以做到知二求一,属于基础题。 16.某学校老师中,型血有36人、型血有24人、型血有12人,现需要从这些老师中抽取一个容量为的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量减少一个,则在采用系统抽样时,需要在总体中剔除2个个体,则样本容量可能为( ) A. B. C. D. 【答案】C 【解析】 【分析】 根据系统抽样和分层抽样方法特点确定样本容量需满足条件,再比较选项确定结果. 【详解】 【点睛】 本题考查系统抽样和分层抽样方法,考查基本求解能力. 17.某校五四演讲比赛中,七位评委为一选手打出的分数如下:90 86 90 97 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 A. B. C. D. 【答案】B 【解析】 【分析】 去掉一个最高分97和一个最低分86后,直接将所给数据代入平均数与方差公式求解即可. 【详解】 据题意知,去掉一个最高分97和一个最低分86后, 所剩数据90,90,93,93,94, 由平均数公式可得平均数为; 由方差公式得方差为,故选B 【点睛】 本题主要考查平均数公式与方差公式的应用,属于中档题.样本数据的平均数为;样本方差公式,标准差公式. 18.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取件进行检验,则应从丙种型号的产品中抽取( )件. A. 24 B. 18 C. 12 D. 6 【答案】B 【解析】 【分析】 根据分层抽样列比例式,解得结果. 【详解】 根据分层抽样得应从丙种型号的产品中抽取,选B. 【点睛】 在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N. 19.由x与y的观测数据求得样本平均数=5,=8.8,并且当x=8时,预测y=14.8,则由这组观测数据求得的线性回归方程可能是( ) A. =x+3.8 B. =2x-1.2 C. =x+10.8 D. =-x+11.3 【答案】B 【解析】 【分析】 设回归直线的方程为,将点与点代入回归方程即可的结果. 【详解】 【点睛】 本题主要考查回归方程的性质,属于简单题. 回归直线过样本点中心是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 20.已知 的取值如下表 0 1 3 4 2.2 4.3 4.8 6.7 从散点图可以看出与线性相关,且回归方程为,则( ) A. B. 2.6 C. 2.2 D. 0 【答案】B 【解析】 【分析】 求出,根据回归方程必过中心点,代入得到关于的方程,解方程即可求得答案 【详解】 根据题意可得: 回归方程必过中心点, 解得 故选 【点睛】 本题考查的知识点是线性回归直线的性质,解题的关键是回归方程必过中心点,属于基础题。 21.为了解某校高一年级400名学生的身高情况,从中抽取了50名学生的身高进行统计分析,在这个问题中,样本是指( ) A. 400 B. 50 C. 400名学生的身高 D. 50名学生的身高 【答案】D 【解析】 【分析】 直接利用样本的定义求解即可. 【详解】 本题研究的对象是某校高一年级名学生的身高情况,所以样本是名学生的身高,故选D. 【点睛】 本题考査的是确定样本,解此类题需要注意“ 考査对象实际应是表示事物某一特征的数据,而非考査的事物”,我们在区分总体、个体、样本、样本容量这四个概念时,首先找出考査的对象,本题中研究对象是:学生的身高. 22.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间 周一 周二 周三 周四 周五 车流量(万辆) 100 102 108 114 116 浓度(微克) 78 80 84 88 90 根据上表数据,用最小二乘法求出与的线性回归方程是( ) 参考公式:,;参考数据:,; A. B. C. D. 【答案】B 【解析】 【分析】 利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】 【点睛】 本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算的值;③计算回归系数;④ 写出回归直线方程为; 回归直线过样本点中心是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 23.用系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1-160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第15组中抽出的号码为118,则第一组中按此抽签方法确定的号码是( ) A. 7 B. 6 C. 5 D. 4 【答案】B 【解析】 【分析】 设第一组抽出的号码为,则第组抽出的号码应为,由第15组中抽出的号码为118,列方程可得结果. 【详解】 因为从160名学生中抽取容量为20的样本 所以系统抽样的组数为,间隔为, 设第一组抽出的号码为, 则由系统抽样的法则, 可知第组抽出的号码应为, 第组应抽出号码为,得,故选B. 【点睛】 本题主要考查系统抽样的方法,属于简单题. 系统抽样适合抽取样本较多且个体之间没有明显差异的总体,系统抽样最主要的特征是,所抽取的样本相邻编号等距离,可以利用等差数列的性质解答. 24.一组数据的茎叶图如图所示,则数据落在区间内的概率为 A. 0.2 B. 0.4 C. 0.5 D. 0.6 【答案】D 【解析】 【分析】 根据茎叶图个原始数据落在区间内的个数,由古典概型的概率公式可得结论. 【详解】 由茎叶图个原始数据,数出落在区间内的共有6个, 包括2个个个,2个30, 所以数据落在区间内的概率为,故选D. 【点睛】 本题主要考查古典概型概率公式的应用,属于简单题. 在解古典概型概率题时,首先求出样本空间中基本事件的总数,其次求出概率事件中含有多少个基本事件,然后根据公式求得概率. 25.某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为,,,,.根据直方图,这320名学生中每周的自习时间不足22.5小时的人数是( ) A. 68 B. 72 C. 76 D. 80 【答案】B 【解析】 由频率分布直方图可得,320名学生中每周的自习时间不足22.5小时的人数是人.选B. 26.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5 个个体,选取方法是从下面的随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 A. 08 B. 07 C. 02 D. 01 【答案】D 【解析】 【分析】 按照要求从随机数表读数,第一个是65,第二个72,依次类推,大于20或者重复的数跳过,直至读出5个符合要求的数即可. 【详解】 按随机数表读数,5个数分别是08,02,14,07,01,故选D. 【点睛】 本题主要考查了简单随机抽样中按照随机数表抽样的方法,属于容易题. 27.为了考察两个变量x和y之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( ) A. 直线l1和l2有交点(s,t) B. 直线l1和l2相交,但是交点未必是点(s,t) C. 直线l1和l2由于斜率相等,所以必定平行 D. 直线l1和l2必定重合 【答案】A 【解析】 【分析】 由题意知,两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,所以两组数据的样本中心点是(s,t),回归直线经过样本的中心点,得到直线l1和l2都过(s,t). 【详解】 【点睛】 本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x与Y之间的关系,这条直线过样本中心点. 28.下表是x和y之间的一组数据,则y关于x的回归方程必过( ) x 1 2 3 4 y 1 3 5 7 A. 点(2,3) B. 点(1.5,4) C. 点(2.5,4) D. 点(2.5,5) 【答案】C 【解析】 【分析】 根据已知中的数据,求出,可得结果. 【详解】 由已知得: =(1+2+3+4)=2.5, =(1+3+5+7)=4, 故y关于x的回归直线方程必过点(2.5,4), 故选:C. 【点睛】 本题解题的关键是回归直线方程一定过样本的中心点,本题是一个基础题.本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x与Y之间的关系,这条直线过样本中心点. 29.下列说法正确的是( ) ①线性回归方程适用于一切样本和总体; ②线性回归方程一般都有时间性; ③样本的取值范围会影响线性回归方程的适用范围; ④根据线性回归方程得到的预测值是预测变量的精确值. A. ①③④ B. ②③ C. ①② D. ③④ 【答案】B 【解析】 【分析】 根据线性回归方程研究的是具有相关关系的两个变量,可对前三者进行判断,再者因为线性回归方程得到的预测值是预测变量的估计值,可判断最后一个也是不正确的. 【详解】 线性回归方程适用于具有相关关系的两个变量,对于具有确定关系的两个变量是不适用的,因此样本和总体中变量只能是具有相关关系才行;因此说法不正确; 线性回归方程一般都有时间性,是正确的,因为回归方程适用于有相关关系的两个变量,两者的变化可能会随时间的推移,互相影响的情况不同,故正确; ③样本的取值范围会影响线性回归方程的适用范围,因为方程就是根据样本得到的;故说法正确; ④根据线性回归方程得到的预测值是预测变量的估计值,不是准确值.故说法不正确. 故答案为:B. 【点睛】 本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x与Y之间的关系,这条直线过样本中心点.线性回归方程适用于具有相关关系的两个变量,对于具有确定关系的两个变量是不适用的, 线性回归方程得到的预测值是预测变量的估计值,不是准确值. 30.现有甲、乙两台机床同时生产直径为的零件,各抽测件进行测量,其结果如下图,则不通过计算从图中数据的变化不能反映的数字特征是( ) A. 极差 B. 方差 C. 平均数 D. 中位数 【答案】C 【解析】 【分析】 根据频数分布折线图逐一进行判断即可. 【详解】 【点睛】 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小,方差或标准差越小,则数据分布波动较小,相对比较稳定. 二、填空题 31.某学校高一、高二、高三共有名学生,为了调查学生的课余学习情况,拟采用分层抽样的方法抽取一个容量为的样本已知高一有名学生,高二有名学生,则在该学校的高三应抽取_________名学生. 【答案】. 【解析】 试题分析:高三学生人数为800,如设高一、高二、高三抽取的人数分别为,则,又,解得. 考点:分层抽样. 32.春节期间,某销售公司每天销售某种取暖商品的销售额(单位:万元)与当天的平均气温(单位:)有关.现收集了春节期间这个销售公司4天的与的数据列于下表: 平均气温() 销售额(万元) 20 23 27 30 根据以上数据,求得与之间的线性回归方程的系数,则________. 【答案】 【解析】 【分析】 根据表中的数据,得到的值,代入回归直线的方程,即可求解. 【详解】 由题意可得:, ∴. 【点睛】 本题主要考查了回归直线方程的应用问题,其中熟记回归直线方程的基本特征和准确计算样本中心是解答的关键,着重考查了推理与运算能力. 33.某学校高一、高二、高三年级的学生人数之比为,现用分层抽样的方法从该校高中三个年级学生中抽取容量为72的样本,则应从高二年级抽取__________名学生. 【答案】24 【解析】 【分析】 根据分层抽样定义列式得结果. 【详解】 由题意得应从高二年级抽取名学生. 【点睛】 在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即ni∶Ni=n∶N. 34.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生. 【答案】60 【解析】 采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查的, ∵该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6, ∴应从一年级本科生中抽取学生人数为:. 故选:A. 35.名工人某天生产同一零件,生产的件数是设其平均数为,中位数为,众数为,则大小关系为______________ (从大写到小)。 【答案】 【解析】 【分析】 根据定义分别求出这组数的平均数、中位数、众数,比较大小即可. 【详解】 总和为;样本数据分布最广,众数; 从小到大排列,中间二位的平均数,即 ∴ 【点睛】 本题主要考查了统计中一组数据的平均数,中位数,众数的概念,属于中档题. 36.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______. 【答案】 【解析】 【分析】 先求出这个数据的平均数为,此时这个数据的方差为,由此求出结果 【详解】 【点睛】 本题主要考查了平均数和方差的计算公式,属于基础题。 37.已知下列命题: ①意味着每增加一个单位,平均增加8个单位 ②投掷一颗骰子实验,有掷出的点数为奇数和掷出的点数为偶数两个基本事件 ③互斥事件不一定是对立事件,但对立事件一定是互斥事件 ④在适宜的条件下种下一颗种子,观察它是否发芽,这个实验为古典概型 其中正确的命题有__________________. 【答案】①③. 【解析】 【分析】 由回归直线的方程的意义可判断①;由基本事件的定义可判断②;由互斥事件与对立事件的定义可判断③;由古典概型的定义可判断④. 【详解】 ①,由回归直线的方程的意义可知意味着每增加一个单位,平均增加8个单位,正确; ②,由于基本事件是每一个出现的基本实验结果,是不能再分的,而投掷一颗骰子实验,有掷出的点数为奇数还有1,3,5三个基本事件,故掷出的点数为奇数不是基本事件,同理掷出的点数为偶数也不是基本事件,故②是错误的; ③,互斥事件不一定是对立事件,但对立事件一定是互斥事件,正确; ④,古典概型要求每个基本事件出现的可能性相等,故在适宜的条件下种下一颗种子,观察它是否发芽,不是古典概型.故正确答案为:①③ 【点睛】 本题主要考查回归直线的方程的意义、基本事件的定义、互斥事件与对立事件的定义、古典概型的定义,意在考查对基本定义掌握的熟练程度,属于中档题. 38.如图是甲、乙两位同学在5次数学测试中得分的茎叶图,则成绩较稳定(方差较小)的那一位同学的方差为____. 【答案】 【解析】 试题分析:由于甲、乙两位同学的平均数均为,所以甲、乙两位同学的方差分别为故成绩较稳定(方差较小)的那一位同学的方差为 考点:方差 39.已知琼海市春天下雨的概率为.现采用随机模拟的方法估计未来三天恰有一天下雨的概率;先由计算器产生到之间取整数值的随机数,指定,,,表示下雨,,,,,,表示不下雨;再以每三个随机数作为一组,代表未来三天是否下雨的结果.经随机模拟产生了如下组随机数:,,,,,,,,,,,,,,,,,,,.据此估计,该地未来三天恰有一天下雨的概率为_________________. 【答案】0.4 【解析】 【分析】 经随机模拟产生了组随机数,则说明进行了次实验,找出在组随机数中表示该地未来三天恰有一天下雨的情况数 【详解】 未来三天恰有一天下雨的有:、、、、、、、,种情况,所以未来三天恰有一天下雨的概率为 【点睛】 本题主要考查的是模拟方法估计概率,可以采用列举法,属于基础题 40.某学校开展一次“五四”知识竞赛活动,共有三个问题,其中第1、2题满分都是15分,第3题满分是20分.每个问题或者得满分,或者得0分.活动结果显示,每个参赛选手至少答对一道题,有6名选手只答对其中一道题,有12名选手只答对其中两道题.答对第1题的人数与答对第2题的人数之和为26,答对第1的人数与答对第3题的人数之和为24,答对第2题的人数与答对第3题的人数之和为22.则参赛选手中三道题全答对的人数是____;所有参赛选手的平均分是____. 【答案】 【解析】 【分析】 列方程组求出答对1题,2题,3题的人数,再求出全班人数,即可求得三道题全答对的人数与平均分. 【详解】 【点睛】 本题考查了求平均数以及应用问题,也考查了方程思想,属难题.. 三、解答题 41.某大学为了更好提升学校文化品位,发挥校园文化的教育功能特举办了校园文化建设方案征集大赛,经评委会初评,有两个优秀方案入选. 为了更好充分体现师生的主人翁意识,组委会邀请了100名师生代表对这两个方案进行登记评价(登记从高到低依次为),评价结果对应的人数统计如下表: 编号 等级 1号方案 15 35 10 2号方案 7 33 20 (Ⅰ)若按分层抽样从对1号方案进行评价的100名师生中抽取样本进行调查,其中等级层抽取3人,等级层抽取1人,求的值; (Ⅱ)在(Ⅰ)的条件下,若从对2个方案的评价为的评价表中各抽取进行数据分析,再从中选取2份进行详细研究,求选出的2份评价表中至少有1份评价为的概率. 【答案】(1) ,c=20;(2). 【解析】 【分析】 (1)根据分层抽样分别求出a,b,c的值即可; (2)对1号方案、2号方案抽取的样本容量都是4.其中,1号方案的评价表中,评价为的有3份,评价为的有1份,令其分别记为;2号方案的评价表中,评价为的有2份,评价为的有2份,令其分别记为.从中抽取2份评价表,从中抽取2份,求出满足条件的概率即可. 【详解】 (1)由分层抽样可知,.又, 所以,所以. (2)由题意,对1号方案、2号方案抽取的样本容量都是4.其中,1号方案的评价表中,评价为的有3份,评价为的有1份,令其分别记为;2号方案的评价表中,评价为的有2份,评价为的有2份,令其分别记为.从中抽取2份评价表,不同的结果为:, , , ,, ,,共28个. 其中至少有1份评价为的所包含的不同结果为 , ,, 共18个. 故所求事件的概率为. 【点睛】 条件概率的求法 (1)利用定义,分别求P(A)和P(AB),得. 注意:事件A与事件B有时是相互独立事件,有时不是相互独立事件,要弄清P(AB)的求法. (2)当基本事件适合有限性和等可能性时,可借助古典概型概率公式,先求事件A包含的基本事件数n(A),再在事件A发生的条件下求事件B包含的基本事件数,即n(AB),得. 42.随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加,下表是某购物网站2017年1-8月促销费用(万元)和产品销量(万件)的具体数据: 月份 1 2 3 4 5 6 7 8 促销费用 2 3 6 10 13 21 15 18 产品销量 1 1 2 3 5 4 (1)根据数据可知与具有线性相关关系,请建立关于的回归方程(系数精确到); (2)已知6月份该购物网站为庆祝成立1周年,特制定奖励制度:以 (单位:件)表示日销量,,则每位员工每日奖励100元;,则每位员工每日奖励 150元;,则每位员工每日奖励200元.现已知该网站6月份日销量服从正态分布,请你计算某位员工当月奖励金额总数大约多少元.(当月奖励金额总数精确到百分位). 参考数据:,,其中,分别为第个月的促销费用和产品销量,. 参考公式: 对于一组数据,,…,,其回归方程的斜率和截距的最小二乘估计分 别为,. 若随机变量服从正态分布,则,. 【答案】(1);(2)元. 【解析】 【试题分析】(1)利用回归直线方程计算公式计算出回归直线方程.(2)根据正态分布概率可计算得销售量在,,上的概率,用奖金乘以对应的概率然后相加,再乘以,可求得总奖金额. 【试题解析】 (1)由题可知, 将数据代入得 所以关于的回归方程 43.某地区为了解学生学业水平考试的状况,从参加学业水平考试的学生中抽出160名,其数学组成绩均为整数的频率分布直方图如图所示. 估计这次考试数学成绩的平均分和众数; 假设在段的学生中有3人得满分100分,有2人得99分,其余学生的数学成绩都不相同现从90分以上的学生中任取4人,不同分数的个数为,求的分布列及数学期望. 【答案】(1)平均分72分,众数为75分;(2)见解析. 【解析】 【分析】 把组中值看作各小组的平均数,根据加权平均数公式计算 根据组合数公式计算各种情况的概率,得出分布列及数学期望 【详解】 (1) 分, 众数为75分. 分以上的人数为人. 的可能取值为2,3,4, , , . 的分布列为: 2 3 4 P 的数学期望是. 【点睛】 本题考查了频率分布直方图,离散型随机变量的分布列和数学期望,属于中档题 44.中国海军,正在以不可阻挡的气魄向深蓝进军。在中国海军加快建设的大背景下,国产水面舰艇吨位不断增大、技术日益现代化,特别是国产航空母舰下水,航母需要大量高素质航母舰载机飞行员。为此中国海军在全国9省9所优质普通高中进行海航班建设试点培育航母舰载机飞行员。2017年4月我省首届海军航空实验班开始面向全省遴选学员,有10000名初中毕业生踊跃报名投身国防,经过文化考试、体格测试、政治考核、心理选拔等过程筛选,最终招收50名学员。培养学校在关注学员的文化素养同时注重学员的身体素质,要求每月至少参加一次野营拉练活动(下面简称“活动”)并记录成绩.10月某次活动中海航班学员成绩统计如图所示: (Ⅰ)根据图表,试估算学员在活动中取得成绩的中位数(精确到); (Ⅱ)根据成绩从、两组学员中任意选出两人为一组,若选出成绩分差大于 ,则称该组为“帮扶组”,试求选出两人为“帮扶组”的概率. 【答案】(1)见解析;(2)选出两人为帮扶组的概率. 【解析】 【分析】 (1)根据中位数定义,根据概率列方程,即得结果,(2)先利用枚举法确定总事件数,再从中确定选出两人为帮扶组事件数,最后根据古典概型概率公式求结果. 【详解】 (Ⅰ)由频率分布直方图可知:成绩在频率为,成绩在频率为,成绩在频率为,成绩在频率为,成绩在频率为, 可知中位数落在组中,设其为,则,得 (Ⅱ)海航班共50名学员,成绩在组内有人,设为, 成绩在组内有人,设为,从中选两人有、、、、、、、、、、、、、、共15种; 而“帮扶组”有、、、、、、、8种,故选出两人为帮扶组的概率. 【点睛】 古典概型中基本事件数的探求方法 (1)列举法. (2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法. (3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化. 45.某地级市共有200000中小学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000 元。经济学家调查发现,当地人均可支配年收入较上一年每增加,一般困难的学生中有会脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生中有转为一般困难,特别困难的学生中有转为很困难。现统计了该地级市2013年到2017年共5年的人均可支配年收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份取13时代表2013年, 与(万元)近似满足关系式,其中为常数。(2013年至2019年该市中学生人数大致保持不变) 其中, (Ⅰ)估计该市2018年人均可支配年收入; (Ⅱ)求该市2018年的“专项教育基金”的财政预算大约为多少? 附:对于一组具有线性相关关系的数据,其回归直线方程 的斜率和截距的最小二乘估计分别为 【答案】(Ⅰ)2.8(万);(Ⅱ)1624万. 【解析】 【分析】 根据表中数据求出回归方程的系数,从而得到回归直线方程,代入,即可解出结果 由题意知年时该市享受“国家精准扶贫”政策的学生共人,一般困难、很困难、特别困难的中学生依次为人,人,人,按照增长比例关系求解年时该市享受“国家精准扶贫”政策的学生,即可求出财政预算。 【详解】 (Ⅰ)因为,所以. 由得, 所以, ,所以,所以. 当时,2018年人均可支配年收入(万) 【点睛】 本题考查了线性回归方程,题目内容较多,需要提取出关键数据,然后按照公式进行求解,整体难度不大,较为基础。 46.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:万元)对年销售量(单位:吨)和年利润(单位:万元)的影响.对近六年的年宣传费和年销售量 的数据作了初步统计,得到如下数据: 年份 2012 2013 2014 2015 2016 2017 年宣传费(万元) 38 48 58 68 78 88 年销售量(吨) 16.8 18.8 20.7 22.4 24.0 25.5 经电脑模拟,发现年宣传费(万元)与年销售量(吨)之间近似满足关系式.对上述数据作了初步处理,得到相关的值如下表: 75.3 24.6 18.3 101.4 (Ⅰ)根据所给数据,求关于的回归方程; (Ⅱ)已知这种产品的年利润与的关系为.若想在2018年达到年利润最大,请预测2018年的宣传费用是多少万元? 附:对于一组数据,其回归直线中的斜率和截距的最小二乘估计分别为 【答案】(1)(2)当2018年的宣传费用为98万元时,年利润有最大值. 【解析】 【分析】 (Ⅰ)对两边取对数得,令 得,利用最小二乘法求出得,由此能求出关于的回归方程; (Ⅱ)由(Ⅰ)知,年利润的预报值为,由此预测2018年的宣传费用. 【详解】 (Ⅰ)对两边取对数得,令 得,由题给数据,得: , , ,于是 , , 得,故所求回归方程为. (Ⅱ)由(Ⅰ)知,年利润的预报值为 ,所以当即时,有最大值. 故当2018年的宣传费用为98万元时,年利润有最大值. 【点睛】 本题考查回归方程的求法,二次函数的最值,属于基础题. 47.长春市统计局对某公司月收入在元内的职工进行一次统计,并根据所得数据画出样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示职工月收入在区间内,单位:元). (Ⅰ)请估计该公司的职工月收入在内的概率; (Ⅱ)根据频率分布直方图估计样本数据的中位数和平均数. 【答案】(Ⅰ)0.3;(Ⅱ)中位数和平均数的估计值都是. 【解析】 【分析】 (Ⅰ)由频率分布直方图计算可得职工月收入在内的概率为; (Ⅱ)利用面积相等可得中位数的估计值为;利用平均数公式计算可得平均数的估计值为. 【详解】 (Ⅰ)职工月收入在内的概率为; 【点睛】 利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 48.我国是世界严重缺水的国家,城市缺水问题较为突出,某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准(吨),用水量不超过的部分按平价收费,超过的部分按议价收费,为了了解全市民月用水量的分布情况,通过抽样,获得了100位居民某年的月用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图. (Ⅰ)若全市居民中月均用水量不低于3吨的人数为3.6 万,试估计全市有多少居民?并说明理由; (Ⅱ)若该市政府拟采取分层抽样的方法在用水量吨数为和之间选取7户居民作为议价水费价格听证会的代表,并决定会后从这7户家庭中按抽签方式选出4户颁发“低碳环保家庭”奖,设为用水量吨数在中的获奖的家庭数,为用水量吨数在中的获奖家庭数,记随机变量,求的分布列和数学期望. 【答案】(Ⅰ)30万;(Ⅱ). 【解析】 【分析】 (1)由图,不低于3吨人数所占百分比为,解出即可得出. (2)由概率统计相关知识,各组频率之和的值为1,频率,,可得,得a.据题意可知随机变量的取值为0,2,4.利用相互独立、互斥事件的概率计算公式即可得出. 【详解】 (Ⅰ)由图,不低于3吨人数所占百分比为 所以假设全市的人数为(万人),则有,解得 所以估计全市人数为30万. 其分布列为: 0 2 4 期望为:. 【点睛】 本题考查了相互独立、互斥事件的概率计算公式及其数学期望计算公式、频率分布直方图的性质及其应用,考查了推理能力与计算能力,属于中档题. 49.我国是世界严重缺水的国家,城市缺水问题较为突出,某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准(吨),用水量不超过的部分按平价收费,超过的部分按议价收费,为了了解全市民月用水量的分布情况,通过抽样,获得了100位居民某年的月用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图. (Ⅰ)求直方图中的值; (Ⅱ)已知平价收费标准为元/吨,议价收费标准为元/吨,当时,估计该市居民的月平均水费.(同一组中的数据用该组区间的中点值代替) 【答案】(1);(2)8.42. 【解析】 【分析】 (1)根据频率分布直方图的意义,面积和为概率和,等于1,列式即可得到参数值;(2)根据题干条件列式得到,根据题意得到居民每月的水费数据分组与频率分布表,由公式得到平均数. 【详解】 (Ⅰ)由频率分布直方图,可得, 解得 (Ⅱ)设居民月用水量为吨,相应的水费为元, 则即 由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下: 组号 1 2 3 4 5 6 7 8 9 分组 频率 0.04 0.08 0.15 0.20 0.26 0.15 0.06 0.04 0.02 根据题意,该市居民的月平均水费估计为 【点睛】 本题考查的知识点是频率分布直方图,用样本估计总体,考查计算能力,难度不大,属于中档题.有关频率分布直方图的考查常见的有:众数,中位数,平均数的计算等,众数即出现次数最多的数据,中位数即最中间的数据,平均数即将所有数据加到一起,除以数据个数. 50.某电视节目为选拔出现场录制嘉宾,在众多候选人中随机抽取100名选手,按选手身高分组,得到的频率分布表如图所示. (Ⅰ)请补充频率分布表中空白位置相应数据,再在答题纸上完成下列频率分布直方图; (Ⅱ)为选拔出舞台嘉宾,决定在第3、4、5组中用分层抽样抽取6人上台,求第3、4、5组每组各抽取多少人? (Ⅲ)在(Ⅱ)的前提下,电视节目主持人会在上台6人中随机抽取2人表演节目,求第4组至少有一人被抽取的概率? 【答案】(Ⅰ)见解析(Ⅱ)3人,2人,1人;(Ⅲ) 【解析】 【分析】 (Ⅰ)根据频率、频数与样本容量的关系,求出对应的数值,画出频率分布直方图;(Ⅱ)利用分层抽样原理,求出各小组应抽取的人数;(Ⅲ )利用列举法求出基本事件数,计算对应的概率值. 【详解】 (Ⅰ)由题可知,第2组的频数为 人,第3组的频率为频率分布直方图: (Ⅱ)因为第3,4,5组共有60名观众,所以利用分层抽样. 在60人中抽取6人,每组人数为:3人,2人,1人; (Ⅲ)设第3组的3人分别是:;第4组的2人分别是:;第5组的1人是:.从中抽取两人的可能有:共有15种不同可能性 ∴第4组至少有一人被抽取的概率. 【点睛】 古典概型中基本事件数的探求方法 (1)列举法. (2)树状图法:适合于较为复杂的问题中的基本事件的探求,对于基本事件有“有序”与“无序”区别的题目,常采用树状图法. (3)列表法:适应于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化. 查看更多