- 2021-05-29 发布 |
- 37.5 KB |
- 20页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
专题15+统计的命题规律-名师揭秘2019年高考数学(理)命题热点全覆盖
【学习目标】 1.会收集现实问题中两个有关联变量的数据并作出散点图,会利用散点图直观认识变量间的相关关系; 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程; 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用; 4.了解回归的基本思想、方法及简单应用. 【知识要点】 1.抽样方法 (1)抽样要具有随机性、等可能性,这样才能通过对样本的分析和研究更准确的反映总体的情况,常用的抽样方法有简单随机抽样、系统抽样和分层抽样. (2)简单随机抽样是指一个总体的个数为(较小的有限数),通过逐个抽取一个样本,且每次抽取时每个个体被抽取的概率相等.简单随机抽样的两种常用方法为抽签法和随机数表法. (3)分层抽样是总体由差异明显的几部分组成,常将总体按差异分成几个部分,然后按各部分所占比例抽样,其中所分成的各部分叫做层. (4)系统抽样是当总体中的个数较多时,将总体均分成几部分,按事先按确定的在各部分抽取. 2.总体分布的估计 (1)作频率分布直方图的步骤: ①求极差(即一组数据中最大值与最小值的差) ②决定组距与组数 ③将数据分组 ④列频率分布表(下图) 分组 频数 频率 累计频率 … … … … ⑤画频率分布直方图,将区间 标在横轴上,纵轴表示频率与组距的比值,以每个组距为底,以各频率除以组距的商为高,分别画矩形,共得个矩形,这样得到的图形叫频率分布直方图. 频率分布直方图的性质:①第个矩形的面积等于样本值落入区间的频率;②由于,所以所有小矩形的面积的和为1. (2)连接频率分布直方图中各小长方形上边的中点,就得到频率分布折线图,随着样本容量的增加,折线图会越来越近似于一条光滑曲线,称之为总体密度曲线. (3)统计中还有一种被用来表示数据的图叫茎叶图,茎是中格中间的一列数,叶是从茎旁边长出来的一列数. 用茎叶图表示数据有两个突出的优点:一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录,方便记录与表示. 3.平均数和方差的计算 (1)如果有个数据,则 叫做这组数据的平均数, 叫做这组数据的方差,而叫做标准差. (2)公式 (3)当一组数据中各数较大时,可以将各数据减去一个适当的常数,得到,…,,则 4.利用频率分布直方图估计样本的数字特征 (1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数值. (2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. 6.独立性检验 (1)分类变量 用变量的不同“值”,表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等. (2)列联表:即列出两个分类变量的频数表:一般地,假设有两个分类变量和,它们的值域分别为和,其样本频数列联表(称为2×2列联表)为: 合计 合计 其中为样本容量. (3)可以利用独立性检验来考察两个分类变量是否有关系,并且能较为准确地给出这种判断的可靠程度,具体做法是:根据观测数据计算由公式所给出的检验随机变量的观测值,并且的值越大,说明“与有关系”成立的可能性越大,同时可以利用以下数据来确定“与有关系”的可信程度. 这种利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 三.高考命题类型分析 (一)随机抽样 例1.从2018名学生中选取50名学生参加某一活动,若采用下面的方法选取:先用简单随机抽样从2018人中剔除18人,剩下的2000人再按系统抽样的方法抽取50人,则在这2018人中,每个人入选的概率 ( ) A.不全相等 B.均不相等 C.都相等,且为 D.都相等,且为 【答案】C 【解析】由简单随机抽样和系统抽样都是等可能抽样,从个个体中抽取个个体,则每个个体被抽到的概率都等于,即可得解. 练习1.下列说法中错误的是( ) A.先把高二年级的2000名学生编号为1到2000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为,然后抽取编号为,,的学生,这样的抽样方法是系统抽样法; B.独立性检验中,越大,则越有把握说两个变量有关; C.若两个随机变量的线性相关性越强,则相关系数的值越接近于1; D.若一组数据1、a、3的平均数是2,则该组数据的方差是. 【答案】C 【解析】对选项逐个进行分析,排除即可得到答案. 【详解】对于A,根据个体数目较多,且没有明显的差异,抽取样本间隔相等,知这种抽样方法是系统抽样法,∴A正确; 对应B,独立性检验中,越大,应该是说明两个变量有关系的可能性大,即有足够的把握说明两个变量有关,B正确; 对于C,两个随机变量的线性相关性越强,则相关系数|r|的值越接近于1,C错误; 对于D,一组数据1、a、3的平均数是2,∴a=2; ∴该组数据的方差是s2=×[(1﹣2)2+(2﹣2)2+(3﹣2)2]=,D正确. 故选:C. (二)样本估计总体 例2.某校高一年级有甲,乙,丙三位学生,他们前三次月考的物理成绩如表: 第一次月考物理成绩 第二次月考物理成绩 第三次月考物理成绩 学生甲 80 85 90 学生乙 81 83 85 学生丙 90 86 82 则下列结论正确的是( ) A.甲,乙,丙第三次月考物理成绩的平均数为86 B.在这三次月考物理成绩中,甲的成绩平均分最高 C.在这三次月考物理成绩中,乙的成绩最稳定 D.在这三次月考物理成绩中,丙的成绩方差最大 【答案】C 【解析】由表格中数据,利用平均数公式以及方差的定义与性质,对选项中的命题逐一判断正误即可. 【详解】 故选C. 上购物经历的人数,所得数据的茎叶图如图所示,则这20个班有网购经历的人数的众数为( ) A.24 B.37 C.35 D.48 【答案】C 【解析】根据茎叶图中的数据,利用众数的定义写出结果. 【点睛】本题主要考查利用茎叶图求众数,意在考查对基础知识的掌握与应用,是基础题. 练习2.已知一组数据3,4,5,a,b的平均数是4,中位数是m,从3,4,5,a,b,m这组数据中任取一数,取到数字4的概率为,那么3,4,5,a,b这组数据的方差为( ) A. B.2 C. D. 【答案】D 【解析】根据3,4,5,a,b的平均数是4,中位数是m,从3,4,5,a,b,m这组数据中任取一数,取到数字4的概率为,可知,由方差公式求解即可. 【详解】因为从3,4,5,a,b,m这组数据中任取一数,取到数字4的概率为,所以3,4,5,a,b,m这6个数字中有4个4, 所以, 所以 故选D. (三)频率分布直方图 例3..例3..2017年APEC会议于11月10日至11日在越南岘港举行,某研究机构为了了解各年龄层对APEC会议的关注程度,随机选取了100名年龄在[20,45]内的市民举行了调查,并将结果绘制成如图所示的频率分布直方图(分组区间分布为[20,25),[25.30),[30,35),[35,40),[40,45]). (1)求选取的市民年龄在[30,35)内的人数; (2)若从第3,4组用分层抽样的方法选取5名市民进行座谈,再从中选取2人参与APEC会议的宣传活动,求参与宣传活动的市民中至少有一人的年龄在[35,40)内的概率. 【答案】(1)30; (2). 【解析】(1)由频率分布直方图可得年龄在内的频率为,从而可得结果;(2)利用分层抽样的方法可知,所选的5人中,从第3组选3人,从第4组选2人,利用列举法,求出总事件以及至少有一人的年龄在内的事件,再利用古典概型概率公式即可得出结果. 【详解】(1)由频率分布直方图可得年龄在[30,35)内的频率为0.06×5=0.3,则选取的市民年龄在[30,35)内的人数0.3×100=30; 练习2.如图是一组样本数据的频率分布直方图,则依据图形中的数据,可以估计总体的平均数与中位数分别是( ) A.12.5,12.5 B.13,13 C.13.5,12.5 D.13.5,13 【答案】B 【解析】本题首先要通过频率分布直方图得出第一组、第二组、第三组的频率,然后根据平均数的定义计算出平均数,最后根据中位数定义计算出中位数,即可得出答案。 【点睛】频率分布直方图问题需要注意: 在频率分布直方图中,小矩形的高表示频率/组距,而不是频率;利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。 练习3.某市要对2000多名出租车司机的年龄进行调査,现从中随机抽出100名司机,已知该市的司机年龄都在[20,45]之间,根据调査结果得出司机的年龄情况的频率分布直方图如图所示,估计该市出租车司机年龄在频率是( ) A.0.02 B.0.04 C.0.2 D.0.84 【答案】C 【解析】根据题意补全频率直方图,即可求出结果. 【详解】根据频率分布直方图知,在[20,30)岁之间的频率为 1﹣(0.01+0.07+0.06+0.02)×5=0.2, 故选:C (四)茎叶图 例4.将甲、乙两名同学5次物理测验的成绩用茎叶图表示如图,若甲、乙两人成绩的中位数分别为,则下列说法正确的是( ) A.;乙比甲成绩稳定 B.;甲比乙成绩稳定 C.;乙比甲成绩稳定 D.;甲比乙成绩稳定 【答案】A 【解析】中位数为把数据按顺序排列后,处于中间位置的数,分别写出甲乙的中位数即可比较其大小;茎叶图中,数据越集中就越稳定,因此可得乙比甲成绩稳定. 练习1.为比较甲、乙两地某月12时的气温状况,随机选取该月中的5天,将这5天中12时的气温数据(单位:)制成如图所示的茎叶图.考虑以下结论: ①甲地的平均气温低于乙地的平均气温; ②甲地的平均气温高于乙地的平均气温; ③甲地气温的标准差小于乙地气温的标准差; ④甲地气温的标准差大于乙地气温的标准差. 其中根据茎叶图能得到的统计结论的标号为( ) A.①③ B.①④ C.②③ D.②④ 【答案】B 【解析】由已知的茎叶图,我们易分析出甲、乙两地某月12时的气温抽取的样本温度,进而求出两组数据的平均数、方差,可得答案. 所以甲地该月12时的气温的标准差大于乙地该月12时的气温标准差. ①④正确,故选B. 练习1.已知一个样本数据x,1,5,其中点是直线和圆的交点,则这个样本的标准差为 A.5 B.2 C. D. 【答案】D 【解析】求出x,y的值,求出数据的平均数,从而求出数据的标准差即可. 【详解】由,解得:或, 故数据为:,1,3,5, 数据的平均数是2, 故数据的方差是, 故标准差是, 故选: D. 练习2.若样本的平均数是,方差是,则对样本,下列结论正确的是 ( ) A.平均数为14,方差为5 B.平均数为13,方差为25 C.平均数为13,方差为5 D.平均数为14,方差为2 【答案】C 【解析】根据平均数和方差的定义和性质进行求解即可. 【点睛】本题主要考查样本数据的方差和平均数的计算,根据相应的公式进行计算是解决本题的关键. (七)极差、方差、标准差 例7.已知某7个数的平均数为3,方差为,现又加入一个新数据3,此时这8个数的平均数为x,方差为,则( ) A., B., C., D., 【答案】B 【解析】由题设条件,利用平均数和方差的计算公式,进行求解,即可得到答案. 【详解】由题意,根据这7个数的平均数为3,方差为, 即,, 即, 现又加入一个新数据3,此时这8个数的平均数为, 方差为,即, 故选B. 练习1.在下列命题中,下列选项正确的是( ) A.在回归直线中,变量时,变量的值一定是15. B.两个变量相关性越强,则相关系数就越接近于1. C.在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关. D.若是两个相等的非零实数,则是纯虚数. 【答案】D 【解析】根据回归方程的定义判断;根据相关系数的定义判断;根据残差图的性质判断;根据纯虚数的定义判断. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查回归方程的定义、相关系数的定义、残差图的性质、纯虚数的定义,属于中档题.这种题型综合性较强,也是高考的命题热点,做这类题目要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的、自己已经掌握的知识点入手,然后集中精力突破较难的命题. (九)回归分析 例9.26.已知某商品的价格 (元)与需求量 (件)之间的关系有如下一组数据: x 14 16 18 20 22 y 12 10 7 5 3 ; 参考:; 当时 , , (1)求,; (2)求出回归直线方程; (3)计算相关系数r的值,并说明回归模型拟合程度的好坏。 【答案】(1);(2);(3),拟合效果好. 【解析】(1)由平均数公式计算x,y的平均值即可; (2)结合回归方程系数公式和(1)的结论求解回归方程即可; (3)利用相关系数的计算公式求得相关系数即可比较拟合效果的好坏. 【点睛】本题考查了线性回归方程的实际应用,线性回归方程的性质,相关系数的概念等,重点考查学生的计算能力和对基础概念的理解,属于中等题. 【解析】(1)根据散点图选择作为回归方程. (2)利用公式及所给数据计算回归方程后可估计月销售额. 练习1.某工厂每日生产一种产品吨,每日生产的产品当日销售完毕,日销售额为万元,产品价格随着产量变化而有所变化,经过一段时间的产销,得到了的一组统计数据如下表: (1)请判断与中,哪个模型更适合刻画之间的关系?可从函数增长趋势方面给出简单的理由; (2)根据你的判断及下面的数据和公式,求出关于的回归方程,并估计当日产量时,日销售额是多少?(结果保留整数) 参考公式及数据:线性回归方程中,,. , , 【答案】(1)答案见解析;(2)23万元. 【解析】分析:(1)从函数增长趋势考虑可知更适合刻画之间的关系. (2)由题意可得非线性回归方程为,据此预测当日产量时,日销售额是23万元. 详解:(1)更适合刻画之间的关系.理由如下: 值每増加1,函数值的増加量分别为7, 4, 3, 2,増加得越来越缓慢, 适合对数型函数的増长规律,与直线型函数的均匀増长存在较大差异, 故更适合刻画之间的关系. 点睛:本题主要考查非线性回归方程的求解,回归分析的数学思想等知识,意在考查学生的转化能力和计算求解能力. (十一)独立性检验 例11.《中华人民共和国道路交通安全法》第47条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,《中华人民共和国道路交通安全法》 第90条规定:对不礼让行人的驾驶员处以扣3分,罚款50元的处罚.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为统计数据: 月份 1 2 3 4 5 违章驾驶员人数 120 105 100 90 85 (1)请利用所给数据求违章人数与月份之间的回归直线方程; (2)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如下列联表:能否据此判断有的把握认为“礼让斑马线”行为与驾龄有关? 不礼让斑马线 礼让斑马线 合计 驾龄不超过1年 22 8 30 驾龄1年以上 8 12 20 合计 30 20 50 参考公式及数据: . (其中) 【答案】(1);(2)有的把握认为“礼让斑马线”行为与驾龄关. 【解析】(1)利用所给数据计算、,求出回归系数,写出回归直线方程; 所以的分布列为 (十二)分布列 例12.某有机水果种植基地试验种植的某水果在售卖前要成箱包装,每箱80个,每一箱水果在交付顾客之前要按约定标准对水果作检测,如检测出不合格品,则更换为合格品.检测时,先从这一箱水果中任取10个作检测,再根据检测结果决定是否对余下的所有水果作检测.设每个水果为不合格品的概率都为,且各个水果是否为不合格品相互独立. (Ⅰ)记10个水果中恰有2个不合格品的概率为,求取最大值时p的值; (Ⅱ)现对一箱水果检验了10个,结果恰有2个不合格,以(Ⅰ)中确定的作为p的值.已知每个水果的检测费用为1.5元,若有不合格水果进入顾客手中,则种植基地要对每个不合格水果支付a元的赔偿费用. (ⅰ)若不对该箱余下的水果作检验,这一箱水果的检验费用与赔偿费用的和记为X,求EX; (ⅱ)以检验费用与赔偿费用和的期望值为决策依据,当种植基地要对每个不合格水果支付的赔偿费用至少为多少元时,将促使种植基地对这箱余下的所有水果作检验? 【答案】(Ⅰ)0.2 (Ⅱ) (ⅰ) (ⅱ)8 【解析】 (Ⅰ)记10个水果中恰有2个不合格品的概率为,求得,利用导数即可求解函数的单调性,进而求得函数的最值. (Ⅱ)由(Ⅰ)知,(ⅰ)中,依题意知,,进而利用公式,即可求解; (ⅱ)如果对余下的水果作检验,得这一箱水果所需要的检验费为120元,列出相应的不等式,判定即可得到结论. 【详解】(Ⅰ)记10个水果中恰有2个不合格品的概率为f(p),则, ∴, 由,得. 且当时,;当时,. ∴的最大值点. 【点睛】本题主要考查了独立重复试验的概率的应用,以及二项分布的应用,其中解答中认真审题,分析试验过程,根据对立重复试验求得事件的概率,以及正确利用分布列的性质求解上解答的关键,着重考查了分析问题和解答问题的能力,属于中档试题. 练习2.在某次活动中,有5名幸运之星.这5名幸运之星可获得、两种奖品中的一种,并规定:每个人通过抛掷一枚质地均为的骰子决定自己最终获得哪一种奖品(骰子的六个面上的点数分别为1点、2点、3点、4点、5点、6点),抛掷点数小于3的获得奖品,抛掷点数不小于3的获得奖品. (1)求这5名幸运之星中获得奖品的人数大于获得奖品的人数的概率; (2)设、分别为获得、两种奖品的人数,并记,求随机变量的分布列及数学期望. 【答案】(1);(2),的分布列见解析. 【解析】首先求出5名幸运之星中,每人获得A奖品的概率和B奖品的概率.(1)获得A奖品的人数大于获得B奖品的人数,得到获得A奖品的人数可能为3,4,5,利用独立重复试验求得概率;(2)由ξ=|X﹣Y|,可得ξ的可能取值为1,3,5,同样利用独立重复试验求得概率,然后列出频率分布表,代入期望公式求期望. 【详解】这5名幸运之星中,每人获得奖品的概率为,奖品的概率为. (1)要获得奖品的人数大于获得奖品的人数,则奖品的人数可能为3,4,5,则 所求概率为. 所以的分布列是: 1 3 5 故随机变量的数学期望. 练习3.随着经济的发展,个人收入的提高.自2018年10月1日起,个人所得税起征点和税率的调整.调整如下:纳税人的工资、薪金所得,以每月全部收入额减除5000元后的余额为应纳税所得额.依照个人所得税税率表,调整前后的计算方法如下表: (1)假如小李某月的工资、薪金等所得税前收入总和不高于8000元,记表示总收入,y表示应纳的税,试写出调整前后y关于的函数表达式; (2)某税务部门在小李所在公司利用分层抽样方法抽取某月100个不同层次员工的税前收入,并制成下面的频数分布表: ①先从收入在[3000,5000)及[5000,7000)的人群中按分层抽样抽取7人,再从中选4人作为新纳税法知识宣讲员,用a表示抽到作为宣讲员的收入在[3000,5000)元的人数,b表示抽到作为宣讲员的收入在[5000,7000)元的人数,随机变量,求Z的分布列与数学期望; ②小李该月的工资、薪金等税前收入为7500元时,请你帮小李算一下调整后小李的实际收入比调整前增加了多少? 【答案】(1)见解析;(2)见解析 【解析】 (1) 依照个人所得税税率表,调整前后的计算方法表示调整前后y关于的函数表达式; (2) ①由频数分布表可知Z的取值可能为0,2,4,求出相应的概率值得到分布列与期望值,②由于小李的工资、薪金等收入为7500元,按调整前起征点应纳个税为295元,按调整后起征点应纳个税为75元,从而得到结果. (2)①由频数分布表可知从[3000,5000)及[5000,7000)的人群中抽取7人,其中[3000,5000)中占3人,[5000,7000)的人中占4人,再从这7人中选4人,所以Z的取值可能为0,2,4,(5分) , , , 所以其分布列为 Z 0 2 4 P 所以 ②由于小李的工资、薪金等收入为7500元,按调整前起征点应纳个税为1500×3%+2500×10%=295元; 按调整后起征点应纳个税为2500×3%=75元, 【点睛】 本题考查频率分布直方图的应用,考查平均数的计算,考查二项分布中期望的求法,是中档题. 练习5.某企业对设备进行升级改造,现从设备改造前后生产的大量产品中各抽取了100件产品作为样本,检测一项质量指标值,若该项指标值落在[20,40)内的产品视为合格品,否则为不合格品,图1是设备改造前样本的频率分布直方图,表1是设备改造后的频数分布表. 表1,设备改造后样本的频数分布表: 质量指标值 频数 2 18 48 14 16 2 (1)请估计该企业在设备改造前的产品质量指标的平均数; (2)企业将不合格品全部销毁后,并对合格品进行等级细分,质量指标值落在[25,30)内的定为一等品,每件售价240元,质量指标值落在[20,25)或[30,35)内的定为二等品,每件售价180元,其它的合格品定为三等品,每件售价120元.根据表1的数据,用该组样本中一等品、二等品、三等品各自在合格品中的频率代替从所有产品中抽到一件相应等级产品的概率,现有一名顾客随机购买两件产品,设其支付的费用为X(单位:元),求X得分布列和数学期望. 【答案】(1) 30.2;(2)分布列见解析, 400. 【解析】(1)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(2)的可能取值为:240, 300,360, 420, 480,根据直方图求出样本中一、二、三等品的频率分别为,利用独立事件与互斥事件概率公式求出各随机变量对应的概率,从而可得分布列,进而利用期望公式可得的数学期望. (2)根据样本频率分布估计总体分布,样本中一、二、三等品的频率分别为, 故从所有产品中随机抽一件,是一、二、三等品的概率分别为, 随机变量的取值为:240, 300,360, 420, 480, ; , , 所以随机变量的分布列为: 240 300 360 420 480 . 【点睛】本题主要考查直方图的应用,互斥事件的概率公式、独立事件同时发生的概率公式以及离散型随机变量的分布列与数学期望,属于中档题. 求解数学期望问题,首先要正确理解题意,其次要准确无误的找出随机变量的所有可能值,计算出相应的概率,写出随机变量的分布列,正确运用均值、方差的公式进行计算,也就是要过三关:(1)阅读理解关;(2)概率计算关;(3)公式应用关. 查看更多