专题11-2 统计与统计案例-3年高考2年模拟1年原创备战2017高考精品系列之数学(文)(解析版)

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

专题11-2 统计与统计案例-3年高考2年模拟1年原创备战2017高考精品系列之数学(文)(解析版)

www.ks5u.com ‎2017年高考备考之 ‎3年高考2年模拟1年原创 第十一章 概率与统计 专题2 统计与统计案例(文科)‎ ‎【三年高考】‎ ‎1. 【2016高考新课标3文数】某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和 平均最低气温的雷达图.图中点表示十月的平均最高气温约为,点表示四月的平均最低气温约为 ‎.下面叙述不正确的是( )‎ ‎(A)各月的平均最低气温都在以上 (B)七月的平均温差比一月的平均温差大 ‎(C)三月和十一月的平均最高气温基本相同 (D)平均气温高于的月份有5个 ‎【答案】D ‎【解析】由图可知均在虚线框内,所以各月的平均最低气温都在0℃以上,A正确;由图可在七月的平均温差大于,而一月的平均温差小于,所以七月的平均温差比一月的平均温差大,B正确;由图可知三月和十一月的平均最高气温都大约在,基本相同,C正确;由图可知平均最高气温高于20℃的月份有3个或2个,所以不正确.故选D.‎ ‎2.‎ ‎ 【2016高考山东文数】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20), 20,22.5), 22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )‎ ‎(A)56 (B)60 (C)120 (D)140‎ ‎【答案】D ‎【解析】由频率分布直方图知,自习时间不少于22.5小时的有,选D.‎ ‎3. 【2016高考北京文数】某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.‎ 学生序号 ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ ‎9‎ ‎10‎ 立定跳远(单位:米)‎ ‎1.96‎ ‎1.92‎ ‎1.82‎ ‎1.80‎ ‎1.78‎ ‎1.76‎ ‎1.74‎ ‎1.72‎ ‎1.68‎ ‎1.60‎ ‎30秒跳绳(单位:次)‎ ‎63‎ a ‎75‎ ‎60‎ ‎63‎ ‎72‎ ‎70‎ a−1‎ b ‎65‎ 在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则 A.2号学生进入30秒跳绳决赛 B.5号学生进入30秒跳绳决赛 ‎ C.8号学生进入30秒跳绳决赛 D.9号学生进入30秒跳绳决赛 ‎【答案】B ‎【解析】将确定成绩的30秒跳绳成绩的按从大到小的顺寻排,分别是3,6,7,10,(1,5并列),4,其中,3,6,7号进了立定跳远的决赛,10号没进立定跳远的决赛,故9号需进30秒跳绳比赛的前8名,此时确定的30秒跳绳比赛决赛的名单为3,6,7,10,9,还需3个编号为1-8的同学进决赛,而(1,5)与4的成绩仅相隔1,故只能1,5,4进30秒跳绳的决赛,故选B.‎ ‎4.【2016高考新课标2文数】某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其 上年度出险次数的关联如下:‎ 上年度出险次数 ‎0‎ ‎1‎ ‎2‎ ‎3‎ ‎4‎ 保费 随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:‎ 出险次数 ‎0‎ ‎1‎ ‎2‎ ‎3‎ ‎4‎ 频数 ‎60‎ ‎50‎ ‎30‎ ‎30‎ ‎20‎ ‎10‎ ‎(Ⅰ)记A为事件:“一续保人本年度的保费不高于基本保费”.求的估计值;‎ ‎(Ⅱ)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.‎ 求的估计值;‎ ‎(III)求续保人本年度的平均保费估计值.‎ ‎【解析】(Ⅰ)事件A发生当且仅当一年内出险次数小于2.由所给数据知,一年内险次数小于2的频率为,故P(A)的估计值为0.55.‎ ‎5. 【2016高考新课标Ⅲ文数】]‎ 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 ‎(I)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;‎ ‎(II)建立关于的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.‎ 附注:‎ 参考数据:,,,≈2.646.‎ 参考公式:相关系数 ‎ 回归方程 中斜率和截距的最小二乘估计公式分别为:‎ ‎.‎ ‎【解析】(Ⅰ)由折线图这数据和附注中参考数据得,,,,.因为与的相关系数近似为0.99,说明与的线性相关相当高,从而可以用线性回归模型拟合与的关系.‎ ‎(Ⅱ)由及(Ⅰ)得,‎ ‎,所以,关于的回归方程为:.将2016年对应的代入回归方程得:,所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.‎ ‎6. 【2015高考重庆,文4】重庆市2013年各月的平均气温(°C)数据的茎叶图如下则这组数据中的中位数是( )‎ (A) ‎ 19 (B) 20 (C ) 21.5 (D )23‎ ‎【答案】B ‎【解析】由茎叶图可知总共12个数据,处在正中间的两个数是第六和第七个数,它们都是20,由中位数的定义可知:其中位数就是20,故选B.‎ ‎7.【2015高考陕西,文2】某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )‎ A.93 B.123 C.137 D.167‎ ‎【答案】‎ ‎【解析】由图可知该校女教师的人数为,故答案选.‎ ‎8.【2015高考湖北,文4】已知变量和满足关系,变量与正相关. 下列结论中正确的是( )‎ A.与负相关,与负相关 B.与正相关,与正相关 C.与正相关,与负相关 D.与负相关,与正相关 ‎【答案】.‎ ‎【解析】因为变量和满足关系,其中,所以与成负相关;又因为变量与正相关,不妨设,则将代入即可得到:,所以,所以与负相关,综上可知,应选.‎ ‎9.【2015高考广东,文17】某城市户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.‎ ‎(1)求直方图中的值;‎ ‎(2)求月平均用电量的众数和中位数;‎ ‎(3)在月平均用电量为,,,的四组用户中,用分层抽样的 方法抽取户居民,则月平均用电量在的用户中应抽取多少户?‎ ‎(3)月平均用电量为的用户有户,月平均用电量为的用户有户,月平均用电量为的用户有 户,月平均用电量为的用户有户,抽取比例,所以月平均用电量在的用户中应抽取户 ‎10. 【2014高考广东卷文第6题】为了了解名学生的学习情况,采用系统抽样的方法,从中抽取容量为的样本,则分段的间隔为( )‎ ‎ A. B. C. D.‎ ‎【答案】C ‎【解析】由题意知,分段间隔为,故选C.‎ ‎11. 【2014高考湖南卷文第3题】对一个容量为的总体抽取容量为的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为,则( )‎ ‎ ‎ ‎【答案】D ‎【解析】根据随机抽样的原理可得简单随机抽样,分层抽样,系统抽样都必须满足每个个体被抽到的概率相等,即,故选D.‎ ‎12. 【2014高考安徽卷文第17题】某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)‎ ‎(Ⅰ)应收集多少位女生样本数据?‎ ‎(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:.估计该校学生每周平均体育运动时间超过4个小时的概率. ‎ ‎(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有的把握认为“该校学生的每周平均体育运动时间与性别有关”.‎ 附:‎ ‎0.10‎ ‎0.05‎ ‎0.010‎ ‎0.005‎ ‎2.706‎ ‎3.841‎ ‎6.635‎ ‎7.879‎ ‎【解析】(1),所以应收集90位女生的样本数据.‎ (2) 由频率分布直方图得,该校学生每周平均体育运动时间超过4个小时的概率为.‎ (3) 由(2)知,300位学生中有人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:‎ 每周平均体育运动时间与性别列联表 男生 女生 总计 每周平均体育运动时间不超过4小时 ‎45‎ ‎30‎ ‎75‎ 每周平均体育运动时间超过4小时 ‎165‎ ‎60‎ ‎225‎ 总计 ‎210‎ ‎90‎ ‎300‎ 结合列联表可算得.‎ 有的把握认为“该校学生的每周平均体育运动时间与性别有关”.‎ ‎【三年高考命题回顾】‎ 纵观前三年各地高考试题, 考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算,以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数)主要以选择题、填空题为主;考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查一些基本的统计思想,在高考中多为选择、填空题,也有解答题出现.‎ ‎【2017年高考复习建议与高考命题预测】‎ 由前三年的高考命题形式可以看出,频率分布直方图、茎叶图、平均数、方差、,以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数)是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题常常作为第一问,考查学生应用知识解决问题的能力.独立性检验、回归分析高考对此部分内容考查有加强趋势,主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查一些基本的统计思想,在高考中多为选择、填空题,也有解答题出现.根据这几年高考试题预测2017年高考,频率分布直方图、茎叶图、平均数、方差仍然是考查的热点,同时应注意线性回归方程、独立性检验在实际生活中的应用,有可能涉及一道与独立检验有关的大题.‎ ‎【2017年高考考点定位】‎ 本知识点主要是:随机抽样常以选择、填空题考查分层抽样,难度较低.在用样本估计总体中,会读图、识图,会从频率分布直方图中分析样本的数字特征(众数、中位数、平均数等);重视茎叶图;要重视线性回归方程,不仅会利用公式求,还要能分析其特点(正相关、负相关、回归方程过样本点中心);重视独立性检验( 2×2列联表).‎ ‎【考点1】抽样方法、总体分布的估计 ‎【备考知识梳理】1.简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.‎ ‎2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 3.总体:在数理统计中,通常把被研究的对象的全体叫做总体.‎ ‎4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.‎ ‎【规律方法技巧】分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.‎ 解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=);(3)画出频率分布直方图,并作出相应的估计.‎ ‎【考点针对训练】‎ ‎1. 【2016届山西右玉一中高三下学期模拟】在某电视台举行的大型联欢会晚上,需抽调部分观众参加互动,已知全部观众有900人,现需要采用系统抽样方法抽取30人,根据观众的座位号将观众编号为1,2,3,…,900号,分组后在第一组,采用简单随机抽样的方法抽到的号码为3,抽到的30人中,编号落入区间的人与主持人一组,编号落入区间的人与支持人一组,其余的人与支持人一组,则抽到的人中,在组的人数为( )‎ A.12 B.8 C.7 D.6‎ ‎【答案】D ‎【解析】因,而,故依据系统抽样的特征可知抽到的人中,在组中的人数应是人,应选D。‎ ‎2. 【2016届河南省新乡卫辉一中高考押题一】博鳌亚洲论坛2015年会员大会于3月27日在海南博鳌举办,大会组织者对招募的100名服务志愿者培训后,组织一次 知识竞赛,将所得成绩制成如右频率分布直方图(假定每个分数段内的成绩均匀分布),组织者计划对成绩前20名的参赛者进行奖励.‎ ‎(1)试确定受奖励的分数线;‎ ‎(2)从受奖励的20人中利用分层抽样抽取5人,再从抽取的5人中抽取2人在主会场服务,试求2人成绩都在90分以上的概率.‎ ‎【解析】(1)由频率分布直方图知,竞赛成绩在分的人数为,竞赛成绩在的人数为,故受奖励分数线在之间,设受奖励分数线为,则,解得,故受奖励分数线为86.‎ ‎(2)由(1)知,受奖励的20人中,分数在的人数为8,分数在的人数为12,利用分层抽样,可知分数在 的抽取2人,分数在的抽取3人,设分数在的2人分别为,分数在的3人分别为,所有的可能情况有满足条件的情况有,所求的概率为 ‎【考点2】相关性、最小二乘估计与统计案例 ‎【备考知识梳理】1.相关性 ‎(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.‎ ‎(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.‎ ‎(3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关.‎ 如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.‎ ‎2.回归方程 ‎(1)最小二乘法 如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用表达式y1-(a+bx1)]2+y2-(a+bx2)]2‎ ‎+…+yn-(a+bxn)]2来刻画这些点与直线y=a+bx的接近程度,使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.‎ ‎(2)回归方程 方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a,b是待定参数.‎ ‎,‎ ‎3.回归分析 ‎(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.‎ ‎(2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘法估计分别为:‎ ‎,).其中=i,=i,(,)称为样本点的中心.‎ ‎(3)相关系数 ‎①,②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.‎ r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.‎ ‎4.独立性检验 ‎(1)设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=1;变量B:B1,B2=1.‎ ‎2×2列联表 ‎ B A ‎ B1‎ B2‎ 总计 A1‎ a b a+b A2‎ c d c+d 总计 a+c b+d a+b+c+d 构造一个随机变量其中为样本容量.‎ ‎(2)独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验.‎ ‎(3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断 ‎①当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;‎ ‎②当χ2>2.706时,有90%的把握判定变量A,B有关联;‎ ‎③当χ2>3.841时,有95%的把握判定变量A,B有关联;‎ ‎④当χ2>6.635时,有99%的把握判定变量A,B有关联.‎ ‎【规律方法技巧】1.“相关关系与函数关系”的区别:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.‎ ‎2.三点提醒: 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.‎ ‎3.正确理解计算b,a的公式和准确的计算是求线性回归方程的关键.回归直线方程y=bx+a必过样本点中心(,).在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.‎ ‎4.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式,计算值,值越大,说明“两个变量有关系”的可能性越大.‎ ‎【考点针对训练】‎ ‎1. 【2016年山西四校高三四模】某研究机构对儿童记忆能力和识图能力进行统计分析,得到如下数据:‎ 记忆能力 识图能力 由表中数据,求得线性回归方程为,,若某儿童的记忆能力为时,则他的识图能力约为( )‎ A.9.2 B.9.5 C.9.8 D.10‎ ‎【答案】B ‎2.【2016届河北省邯郸市高三下第二次模拟】为推行“新课堂”教学法,某化学老师分别用原传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班进行教学实验,为了解教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,作出的茎叶图如下图,记成绩不低于70分者为“成绩优良”.‎ ‎(1)分别计算甲、乙两班20个样本中,化学分数前十的平均分,并大致判断哪种教学方式的教学效果更 佳;‎ ‎(2)由以上统计数据填写下面2×2列联表,并判断“成绩优良与教学方式是否有关”?‎ 附:‎ 独立性检验临界值表 ‎【解析】(1)甲班样本化学成绩前十的平均分为;‎ 乙班样本化学成绩前十的平均分为 ‎.甲班样本化学成绩前十的平均分远低于乙班样本化学成绩前十的平均分,大致可以判断“高效课堂”教学方式的教学效果更佳.‎ ‎【应试技巧点拨】‎ ‎1.三种抽样方法的比较 类别 共同点 各自特点 相互联系 适用范围 简单随机抽样 抽样过程中每个个体被抽取的机会均等 从总体中逐个抽取 总体中的个体数较少 系统抽样 将总体均匀分成几部分,按事先确定的规则在各部分抽取 在起始部分抽样时采用简单随机抽样 总体中的个体数较多 分层抽样 将总体分成几层,分层进行抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成 ‎2.样本频率直方图与样本的数字特征 在频率分布直方图中,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;中位数的估计值,应使中位数左右两边的直方图面积相等;最高小长方形的中点所对应的数据值即为这组数据的众数.‎ ‎3.方差是刻画一组数据离散程度的量,方差越大,这组数据波动越大,越分散.讨论产品质量、售价高低、技术高低、产量高低、成绩高低、寿命长短等等问题,一般都是通过方差来体现.‎ ‎4.判断两变量是否有相关关系很容易将相关关系与函数关系混淆.相关关系是一种非确定性关系,即是非随机变量与随机变量之间的关系,而函数关系是一种因果关系.‎ ‎5.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同)‎ ‎6.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出回归直线方程.‎ ‎7.独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的随机变量,对假设的正确性进行判断.‎ ‎8.进行分层抽样时应注意以下几点:‎ ‎(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;‎ ‎(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性应相同;‎ ‎(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.‎ ‎9.在作茎叶图时,容易出现茎两边的数字不是从小到大的顺序排列,从而导致结论分析错误,在使用茎叶图整理数据时,要注意:一是数据不能遗漏,二是数据最好按从小到大顺序排列,对三组以上的数据,也可使用茎叶图,但没有表示两组记录那么直观、清晰.‎ ‎10.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.‎ ‎11.r的大小只说明是否相关并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的依据.‎ ‎12.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K2‎ ‎<2.076应判断为没有充分证据显示X与Y有关系,而不能作为小于90%的量化值来判断.‎ ‎1. 【2016年山西榆林高三二模】为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:‎ 收入(万元)‎ ‎8.2‎ ‎8.6‎ ‎10.0‎ ‎11.3‎ ‎11.9‎ 支出(万元)‎ ‎6.2‎ ‎7.5‎ ‎8.0‎ ‎8.5‎ ‎9.8‎ 根据上表可得回归直线方程,据此估计,该社区一户收入为15万元家庭年支出为( )‎ A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 ‎【答案】B ‎【解析】因为过点,所以,因此当时,,选B.‎ ‎2.【2016年河南八市重点高中质检】某疾病研究所想知道吸烟与患肺病是否有关,于是随机抽取1000名成年人调查是否吸烟及是否患有肺病,得到列联表,经计算得,已知在假设吸烟与患肺病无关的前提条件下, ,则该研究所可以( )‎ A.有95%以上的把握认为“吸烟与患肺病有关” B.有95%以上的把握认为“吸烟与患肺病无关”‎ C.有99%以上的把握认为“吸烟与患肺病有关” D.有99%以上的把握认为“吸烟与患肺病无关”‎ ‎【答案】A ‎【解析】根据查对临界值表知,故有的把握认为“吸烟与患肺病有关”,即A正确;‎ ‎3. 【2016年江西南昌高三一模】【来.源:全,品…中&高*考*网】为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5).根据收集到的数据可知x1+x2 +x3 +x4 +x5 =150,由最小二乘法求得回归直线方程为= 0.67x+ 54.9,则y1+y2+y3+y4+y5的值为 ‎(A)75 (B)155.4 (C)375 (D)466.2‎ ‎【答案】C ‎ 4. 【2016年广东广州高三一模】一个总体中有60个个体,随机编号0,1,2,…,59,依编号顺序平均分成6个小组,组号依次为1,2,3,…,60.现用系统抽样方法抽取一个容量为6的样本,若在第1组随机抽取的号码为3,则在第5组中抽取的号码是 .‎ ‎【答案】‎ ‎【解析】因为,所以,抽到编号为3、13、23、33、43、53,第5组为43.‎ ‎ 5. 【2016届湖南省四大名校高三3月联考】.以下四个命题中:‎ ‎①在回归分析中, 可用相关指数的值判断的拟合效果,越大,模型的拟合效果越好;‎ ‎②两个随机变量的线性相关性越强,相关系数的绝对值越接近;‎ ‎③若数据的方差为,则的方差为; ‎ ‎④对分类变量与的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.‎ 其中真命题的个数为( )‎ A. B. C. D. ‎ ‎【答案】B ‎ 6.【2016届河南省洛阳市高三毕业班三练】甲、乙、丙三个班各有20名学生,一次数学考试后,三个班学生的成绩与人数统计如下:‎ 分别表示甲、乙、丙三个班本次考试成绩的标准差,则( )‎ A. B. C. D.‎ ‎【答案】A ‎【解析】由标准差的几何意义得,数据越稳定,标准差越小;数据越接近均值,数据越稳定,因此最偏离均值,数值最大,而最接近均值,数值最小,因此选A.‎ ‎ 7. 【2016届北京市大兴区高三4月统一练习】.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分(10分制)如图所示,假设得分的中位数,众数为,平均数为,则,,之间的大小关系是_____.‎ ‎【答案】‎ ‎8. 【2016届四川省成都市石室中学高三5月一模】某学科考试共有100道单项选择题,有甲、乙两种计分法.已知某学生有道题答对,道题答错,道题未作答,按甲计分法的得分为,按乙计分法该生的得分为,某班50名学生参加了该科考试,现有如下结论:‎ ‎①同一同学的分数不可能大于分数;‎ ‎②任意两个学生分数之差的绝对值不可能大于分数之差的绝对值;‎ ‎③用分数将全班排名次的结果与用分数将全班排名次的结果是完全相同的;‎ ‎④分数与分数是正相关的.‎ 其中的真命题有 .(写出所有真命题的序号)‎ ‎【答案】①③④‎ ‎【解析】,所以同一同学的分数不可能大于分数;当两个学生一个答对一道,未作答10道;另一个答对两道,未作答5道时,分数之差的绝对值为零,而分数之差的绝对值大于零;,所以③④正确,因此真命题有①③④‎ ‎ 9.【2016届湖南省四大名校高三3月联考】年下学期某市教育局对某校高三文科数学进行教学调研,从该校文科生中随机抽取名学生的数学成绩进行统计,将他们的成绩分成六段后得到如图所示的频率分布直方图.‎ ‎(1)求这个学生数学成绩的众数和中位数的估计值;‎ ‎(2)若从数学成绩内的学生中任意抽取人,求成绩在中至少有一人的概率.‎ ‎【解析】(1)众数的估计值为最高矩形对应的成绩区间的中点,即众数的估计值为.设中位数的估计值为,则,解得.中位数的估计值为.‎ ‎(2)从图中知,成绩在的人数为(人), 成绩在的人数为(人), 设成绩在的学生记为,成绩在的学生记为.则从成绩在内的学生中任取人组成的基本事件有,共种.其中成绩在的学生至少有一人的基本事件有共种.成绩在 的学生至少有一人的概率为.‎ ‎ 10. 【2016届广东省深圳市高三第二次调研】2016年全国两会,即中华人民共和国第十二届全国人民代表大会第四次会议和中国人民政治协商会议第十二届全国委员会第四次会议,分别于2016年3月5日和3月3日在北京开幕.为了解哪些人更关注两会,某机构随机抽取了年龄在岁之间的100人进行调查,并按年龄绘制的频率分布直方图如下图所示,其分组区间为:.把年龄落在区间和内的人分别称为“青少年人”和“中老年人”,经统计“青少年人”与“中老年人”的人数之比为9:11.‎ ‎(1)求图中的值;‎ ‎(2)若“青少年人”中有15人在关注两会,根据已知条件完成下面的列联表,根据此统计结果能否 有99%的把握认为“中老年人”比“青少年人”更加关注两会?‎ 关注 不关注 合计 青少年人 ‎15‎ 中老年人 合计 ‎50‎ ‎50‎ ‎100‎ 附参考公式:,其中. ‎ 临界值表:‎ ‎0.05‎ ‎0.010‎ ‎0.001‎ ‎3.841‎ ‎6.635‎ ‎10.828‎ ‎【解析】(1)依频率分布直方图可知:,解之,得.‎ ‎(2)依题意可知:“青少年人”共有人,“中老年人”共有100-45=55人,完成的列联表如下:‎ 关注 不关注 合计 青少年人 ‎15‎ ‎30‎ ‎45‎ 中老年人 ‎35‎ ‎20‎ ‎55‎ 合计 ‎50‎ ‎50‎ ‎100‎ 结合列联表的数据得:,因为,所以有超过99%的把握认为“中老年人”比“青少年人”更加关注两会. ‎ ‎ 11.【2015届湖北省武汉华中师大附中高三5月】在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大依次构成等比数列,已知,且样本容量为300,则对应小长方形面积最小的一组的频数为 A.20 B.40 C.30 D.无法确定 ‎【答案】A ‎【解析】由已知,4个小长方形面积依次为,所以,,因此面积最小的一组的频数为.‎ ‎12.【2015届中国人民大学附属中学高考冲刺十】某赛季甲、乙两名篮球运动员各13场比赛得分情况用茎叶图表示如下:‎ 根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是( )‎ A.甲运动员得分的极差大于乙运动员得分的极差 B.甲运动员得分的的中位数大于乙运动员得分的的中位数 C.甲运动员的得分平均值大于乙运动员的得分平均值 D.甲运动员的成绩比乙运动员的成绩稳定 ‎【答案】D ‎【解析】根据茎叶图可知:甲运动员得分:19 18 18 26 21 20 35 33 32 30 47 41 40;乙运动员得分:17 17 19 19 22 25 26 27 29 29 30 32 33,对于A,极差是数据中最大值与最小值的差,由图中的数据可得甲运动员得分的极差为47-16=21,乙运动员得分的极差为33-17=16,得甲运动员得分的极差大于乙运动员得分的极差,因此A正确;对于B,甲数据从小到大排列:18 18 19 20 21 26 30 32 33 35 40 41 47处于中间的数是30,所以甲运动员得分的中位数是30,同理求得乙数据的中位数是26,因此甲运动员得分的中位数大于乙运动员得分的中位数,故B正确;对于C,不难得出甲运动员的得分平均值约为29.23,乙运动员的得分平均值为25.0,因此甲运动员的得分平均值大于乙运动员的得分平均值,故C正确;对于D,分别计算甲、乙两个运动员得分的方差,方差小的成绩更稳定.可以算出甲的方差为:,同理,得出乙的方差为:,因为乙的方差小于甲的方差,所以乙运动员的成绩比甲运动员的成绩稳定,故D不正确.故选D ‎13.【2015届中国人民大学附属中学高考冲刺一】为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为,,则它们的大小关系为 .(用“”连接)‎ ‎【答案】‎ ‎14.【2016届广东省惠州市高三第一次调研】某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85.‎ ‎(I)计算甲班7位学生成绩的方差;‎ ‎(II)从成绩在90分以上的学生中随机抽取两名学生,求甲班至少有一名学生的概率.‎ 参考公式:‎ 方差,其中.‎ ‎【解析】(I)∵甲班学生的平均分是85,∴.∴. 则甲班7位学生成绩的方差为.‎ ‎15.【2015届宁夏固原市第一中学高三最后冲刺模拟】为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前次考试的数学成绩、物理成绩进行分析.下面是该生次考试的成绩.‎ 数学 ‎88‎ ‎83‎ ‎117‎ ‎92‎ ‎108‎ ‎100‎ ‎112‎ 物理 ‎94‎ ‎91‎ ‎108‎ ‎96‎ ‎104‎ ‎101‎ ‎106‎ ‎(1)他的数学成绩与物理成绩哪个更稳定?请给出你的理由;‎ ‎(2)已知该生的物理成绩与数学成绩是线性相关的,若该生的物理成绩达到分,请你估计他的数学成绩大约是多少? ‎ ‎(已知8894+8391+117108+9296+108104+100101+112106=70497,‎ ‎)‎ ‎(参考公式:,)‎ ‎【解析】(1); ; ,,从而,所以物理成绩更稳定.‎ ‎(2)由于与之间具有线性相关关系,根据回归系数公式得到,‎ ‎ 线性回归方程为.当时,.‎ ‎【一年原创真预测】‎ ‎1.2016年2月,为保障春节期间的食品安全,某市质量监督局对超市进行食品检查,如图所示是某品牌食品中微量元素含量数据的茎叶图,已知该组数据的平均数为,则的最小值为( )‎ A. 9 B. C.8 D.4‎ ‎【答案】B ‎【入选理由】本题主要考查茎叶图的识别、样本数据的平均数以及均值不等式求解最值等基础知识,意在考查学生处理数据的能力,分析问题解决问题的能力和运算求解能力.茎叶图是高中添加知识,是高考考试的重点,故选此题.‎ ‎2.若样本数据的平均数为10,则数据,,…,,的平均数为 .‎ ‎【答案】37‎ ‎【解析】设数据,,…,的平均数为,由已知得,‎ 所以.‎ ‎【入选理由】本题主要考查平均数等基础知识,意在考查学生分析问题解决问题的能力和运算求解能力.此题常规题,也是常考知识,故选此题.‎ ‎3.为了解决低收入家庭的住房问题,某城市修建了首批108套住房,已知三个社区分别有低收入家庭360户,270户,180户,现采用分层抽样的方法决定各社区所分配首批经济住房的户数,则应从社 区抽取低收入家庭的户数为( )‎ A.48 B.36 C.24 D.18‎ ‎【答案】‎ ‎【解析】根据分层抽样的要求可知在社区抽取户数为.‎ ‎【入选理由】本题主要考查分层抽样的概念及其应用等基础知识,意在考查学生分析问题解决问题的能力和运算求解能力.抽样方法也是高考常考知识,故选此题.‎ ‎4.某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则的值是( )‎ A.10     B.11     C.12     D.13‎ ‎【答案】C ‎【解析】由题意,得甲组中,解得.乙组中,所以,所以,故选C.‎ ‎【入选理由】本题主要考查茎叶图、平均数、中位数等基础知识,意在考查学生处理数据的能力,分析问题解决问题的能力和运算求解能力.茎叶图是高中添加知识,是高考考试的重点,故选此题.‎ ‎5.2016年高考体检,某中学随机抽取名女学生的身高(厘米)和体重(公斤)的数据如下表:‎ x ‎165‎ ‎160‎ ‎175‎ ‎155‎ ‎170‎ y ‎58‎ ‎52‎ ‎62‎ ‎43‎ ‎60‎ ‎ 根据上表可得回归直线方程为,则( )‎ ‎ A. B. C. D.‎ ‎ 【答案】A ‎ 【解析】由表中数据可得,∵点一定在回归直线方程上,‎ ‎ ∴,解得.故选A.‎ ‎【入选理由】本题考查考查散点图、线性回归方程等基础知识,意在考查考生分析问题解决问题的能力,运算求解能力.近年高考加强了对线性回归方程的考查,应多注意,故选此题.‎ ‎6.某工厂为了了解一批产品的净重(单位:克)情况,从中随机抽测了200件产品的净重,所得数据均在区间96,106]上,其频率分布直方图如图所示,已知各个小方形按高度依次构成一个等差数列,则在抽测的200件产品中,净重在区间上的产品件数是 .‎ ‎【答案】100‎ ‎【入选理由】本题主要考查频率分布直方图,等差数列等基础知识,意在考查学生读图和将图中信息转化成所求问题必需的条件的能力,分析问题解决问题的能力和运算求解能力.用频率估计总体在生活中经常用到,故是高考考试重点,故选此题.‎ ‎7.为了解家庭收入高低对学生学习文史与理工的关系,某科研机构在某综合性大学 校园中随机地对100名学生进行调查,其结果如下:‎ 家庭收入高 家庭收入低 合计 文史 ‎25‎ ‎25‎ ‎50‎ 理工 ‎15‎ ‎35‎ ‎50‎ 合计 ‎40‎ ‎60‎ ‎100‎ ‎(I)从被调查的100名学生中随机抽取一人,求来自家庭收入低的概率;‎ ‎(Ⅱ)在被调查的100名学生中,利用分层抽样方法从学习文史类专业的学生中抽取6人参加科研机构的 座谈,为节约时间,该科研机构从这6人中选出3人进行座谈,求这3人中至少有2名学生来自家庭收 入高的概率.‎ ‎(Ⅲ)你是否有99%的把握认为“家庭收入高低对学生学习文史与理工有关”?‎ P(K2≥k0)‎ ‎0.10‎ ‎0.05‎ ‎0.010‎ ‎0.005‎ k0‎ ‎2.706‎ ‎3.841‎ ‎6.635‎ ‎7.879‎ ‎【解析】(I)设“从被调查的100名学生中随机抽取一人,来自家庭收入低”为事件A,由题设可知被调查的学生总数为100名,其中家庭收入低的学生有60名,故. ‎ ‎(Ⅱ)由题意知,抽取的6名学生来自家庭收入高和家庭收入低各3名,设家庭收入高的3名学生分别是,,,家庭收入低的3名学生分别为,,,从这6人中选出3人的所有选法为:, ,,共20种不同的方法. 而其中至少有2名学生来自家庭出入高的可能情况为:,共10种,所以这3人中至少有2名学生来自家庭收入高的概率为. ‎ ‎(Ⅲ)结合列联表可算得,‎ 所以没有99%的把握认为“家庭收入高低对学生学习文史与理工有关”.‎ ‎【入选理由】本题主要考查独立性检验,统计初步知识,古典概率等基础知识,意在考查学生处理数据的能力、分析问题解决问题的能力和运算求解能力.近几年高考加强对统计案例的考查,而独立性检验又是重点,故选此题.‎ ‎8.2016年全国高考只有最后几十天,某省一重点中学 对本届高三文科的1200名学生进行全国卷数学模拟适用测评.这1200人随机分为6组,每组200人,并把这6组随机编排在六天分别进行考察,最后把考察结果量化为分数,总分150分.现根据第一组200人的得分绘制出如下频率分布直方图:‎ ‎(Ⅰ)利用第一组200人的得分情况,估测一下 1200人中得分在105分以上的人数;‎ ‎(Ⅱ)根据频率分布直方图求出中位数和众数;‎ ‎(Ⅲ)如果本次参加测评的1200人平均分数不低于100分,就符合期望,即说明学生已经顺利适用高考的题型,学校的文科数学教学是成功的,否则就不符合期望,学生和老师要继续调整学习和教学.请你利用第一组200人得分的平均值(每组的平均数按照对应区间的中点来计算)来判断一下,这次测试是否符合期望.‎ ‎(Ⅲ)估计第一组的200人平均分为:‎ ‎,所以本次测评符合期望. ‎ ‎【入选理由】本题主要考查频率分布直方图,数理统计求解等基础知识,意在考查学生读图和将图中信息转化成所求问题必需的条件的能力,阅读能力以及化归转化能力,分析问题解决问题的能力和运算求解能力.用频率估计总体在生活中经常用到,故是高考考试重点,故选此题.‎
查看更多

相关文章

您可能关注的文档