- 2021-04-17 发布 |
- 37.5 KB |
- 33页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
【数学】2019届一轮复习人教B版概率与统计大题(文)学案
2017年高考三轮复习系列:讲练测之核心热点 【全国通用版】 热点十八 概率与统计大题(文) 【名师精讲指南篇】 【高考真题再现】 1.【2014全国卷1文】从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量 表得如下频数分布表: 质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125) 频数 6 26 38 22 8 (I)在答题卡上作出这些数据的频率分布直方图: (II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表); (III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定? 【解析】(1) 2. 【2015全国卷2文】某公司为了解用户对其产品的满意度,从,两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得出地区用户满意评分的频率分布直方图和地区用户满意度评分的频数分布表. 地区用户满意度评分的频数分布表 满意度评分分组 [50,60) [60,70) [70,80) [·华.资*源%库 ziyuanku.com80,90) [90,100) 频数 2 8 14 10 6 (1)在答题卡上作出地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可). (2)根据用户满意度评分,将用户的满意度分为三个等级: 满意度评分 低于70分 70分到89分 不低于90分 满意度等级 不满意 满意 非常满意 估计哪个地区用户的满意度等级为不满意的概率大?说明理由. 解析(1)通过两地区用户满意度评分的频率分布直方图可以看出,地区用户满意度评分的平均值高于地区用户满意度评分的平均值;地区用户满意度评分比较集中,而地区用户满意度评分比较分散. (2)A地区用户的满意度等级为不满意的概率大. 记表示事件:“地区用户的满意度等级为不满意”;表示事件:“地区用户的满意度等级为不满意”. 由直方图得的估计值为,的估计值为.所以地区用户的满意度等级为不满意的概率大. 3.【2015全国卷I文】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值. 表中, (1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由); (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润与的关系为,根据(2)的结果回答下列问题: (i)年宣传费时,年销售量及年利润的预报值是多少? (ii)年宣传费为何值时,年利润的预报值最大? 附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,. 4【2016全国卷2文】某险种的基本保费为(单元:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下: 上年度出险次数 0 1 2 3 4 保 费 0.85a a 1.25a 1.5a 1.75a 2a 随机调查了该险种的名续保人在一年内的出险情况,得到如下统计表: 出险次数 频数 (1)记为事件:“一续保人本年度的保费不高于基本保费”,求的估计值; (2)记为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的”,求 的估计值; (3)求续保人本年度平均保费的估计值. 【解析】(1)由所给数据知,事件发生当且仅当一年内出险次数小于,所以. (2)由所给数据知,事件发生当且仅当一年内出险次数大于等于且小于等于,所以. (3)由题所求分布列为: 保 费 频率 调查名续保人的平均保费为: . 5.【2016全国卷1文】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图. 记表示台机器在三年使用期内需更换的易损零件数,表示台机器在购买易损零件上所需的费用(单位:元),表示购机的同时购买的易损零件数. (1)若,求与的函数解析式; (2)若要求 “需更换的易损零件数不大于”的频率不小于,求的最小值; (3)假设这台机器在购机的同时每台都购买个易损零件,或每台都购买个易损零件,分别计算这台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买台机器的同时应购买个还是个易损零件? 【解析】(1)当时,(元); 当时,(元), 所以. 6.【2016全国卷3文】下图是我国年至年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码分别对应年份. (1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明; (2)建立关于的回归方程(系数精确到),预测年我国生活垃圾无害化处理量. 附注: 参考数据:,,,. 参考公式:相关系数 回归方程中斜率和截距的最小二乘估计公式分别为: (2),,所以, ,所以线性回归方程为. 当时,.因此,我们可以预测年我国生活垃圾无害化处理亿吨. 【热点深度剖析】 纵观2014年和2015年2016年的高考题对本热点的考查,可以发现概率和统计、统计案例相结合是高考命题的热点, 2014年考查了频率分布表,频率分布直方图,平均数与方差的计算,主要考查生活中的概率统计知识和方法. 2015年分别考查了频率分布直方图、线性回归分析.2016年3套试卷分别考查了回归分析、柱形图及概率. 从近几年的高考试题来看,古典概型、频率分布直方图、茎叶图、平均数、方差是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力.根据近三年高考趋势预测2017年高考,概率、频率分布直方图、茎叶图、平均数、方差仍然是考查的热点,由于连续3年大题都没考古典概型、独立性检验,故应注意和概率知识的结合,同时应注意独立性检验在实际生活中的应用,有可能涉及一道与独立检验有关的大题. 【重点知识整合】 一,统计初步 1.简单随机抽样 简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法. 2.系统抽样 (1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样. (2)系统抽样的步骤: ①编号.采用随机的方式将总体中的个体编号. ②分段.先确定分段的间隔k.当(N为总体中的个体数,n为样本容量)是整数时,k=;当不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N′能被n整除,这时k=.③确定起始个体编号.在第1段用简单随机抽样确定起始的个体编号S. ④按照事先确定的规则抽取样本.通常是将S加上间隔k,得到第2个个体编号S+k,再将(S+k)加上k,得到第3个个体编号S+2k,这样继续下去,获得容量为n的样本.其样本编号依次是:S,S+k,S+2k,…,S+(n-1)k. 3.分层抽样 (1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样. 分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当. (2)分层抽样的步骤 ①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.中/华-资*源%库 (3)分层抽样的优点 分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用. 4.绘制频率分布直方图 把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1. 5.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便. 6.平均数、中位数和众数 (1)平均数:一组数据的总和除以数据的个数所得的商就是平均数. (2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数. (3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数). (4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 7.方差、标准差 (1)设样本数据为x1,x2,…,xn样本平均数为,则s2=[(x1-)2+(x2-)2+…+(xn-)2]=[(x12+x22+…+xn2)-n2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差. (2) 数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小. 8.两个变量的线性相关 (1)散点图 将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系. (2)正相关、负相关中·华.资*源%库 ziyuanku.com 如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关. 反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关. 9.回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报. (1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. (2)回归直线方程的求法——最小二乘法. 设具有线性相关关系的两个变量x、y的一组观察值为(xi,yi)(i=1,2,…,n),则回归直线方程=+x的系数为: 其中=i,=i,(,)称作样本点的中心. ,表示由观察值用最小二乘法求得的a,b的估计值,叫回归系数. 10.独立性检验 (1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量. (2)两个分类变量X与Y的频数表,称作2×2列联表. 二.随机事件的概率 1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件. (1)在条件下,一定会发生的事件叫做相对于条件的必然事件. (2)在条件下,一定不会发生的事件叫做相对于条件的不可能事件. (3)必然事件与不可能事件统称为确定事件. (4)在条件下可能发生也可能不发生的事件,叫做随机事件. (5)确定事件和随机事件统称为事件,一般用大写字母表示. 2.频率与概率 (1)在相同的条件下重复次试验,观察某一事件是否出现,称次试验中事件出现的次数为事件出现的频数,称事件出现的比例为事件出现的频率. (2)对于给定的随机事件,如果随着试验次数的增加,事件发生的频率稳定在某个常数上,把这个常数记作,称为事件的概率,简称为的概率. 3.互斥事件与对立事件 互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即为不可能事件(),则称事件与事件互斥,其含义是:事件与事件在任何一次试验中不会同时发生. 一般地,如果事件中的任何两个都是互斥的,那么就说事件彼此互斥. 对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即为不可能事件,而为必然事件,那么事件与事件互为对立事件,其含义是:事件与事件在任何一次试验中有且仅有一个发生. 互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是两个事件对立的必要非充分条件. 4.事件的关系与运算 定义 符号表示 包含关系 如果事件发生,则事件一定发生,这时称事件包含事件 (或称事件包含于事件) (或) 相等关系 若且,那么称事件与事件相等 并事件 (和事件) 若某事件发生当且仅当事件发生或事件发生,则称此事件为事件与事件的并事件(或和事件) (或) 交事件 (积事件) 若某事件发生当且仅当事件发生且事件发生,则称此事件为事件与事件的交事件(或积事件) (或) 互斥事件 若为不可能事件,那么称事件与事件互斥 对立事件 若为不可能事件,为必然事件,那么称事件与事件互为对立事件 且 5.随机事件的概率 事件的概率:在大量重复进行同一试验时,事件发生的频率总接近于某个常数,在它附近摆动,这时就把这个常数叫做事件的概率,记作. 由定义可知,显然必然事件的概率是,不可能事件的概率是. 5.概率的几个基本性质 (1)概率的取值范围:. (2)必然事件的概率:. (3)不可能事件的概率:. (4)互斥事件的概率加法公式: ①(互斥),且有. ② (彼此互斥). (5)对立事件的概率:. 三.古典概型 1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件A由几个基本事件组成.如果一次试验中可能出现的结果有n个,即此试验由n个基本事件组成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是.如果某个事件A包含的结果有m个,那么事件A的概率P(A)=. 基本事件的特点Ziyuanku.com (1)任何两个基本事件是互斥的. (2)任何事件都可以表示成基本事件的和(除不可能事件). 2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型. ①试验中所有可能出现的基本事件只有有限个,即有限性. ②每个基本事件发生的可能性相等,即等可能性. 概率公式:P(A)=. 四.几何概型 1.(1)随机数的概念: 随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的. (2)随机数的产生方法 ①利用函数计算器可以得到0~1之间的随机数; ②在Scilab语言中,应用不同的函数可产生0~1或a~b之间的随机数. 2.几何概型 (1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率模型为为几何概率模型,简称几何概型. (2)特点:①无限性:在一次试验中,可能出现的结果有无限多个; ②等可能性:每个结果的发生具有等可能性. (3)几何概型的解题步骤: 首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和事件构成的区域长度(角度、弧长等),最后代公式 ;如果是二维、三维的问题,先设出二维或三维变量,再列出试验的全部结果和事件分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代公式. (4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系. 3.几种常见的几何概型 (1)设线段l是线段L的一部分,向线段L上任投一点.若落在线段l上的点数与线段L的长度成正比,而与线段l在线段l上的相对位置无关,则点落在线段l上的概率为: P=l的长度/L的长度 (2)设平面区域g是平面区域G的一部分,向区域G上任投一点,若落在区域g上的点数与区域g的面积成正比,而与区域g在区域G上的相对位置无关,则点落在区域g上概率为: P=g的面积/G的面积 (3)设空间区域上v是空间区域V的一部分,向区域V上任投一点.若落在区域v上的点数与区域v的体积成正比,而与区域v在区域v上的相对位置无关,则点落在区域V上的概率为: P=v的体积/V的体积 五.条件概率 1.条件概率及其性质 (1)对于任何两个事件和,在已知事件发生的条件下,事件发生的概率叫做条件概率,用符号来表示,其公式为. 在古典概型中,若用表示事件中基本事件的个数,则. (2)条件概率具有的性质: ①; ② 如果和是两互斥事件,则. 2.相互独立事件 (1)对于事件、,若的发生与的发生互不影响,则称、是相互独立事件. (2)若与相互独立,则, . (3)若与相互独立,则与,与,与也都相互独立. (4)若,则与相互独立. 【应试技巧点拨】 1.三种抽样方法的比较 类别 共同点 各自特点 相互联系 适用范围 简单随机抽样 抽样过程中每个个体被抽取的机会均等 从总体中逐个抽取 总体中的个体数较少 系统抽样 将总体均匀分成几部分,按事先确定的规则在各部分抽取 在起始部分抽样时采用简单随机抽样 总体中的个体数较多 分层抽样 将总体分成几层,分层进行抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成 2.样本频率直方图与样本的数字特征 在频率分布直方图中,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;中位数的估计值,应使中位数左右两边的直方图面积相等;最高小长方形的中点所对应的数据值即为这组数据的众数. 3.方差是刻画一组数据离散程度的量,方差越大,这组数据波动越大,越分散.讨论产品质量、售价高低、技术高低、产量高低、成绩高低、寿命长短等等问题,一般都是通过方差来体现. 5.判断两变量是否有相关关系很容易将相关关系与函数关系混淆.相关关系是一种非确定性关系,即是非随机变量与随机变量之间的关系,而函数关系是一种因果关系. 6.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同) 7.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出回归直线方程. 8.独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的随机变量,对假设的正确性进行判断. 【考场经验分享】 1.进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠; (2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性应相同; (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样. 2.在作茎叶图时,容易出现茎两边的数字不是从小到大的顺序排列,从而导致结论分析错误,在使用茎叶图整理数据时,要注意:一是数据不能遗漏,二是数据最好按从小到大顺序排列,对三组以上的数据,也可使用茎叶图,但没有表示两组记录那么直观、清晰. 3.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义. 4.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值. 5.r的大小只说明是否相关并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的依据. 6.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K2<2.076应判断为没有充分证据显示X与Y有关系,而不能作为小于90%的量化值来判断. 7. 概率计算题的核心环节就是把一个随机事件进行类似本题的分拆,这中间有三个概念,事件的互斥,事件的对立和事件的相互独立,在概率的计算中只要弄清楚了这三个概念,根据实际情况对事件进行合理的分拆,就能把复杂事件的概率计算转化为一个个简单事件的概率计算,达到解决问题的目的. 8.在解含有相互独立事件的概率题时,首先把所求的随机事件分拆成若干个互斥事件的和,其次将分拆后的每个事件分拆为若干个相互独立事件的乘积,这两个事情做好了,问题的思路就清晰了,接下来就是按照相关的概率值进行计算的问题了. 9.相当一类概率应用题都是比如掷硬币、掷骰子、摸球等概率模型赋予实际背景后得出来的,我们在解题时就要把实际问题再还原为我们常见的一些概率模型,这就要根据问题的具体情况去分析,对照常见的概率模型,把不影响问题本质的因素去除,抓住问题的本质. 【名题精选练兵篇】 1.【陕西省汉中市2017届高三下学期第二次教学质量检测(4月模拟)】为调查某地人群年龄与高血压的关系,用简单随机抽样方法从该地区年龄在20~60岁的人群中抽取200人测量血压,结果如下: 高血压 非高血压 总计 年龄20到39岁 12 100 年龄40到60岁 52 100 总计 60 200 (1)计算表中的、、值;是否有99%的把握认为高血压与年龄有关?并说明理由. (2)现从这60名高血压患者中按年龄采用分层抽样的方法抽取5人,再从这5人中随机抽取2人,求恰好一名患者年龄在20到39岁的概率. 附参考公式及参考数据: = P(k2≥k0) 0.100 0.050 0.025 0.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 【解析】(1)由, ,解得=88, =48; =52+ =140, ∴=≈30.857, 由于30.857>10.828,所以有99.9%的把握认为“高血压与年龄有关”. 2.【重庆市2017届高三4月调研测试(二诊)】“微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下: (1)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000步的概率; (2)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关? 附: , 0.10 0.05 0.025 0.010 2.706 3.841 5.024 6.635 【解析】(Ⅰ)由题知,40人中该日走路步数超过5000步的有34人,频率为,所以估计他的所有微信好友中每日走路步数超过5000步的概率为; (Ⅱ) ,故没有95%以上的把握认为二者有关. 3.【2017届湖南省长沙市高三上学期统一模拟】某研究型学习小组调查研究”中学生使用智能手机对学习的影响”.部分统计数据如下表: 参考数据: 参考公式: ,其中 (Ⅰ)试根据以上数据,运用独立性检验思想,指出有多大把握认为中学生使用智能手机对学习有影响? (Ⅱ)研究小组将该样本中使用智能手机且成绩优秀的4位同学记为组,不使用智能手机且成绩优秀的8位同学记为组,计划从组推选的2人和组推选的3人中,随机挑选两人在学校升旗仪式上作“国旗下讲话”分享学习经验.求挑选的两人恰好分别来自、两组的概率. 【解析】(Ⅰ)根据上方公式求得, 因为 所以该研究小组有99.5%的把握认为中学生使用智能手机对学习有影响. (Ⅱ)记组推选的两名同学为, 组推选的三名同学为, 则从中随机选出两名同学包含如下10个基本事件: 记挑选的两人恰好分别来自两组为事件, 则事件包含如下6 个基本事件: 故. 即挑选的两人恰好分别来自两组的概率是. 4.【湖北省六校联合体2017届高三4月联考】2015年12月,华中地区数城市空气污染指数“爆表”,此轮污染为2015年以来最严重的污染过程,为了探究车流量与的浓度是否相关,现采集到华中某城市2015年12月份某星期星期一到星期日某一时间段车流量与的数据如表: 时间 星期一 星期二 星期三 星期四 星期五 星期六 星期日 车流量(万辆) 1 2 3 4 5 6 7 的浓度(微克/立方米) 28 30 35 41 49 56 62 (1)由散点图知与具有线性相关关系,求关于的线性回归方程;(提示数据: ) (2)(I)利用(1)所求的回归方程,预测该市车流量为12万辆时的浓度;(II)规定:当一天内的浓度平均值在内,空气质量等级为优;当一天内的浓度平均值在 内,空气质量等级为良,为使该市某日空气质量为优或者为良,则应控制当天车流量不超过多少万辆?(结果以万辆为单位,保留整数)参考公式:回归直线的方程是,其中, . 5.【四川省资阳市2017届高三4月模拟】共享单车是指由企业在校园、公交站点、商业区、公共服务区等场所提供的自行车单车共享服务,由于其依托“互联网+”,符合“低碳出行”的理念,已越来越多地引起了人们的关注.某部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[50,60),[60,70),…,[90,100] 分成5组,制成如图所示频率分直方图. (Ⅰ) 求图中的值; (Ⅱ) 已知满意度评分值在[90,100]内的男生数与女生数的比为2:1,若在满意度评分值为[90,100]的人中随机抽取2人进行座谈,求所抽取的两人中至少有一名女生的概率. 【解析】(Ⅰ)由,解得. (Ⅱ)满意度评分值在[90,100]内有人, 其中女生2人,男生4人. 设其中女生为,男生为,从中任取两人,所有的基本事件为(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a1,b4),(a2,b1),(a2,b2),(a2,b3),(a2,b4),(b1,b2),(b1,b3),(b1,b4),(b2,b3),(b2,b4),(b3,b4)共15个,至少有1人年龄在[20,30)内的有(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a1,b4),(a2,b1),(a2,b2),(a2,b3),(a2,b4)共9个. 所以,抽取的两人中至少有一名女生的概率为,即为 6.【北京市海淀区2017届高三下学期期中】某地区以“绿色出行”为宗旨开展“共享单车”业务.该地有, 两种“共享单车”(以下简称型车, 型车).某学习小组7名同学调查了该地区共享单车的使用情况. (Ⅰ)某日该学习小组进行一次市场体验,其中4人租到型车,3人租到型车.如果从组内随机抽取2人,求抽取的2人中至少有一人在市场体验过程中租到型车的概率; (Ⅱ)根据已公布的2016年该地区全年市场调查报告,小组同学发现3月,4月的用户租车情况城现如表使用规律.例如,第3个月租型车的用户中,在第4个月有的用户仍租型车. 第3个月 第4个月 租用型车 租用型车 租用型车 租用型车 若认为2017年该地区租用单车情况与2016年大致相同.已知2017年3月该地区租用, 两种车型的用户比例为1:1,根据表格提供的信息,估计2017年4月该地区租用两种车型的用户比例. 【解析】(Ⅰ)依题意租到型车的4人为, , , ;租到型车的3人为, , ; 设事件为“7人中抽到2人,至少有一人租到型车”, 则事件为“7人中抽到2人都租到型车”. 如表格所示:从7人中抽出2人共有21种情况,事件发生共有3种情况, 所以事件概率. (Ⅱ)依题意,市场4月份租用型车的比例为, 租用型车的比例为, 所以市场4月租用, 型车的用户比例为. 7.【吉林省梅河口市2017届高三一模】已知某中学高三文科班学生共有800人参加了数学与地理的水平测试,现学校决定利用随机数表法从中抽取100人进行成绩抽样统计,先将800人按001,002,003,…,800进行编号. (Ⅰ)如果从第8行第7列的数开始向右读,请你依次写出最先检测的3个人的编号:(下面摘取了第7行至第9行) (Ⅱ)抽的100人的数学与地理的水平测试成绩如下表:WWW.ziyuanku.com 成绩优秀、良好、及格三个等级,横向、纵向分别表示地理成绩与数学成绩,例如:表中数学成绩为良好的共有20+18+4=42人,若在该样本中,数学成绩优秀率为30%,求的值. (Ⅲ)将, 的表示成有序数对,求“地理成绩为及格的学生中,数学成绩为优秀的人数比及格的人数少”的数对的概率. 【解析】(Ⅰ)依题意,最先检测的3个人的编号依次为785,667,199. (Ⅱ)由,得, ∵,∴. 8.【四川省宜宾市2017届高三二诊】某企业为了对生产的一种新产品进行合理定价,将该产品按事先拟定的价格进行试销,得到以下数据: 单价x(元/件) 60 62 64 66 68 70 销量y(件) 91 84 81 75 70 67 (I)画出散点图,并求关于的回归方程; (II)已知该产品的成本是36元/件,预计在今后的销售中,销量与单价仍然服从(I)中的关系,为使企业获得最大利润,该产品的单价应定为多少元(精确到元)? 附:回归直线的斜率和截距的最小二乘法估计公式分别为: 【解析】(I)散点图如图 由图得销量与单价线性相关 回归直线方程为 (II)利润 当时,利润最大,这时 故定价约为元时,企业获得最大利润. 9.【2016广西钦州上学期期末,文18】某校高一某班的一次数学测试成绩的茎叶图和频率分布直方图因故都受到不同程度的损坏,但可见部分如下,据此解答如下问题: (Ⅰ)求分数在[50,60)的频率及全班人数; (Ⅱ)求分数在[80,90)之间的频数,并计算频率分布直方图中[80,90)间的矩形的高; (Ⅲ)若规定:90分(包含90分)以上为优秀,现从分数在80分(包含80分)以上的试卷中任取两份分析学生失分情况,求在抽取的试卷中至少有一份优秀的概率.WWW.ziyuanku.com 10.【2016吉林长春质量监测二】近年来我国电子商务行业迎来篷布发展的新机遇,2015年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门也推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为,对服务的好评率为,其中对商品和服务都做出好评的交易为80次. (1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关? (2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择两次交易进行客户回访,求只有一次好评的概率. (,其中) 【解析】(1) 由题意可得关于商品和服务评价的列联表: 对服务好评 对服务不满意 合计 对商品好评 80 40 120 对商品不满意 70 10 80 合计 150 50 200 , 可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关. (2) 若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,则好评的交易次数为3次,不满意的次数为2次,令好评的交易为,不满意的交易为,从5次交易中,取出2次的所有取法为、、、、、、、、、,共计10种情况,其中只有一次好评的情况是、、、、、,共计6种,因此,只有一次好评的概率为 11. 【山东省日照市2016届高三3月模拟】某中学在高二年级开设大学先修课程《线性代数》,共有50名同学选修,其中男同学30名,女同学20名.为了对这门课程的教学效果进行评估,学校按性别采用分层抽样的方法抽取5人进行考核. (I)求抽取的5人中男、女同学的人数; (II)考核前,评估小组打算从抽取的5人中随机选出2名同学进行访谈,求选出的两名同学中恰有一名女同学的概率. 【名师原创测试篇】 1.从某高校男生中随机抽取名学生,测得他们的身高(单位: cm)情况如表1: 分组 频数 频率 合计 表1 (1)求的值; (2)按表1的身高组别进行分层抽样, 从这名学生中抽取名担任广州国际马拉松志愿者, 再从身高不低于cm的志愿者中随机选出名担任迎宾工作, 求这名担任迎宾工作的志愿者中至少有名的身高不低于cm的概率. 【解析】(1)由,得.由,得, 由,得. (2)依据分层抽样的方法,抽取的名志愿者中身高在区间上的有名,记为;而身高在区间上的有名,记为.记“这名担任迎宾工作的志愿者中至少有名的身高不低于cm”为事件,从身高不低于cm的志愿者中随机选出名担任迎宾工作,共有种不同取法:,,,,. 事件包含的基本事件有种:,,,,. ∴为所求. 2. 某体育杂志针对2014年巴西世界杯发起了一项调查活动,调查“各球队在世界杯的名次与该队历史上的的实力和表现有没有关系”,在所有参与调查的人中,持“有关系”“无关系”“不知道”态度的人数如表所示: 有关系 无关系 不知道 40岁以下 800 450 200 40岁以上(含40岁) 100 150 300 (1)在所有参与调查的人中,用分层抽样的方法抽取n个人,已知从持“有关系”态度的人中抽取45人,求n的值,并求从持其他两种态度的人中应抽取的人数; (2)在持“不知道”态度的人中,用分层抽样的方法抽取5人看成一个总体,从这5人中任选取2人,求至少一人在40岁以下的概率. 3.某校高一某班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,(阴影部分为破坏部分)其可见部分如下,据此解答如下问题: 5 6 8 6 2 3 3 5 6 8 9 7 1 2 2 3 4 5 6 7 8 9 8 9 5 8 (Ⅰ)计算频率分布直方图中[80,90)间的矩形的高; (Ⅱ)若要从分数在之间的试卷中任取两份分析学生失分情况,求在抽取的试卷中,至少有一份的分数在之间的概率; (Ⅲ)根据频率分布直方图估计这次测试的平均分. (Ⅲ)全班人数共人,根据各分数段人数计算得各分数段的频率为: 分数段 频率 所以估计这次测试的平均分为: . 4.某中学有教职工500人参加植树节活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如下图所示. (1)左图是年龄的频数分布表,求正整数a,b的值; (2)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,年龄在第1,2,3组的人数分别是多少? (3)在(2)的前提下,从这6人中随机抽取2人参加宣传交流活动,求至少有1人年龄在第3组的概率. 【解析】(1)由题设可知, . (2)因为第1,2,3组共有50+50+200=300人,利用分层抽样在300名学生中抽取6名学生,每组抽取的人数分别为: 第1组的人数为,第2组的人数为,第3组的人数为, 所以第1,2,3组分别抽取1人,1人,4人. (3)设第1组的1位同学为,第2组的1位同学为,第3组的4位同学为,则从六位同学中抽两位同学有:共15种可能. 其中2人年龄都不在第3组的有:共1种可能,所以至少有1人年龄在第3组的概率为. 5. 2015国际滑联世界花样滑冰锦标赛于3月23日至29日在上海举行,为调查市民喜欢这项赛事是否与年龄有关,随机抽取了55名市民,得到如下数据表: 喜 欢 不 喜 欢 合 计 大于40岁 20 5 25 20岁至40岁 10 20 30 合 计 30 25 55 (I)判断是否有的把握认为喜欢这项赛事与年龄有关? (II)用分层抽样的方法从喜欢这项赛事的市民中随机抽取6人作进一步调查,将这6位市民作为一个样本,从中任选2人,求恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率. 下面的临界值表供参考: 0.15 0.10 0.05 0.025 0.010 0.005 0.001 2.072 2.706 3.841 5.024 6.635 7.879 10.828 (参考公式:,其中) 【解析】(I)由公式得,所以有的把握认为喜欢这项赛事与年龄有关. (II)设所抽样本中有个“大于40岁”市民,则,解得,所以样本中有4个“大于40岁”市民,同理可得样本中有2个“20岁至40岁”的市民,他们分别记作从中任选2人的基本事件有共15个,其中恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民含基本事件共8个,所以从中任选2人,恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率为. 6. 某校高三有800名同学参加学校组织的化学学科竞赛, 其成绩的频率分布直方图如图所示,规定90分及其以上为获优胜奖.$来&源:ziyuanku.com (Ⅰ)下表是这次考试成绩的频数分布表,求正整数a, b的值; 区间 [75,80) [80,85) [85,90) [90,95) [95,100] 人数 40 a 280 240 b (II)现在要用分层抽样的方法从这800人中抽取5人参加某项活动,求其 中获优胜奖的学生人数; (Ⅲ)在(II)中抽取的5名学生中,要随机选取2名学生参加市全省化学学科竞赛,求选取的两名学生中恰有含1名获优胜奖的概率.查看更多