- 2021-05-08 发布 |
- 37.5 KB |
- 9页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2012年高考数学真题分类汇编I 统计 (文科)
I 统计 I1 随机抽样 11.I1[2012·浙江卷] 某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________. 11.160 [解析] 设样本中男生、女生的人数分别为x、y,且x∶y=4∶3,那么x=280×=160. 14.I1[2012·福建卷] 一支田径队有男女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是________. 14.12 [解析] 解题的关键是记住分层抽样中最基本的比例关系,即可解决分层抽样的所有计算问题.抽取女运动员的人数是:28×=28×=12. 15.I1、K2[2012·天津卷] 某地区有小学21所,中学14所,大学7所,现采用分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查. (1)求应从小学、中学、大学中分别抽取的学校数目; (2)若从抽取的6所学校中随机抽取2所学校做进一步数据分析, ①列出所有可能的抽取结果; ②求抽取的2所学校均为小学的概率. 15.解:(1)从小学、中学、大学中分别抽取的学校数目为3,2,1. (2)①在抽取到的6所学校中,3所小学分别记为A1,A2,A3,2所中学分别记为A4,A5,大学记为A6,则抽取2所学校的所有可能结果为{A1,A2},{A1,A3},{A1,A4},{A1,A5},{A1,A6},{A2,A3},{A2,A4},{A2,A5},{A2,A6},{A3,A4},{A3,A5},{A3,A6},{A4,A5},{A4,A6},{A5,A6},共15种. ②从6所学校中抽取的2所学校均为小学(记为事件B)的所有可能结果为{A1,A2},{A1,A3},{A2,A3},共3种. 所以P(B)==. 17.K8、I1、I2[2012·北京卷] 近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1 000吨生活垃圾,数据统计如下(单位:吨): “厨余垃圾”箱 “可回收物”箱 “其他垃圾”箱 厨余垃圾 400 100 100 可回收物 30 240 30 其他垃圾 20 20 60 (1)试估计厨余垃圾投放正确的概率; (2)试估计生活垃圾投放错误的概率; (3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a,b,c,其中a>0,a+b+c=600.当数据a,b,c的方差s2最大时,写出a,b,c的值(结论不要求证明),并求此时s2的值. 注:s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为数据x1,x2,…,xn的平均数 17.解:(1)厨余垃圾投放正确的概率约为 ==. (2)设生活垃圾投放错误为事件A,则事件表示生活垃圾投放正确. 事件的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里可回收物量与“其他垃圾”箱里其他垃圾量的总和除以生活垃圾总量,即P()约为=0.7, 所以P(A)约为1-0.7=0.3. (3)当a=600,b=c=0时,s2取得最大值. 因为=(a+b+c)=200, 所以s2=[(600-200)2+(0-200)2+(0-200)2]=80 000. 11.I1[2012·湖北卷] 一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法取若干人,若抽取的男运动员有8人,则抽取的女运动员有________________________________________________________________________ 人. 11.[答案] 6 [解析] 设抽取的女运动员为x人,因为分层抽样在每个层次抽取的比例是相等的,所以=,解得x=6.故抽取女运动员6人. 2.I1[2012·江苏卷] 某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生. 2.15 [解析] 本题考查简单随机抽样中的分层抽样.解题突破口为直接运用分层抽样的定义即可.由题意可得高二年级应该抽取学生50×=15(名). I2 用样本估计总体 3.I2[2012·陕西卷] 对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图1-1所示),则该样本中的中位数、众数、极差分别是( ) 图1-1 A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53 3.A [解析] 本题主要考查茎叶图数据的读取和数据特征的简单计算,由所给的茎叶图可知所给出的数据共有30个,其中45出现3次为众数,处于中间位置的两数为45和47,则中位数为46;极差为68-12=56.故选A. 14.I2[2012·山东卷] 如图1-4是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________. 图1-4 14.9 [解析] 本题考查频率分布直方图及样本估计总体的知识,考查数据处理能力,容易题. 样本容量==50,样本中平均气温不低于25.5℃的城市个数为50×1×0.18=9. 4.I2[2012·山东卷] 在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( ) A.众数 B.平均数 C.中位数 D.标准差 4.D [解析] 本题考查众数、平均数、中位数及标准差的概念,考查推理论证能力,容易题. 当每个样本数据加上2后,众数、平均数、中位数都会发生变化,不变的是数据的波动情况,即标准差不变. 6.I2[2012·江西卷] 小波一星期的总开支分布如图1-1(1)所示,一星期的食品开支如图1-1(2)所示,则小波一星期的鸡蛋开支占总开支的百分比为( ) 图1-1 A.30% B.10% C.3% D.不能确定 6.C [解析] 鸡蛋占食品总开支的比为=10%,又食品开支占总开支的比为30%,因此鸡蛋占总开支的比为10%×30%=3%.故选C. 2.I2[2012·湖北卷] 容量为20的样本数据,分组后的频数如下表: 分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 频数 2 3 4 5 4 2 则样本数据落在区间[10,40)的频率为( ) A.0.35 B.0.45 C.0.55 D.0.65 2.B [解析] 由表可知:样本数据落在区间[10,40)的频数为2+3+4=9,又样本容量为20,则频率为=0.45.故选B. 13.I2[2012·广东卷] 由正整数组成一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列) 13.1,1,3,3 [解析] 设四个数从小到大分别是:x1,x2,x3,x4,根据已知可以得到方程组: 即又因为四个数都是正整数,根据第一个式子知x2=1,x3=3或x2=2,x3=2,则x1=1,x4=3或x1=2,x4=2,代入第三个式子,只有x1=1,x2=1,x3=3,x4=3满足条件,所以四个数分别是1,1,3,3. 18.I2[2012·安徽卷] 若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表: 分组 频数 频率 [-3,-2) 0.10 [-2,-1) 8 (1,2] 0.50 (2,3] 10 (3,4] 合计 50 1.00 (1)将上面表格中缺少的数据填在答题卡的相应位置. (2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品,据此估算这批产品中的合格品的件数. 18.解:(1)频率分布表 分组 频数 频率 [-3,-2) 5 0.10 [-2,-1) 8 0.16 (1,2] 25 0.50 (2,3] 10 0.20 (3,4] 2 0.04 合计 50 1.00 (2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70; (3)设这批产品中的合格品数为x件, 依题意有=, 解得x=-20=1 980. 所以该批产品的合格品件数估计是1 980件. 19.I2、K2[2012·陕西卷] 假设甲乙两种品牌的同类产品在某地区市场上销售量相等,为了解它们的使用寿命,现从这两种品牌的产品中分别随机抽取100个进行测试,结果统计如下: 图1-8 (1)估计甲品牌产品寿命小于200小时的概率; (2)这两种品牌产品中,某个产品已使用了200小时,试估计该产品是甲品牌的概率. 19.解:(1)甲品牌产品寿命小于200小时的频率为=,用频率估计概率,所以,甲品牌产品寿命小于200小时的概率为. (2)根据抽样结果,寿命大于200小时的产品有75+70=145(个), 其中甲品牌产品是75个,所以在样本中,寿命大于200小时的产品是甲品牌的频率是=,用频率估计概率,所以已使用了200小时的该产品是甲品牌的概率为. 17.I2、K2[2012·广东卷] 某校100名学生期中考试语文成绩的频率分布直方图如图1-4所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100]. 图1-4 (1)求图中a的值; (2)根据频率分布直方图,估计这100名学生语文成绩的平均分; (3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数. 分数段 [50,60) [60,70) [70,80) [80,90) x∶y 1∶1 2∶1 3∶4 4∶5 17.解:(1)由频率分布直方图可知 (0.04+0.03+0.02+2a)×10=1. 所以a=0.005. (2)该100名学生的语文成绩的平均分约为 =0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73. (3)由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比, 可得下表: 分数段 [50,60) [60,70) [70,80) [80,90) x 5 40 30 20 x∶y 1∶1 2∶1 3∶4 4∶5 y 5 20 40 25 于是数学成绩在[50,90)之外的人数为 100-(5+20+40+25)=10. 17.K8、I1、I2[2012·北京卷] 近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1 000吨生活垃圾,数据统计如下(单位:吨): “厨余垃圾”箱 “可回收物”箱 “其他垃圾”箱 厨余垃圾 400 100 100 可回收物 30 240 30 其他垃圾 20 20 60 (1)试估计厨余垃圾投放正确的概率; (2)试估计生活垃圾投放错误的概率; (3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a,b,c,其中a>0,a+b+c=600.当数据a,b,c的方差s2最大时,写出a,b,c的值(结论不要求证明),并求此时s2的值. 注:s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为数据x1,x2,…,xn的平均数 17.解:(1)厨余垃圾投放正确的概率约为 ==. (2)设生活垃圾投放错误为事件A,则事件表示生活垃圾投放正确. 事件的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里可回收物量与“其他垃圾”箱里其他垃圾量的总和除以生活垃圾总量,即P()约为=0.7, 所以P(A)约为1-0.7=0.3. (3)当a=600,b=c=0时,s2取得最大值. 因为=(a+b+c)=200, 所以s2=[(600-200)2+(0-200)2+(0-200)2]=80 000. 13.I2[2012·湖南卷] 图1-3是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________. (注:方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平均数) 图1-3 13.6.8 [解析] 本题通过茎叶图考查数理统计中的平均数和方差,意在考查考生数理统计的实际应用能力;具体的解题思路和过程:先求出平均数,再用方差公式求方差. 由茎叶图可求得==11,代入方差公式得 s2=[(11-8)2+(11-9)2+(11-10)2+(11-13)2+(11-15)2]=6.8. 18.K2、B10、I2[2012·课标全国卷] 某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花作垃圾处理. (1)若花店一天购进17枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,n∈N)的函数解析式; (2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表: 日需求量n 14 15 16 17 18 19 20 频数 10 20 16 16 15 13 10 ①假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数; ②若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率. 18.解:(1)当日需求量n≥17时,利润y=85. 当日需求量n<17时,利润y=10n-85. 所以y关于n的函数解析式为 y=(n∈N). (2)①这100天中有10天的日利润为55元,20天的日利润为65元,16天的日利润为75元,54天的日利润为85元,所以这100天的日利润的平均数为 (55×10+65×20+75×16+85×54)=76.4. ②利润不低于75元当且仅当日需求量不少于16枝.故当天的利润不少于75元的概率为 p=0.16+0.16+0.15+0.13+0.1=0.7. I3 正态分布 I4 变量的相关性与统计案例 3.I4[2012·课标全国卷] 在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( ) A.-1 B.0 C. D.1 3.D [解析] 因为所有点都分布在一条直线上,说明相关性很强,相关系数达到最大值,即为1. 故选D. 5.I4[2012·湖南卷] 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( ) A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,) C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 5.D [解析] 本题考查线性回归方程的特征与性质,意在考查考生对线性回归方程的了解,解题思路:A,B,C均正确,是回归方程的性质,D项是错误的,线性回归方程只能预测学生的体重.选项D应改为“若该大学某女生身高为170 cm,则估计其体重大约为58.79 kg”. [易错点] 本题易错一:对线性回归方程不了解,无法得出答案;易错二:对回归系数b不了解,错选C;易错三:线性回归方程有预测的作用,得出的结果不是准确结果,误以为D项是对的. 18.B10、I4[2012·福建卷] 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: 单价x(元) 8 8.2 8.4 8.6 8.8 9 销量y(件) 90 84 83 80 75 68 (1)求回归直线方程=bx+a,其中b=-20,a=-b; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 18.解:(1)由于=(x1+x2+x3+x4+x5+x6)=8.5, =(y1+y2+y3+y4+y5+y6)=80. 所以a=-b=80+20×8.5=250,从而回归直线方程为=-20x+250. (2)设工厂获得的利润为L元,依题意得 L=x(-20x+250)-4(-20x+250) =-20x2+330x-1000 =-202+361.25. 当且仅当x=8.25时,L取得最大值. 故当单价定为8.25元时,工厂可获得最大利润. 19.I4、K2[2012·辽宁卷] 电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图: 图1-6 将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性. (1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关? 非体育迷 体育迷 合计 男 女 合计 (2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率. 附:χ2=, P(χ2≥k) 0.05 0.01 k 3.841 6.635 19.解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2列联表如下: 非体育迷 体育迷 合计 男 30 15 45 女 45 10 55 合计 75 25 100 将2×2列联表中的数据代入公式计算,得 χ2===≈3.030. 因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关. (2)由频率分布直方图可知,“超级体育迷”为5个,从而一切可能结果所组成的基本事件空间为 Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)}. 其中ai表示男性,i=1,2,3,bj表示女性,j=1,2. Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A表示“任选2人中,至少有1人是女性”这一事件,则A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)}, 事件A由7个基本事件组成,因而 P(A)=. I5 单元综合 3.I5[2012·四川卷] 交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人,若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( ) A.101 B.808 C.1212 D.2012 3.B [解析] 根据分层抽样的概念,N∶96=(12+21+25+43)∶12,即N=8×101=808.查看更多