2020高考数学二轮复习练习:第二部分 专题四 第2讲 统计与统计案例含解析
第 2 讲 统计与统计案例
[做真题]
题型一 抽样方法与总体分布的估计
1.(2019·高考全国卷Ⅱ)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手
的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分
与 9 个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
解析:选 A.记 9 个原始评分分别为 a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),
易知 e 为 7 个有效评分与 9 个原始评分的中位数,故不变的数字特征是中位数,故选 A.
2.(2018·高考全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实
现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村
的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析:选 A.法一:设建设前经济收入为 a,则建设后经济收入为 2a,则由饼图可得建设
前种植收入为 0.6a,其他收入为 0.04a,养殖收入为 0.3a.建设后种植收入为 0.74a,其他收入
为 0.1a,养殖收入为 0.6a,养殖收入与第三产业收入的总和为 1.16a,所以新农村建设后,种
植收入减少是错误的.故选 A.
法二:因为 0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以 A 是错
误的.故选 A.
3.(2019·高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:
将 200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给
服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学
方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记 C 为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到 P(C)的估计值
为 0.70.
(1)求乙离子残留百分比直方图中 a,b 的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解:(1)由已知得 0.70=a+0.20+0.15,故
a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
题型二 变量间的相关关系、统计案例
(2018·高考全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产
任务的两种新的生产方式.为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两
组,每组 20 人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完
成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过 m 和
不超过 m 的工人数填入下面的列联表:
超过 m 不超过 m
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异?
附:K2= n(ad-bc)2
(a+b)(c+d)(a+c)(b+d),
解:(1)第二种生产方式的效率更高.
理由如下:
(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有 75%的工人完成生产任务所需时间至
少 80 分钟,用第二种生产方式的工人中,有 75%的工人完成生产任务所需时间至多 79 分
钟.因此第二种生产方式的效率更高.
(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为 85.5 分钟,
用第二种生产方式的工人完成生产任务所需时间的中位数为 73.5 分钟.因此第二种生产方式
的效率更高.
(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于 80 分钟;
用第二种生产方式的工人完成生产任务平均所需时间低于 80 分钟.因此第二种生产方式的效
率更高.
(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎 8 上的最多,
关于茎 8 大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎 7 上的
最多,关于茎 7 大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区
间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生
产任务所需的时间更少.因此第二种生产方式的效率更高.
(2)由茎叶图知 m=79+81
2 =80.
列联表如下:
超过 m 不超过 m
第一种生产方式 15 5
第二种生产方式 5 15
(3)由于 K2=40 × (15 × 15-5 × 5)2
20 × 20 × 20 × 20 =10>6.635,所以有 99%的把握认为两种生产
方式的效率有差异.
[山东省学习指导意见]
1.随机抽样
理解随机抽样的必要性和重要性,学会用简单随机抽样方法从总体中抽取样本,通过对
实例的分析,了解分层抽样和系统抽样方法.
2.用样本估计总体
(1)在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎
叶图,体会它们各自的特点.
(2)理解样本数据标准差的意义和作用,学会计算数字特征(如平均数、标准差),并作出合
理的解释.
(3)会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字
特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性.
3.统计案例
(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量
间的相关关系.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归
方程,并能初步应用.
(2)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求 2×2 列
联表)的基本思想、方法及初步应用.
用样本估计总体
[典型例题]
(2019·广东六校第一次联考)某市大力推广纯电动汽车,对购买用户依照车辆出厂续
驶里程 R(单位:千米)的行业标准,予以地方财政补贴,其补贴标准如下表:
出厂续驶里程 R/千米 补贴/(万元/辆)
150≤R<250 3
250≤R<350 4
R≥350 4.5
2017 年底某部门随机调查该市 1 000 辆纯电动汽车,统计其出厂续驶里程 R,得到频率分
布直方图如上图所示,用样本估计总体,频率估计概率,解决如下问题:
(1)求该市每辆纯电动汽车 2017 年地方财政补贴的均值;
(2)某企业统计 2017 年其充电站 100 天中各天充电车辆数,得如下频数分布表:
辆数 [5 500,6 500) [6 500,7 500) [7 500,8 500) [8 500,9 500]
天数 20 30 40 10
(同一组中的数据用该组区间的中点值作代表)
2018 年 2 月,国家出台政策,将纯电动汽车财政补贴逐步转移到充电基础设施建设上来,
该企业拟将转移补贴资金用于添置新型充电设备.现有直流、交流两种充电桩可供购置,直
流充电桩 5 万元/台,每台每天最多可以充电 30 辆车,每天维护费用 500 元/台;交流充电桩 1
万元/台,每台每天最多可以充电 4 辆车,每天维护费用 80 元/台.
该企业现有两种购置方案:
方案一,购买 100 台直流充电桩和 900 台交流充电桩;
方案二,购买 200 台直流充电桩和 400 台交流充电桩.
假设车辆充电时优先使用新设备,且充电一辆车产生 25 元的收入,用 2017 年的统计数
据,分别估计该企业在两种方案下新设备产生的日利润(日利润=日收入-日维护费用).
【解】 (1)依题意可得纯电动汽车地方财政补贴的分布列为
补贴/(万元/辆) 3 4 4.5
概率 0.2 0.5 0.3
所以该市每辆纯电动汽车 2017 年地方财政补贴的均值为 3×0.2+4×0.5+4.5×0.3=
3.95(万元).
(2)由频数分布表得每天需要充电车辆数的分布列为
辆数 6 000 7 000 8 000 9 000
概率 0.2 0.3 0.4 0.1
若采用方案一,100 台直流充电桩和 900 台交流充电桩每天可充电车辆数为 30×100+
4×900=6 600,
可得实际充电车辆数的分布列为
实际充电车辆数 6 000 6 600
概率 0.2 0.8
于是估计在方案一下新设备产生的日利润为
25×(6 000×0.2+6 600×0.8)-500×100-80×900=40 000(元).
若采用方案二,200 台直流充电桩和 400 台交流充电桩每天可充电车辆数为 30×200+
4×400=7 600,
可得实际充电车辆数的分布列为
实际充电车辆数 6 000 7 000 7 600
概率 0.2 0.3 0.5
于是估计在方案二下新设备产生的日利润为
25×(6 000×0.2+7 000×0.3+7 600×0.5)-500×200-80×400=45 500(元).
(1)统计中的 5 个数据特征
①众数:在样本数据中,出现次数最多的那个数据.
②中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶
数,就取中间两个数据的平均数作为中位数.
③平均数:样本数据的算术平均数,即 x-
=1
n(x1+x2+…+xn).
④方差与标准差:
s2=1
n[(x1- x-
)2+(x2- x-
)2+…+(xn- x-
)2];
s= 1
n[(x1-)2+(x2-)2+…+(xn-)2].
(2)从频率分布直方图中得出有关数据的技巧
①频率:频率分布直方图中横轴表示组数,纵轴表示
频率
组距,频率=组距×
频率
组距.
②频率比:频率分布直方图中各小长方形的面积之和为 1,因为在频率分布直方图中组距
是一个固定值,所以各小长方形高的比也就是频率比,从而根据已知的几组数据个数比求有
关值.
③众数:最高小长方形底边中点的横坐标.
④中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.
⑤平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.
⑥性质应用:若纵轴上存在参数值,则根据所有小长方形的高之和×组距=1,列方程即
可求得参数值.
[对点训练]
1.(2019·武昌区调研考试)对参加某次数学竞赛的 1 000 名选手的初赛成绩(满分:100 分)
作统计,得到如图所示的频率分布直方图.
(1)根据直方图完成以下表格;
成绩 [50,60) [60,70) [70,80) [80,90) [90,100]
频数
(2)求参赛选手初赛成绩的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)如果从参加初赛的选手中选取 380 人参加复赛,那么如何确定进入复赛选手的成绩?
解:(1)填表如下:
成绩 [50,60) [60,70) [70,80) [80,90) [90,100]
频数 50 150 350 350 100
(2)平均数为 55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,方差 s2=(-23)2×
0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101.
(3)进入复赛选手的成绩为 80+350-(380-100)
350 ×10=82(分),所以初赛成绩为 82 分
及其以上的选手均可进入复赛.
(说明:回答 82 分以上,或 82 分及其以上均可)
2.(2019·昆明市诊断测试)《中国大能手》是央视推出的一档大型职业技能挑战赛类的节
目,旨在通过该节目,在全社会传播和弘扬“劳动光劳、技能宝贵、创造伟大”的时代风
尚.某公司准备派出选手代表公司参加《中国大能手》职业技能挑战赛.经过层层选拔,最
后集中在甲、乙两位选手在一项关键技能的区分上,选手完成该项挑战的时间越少越好.已
知这两位选手在 15 次挑战训练中,完成该项关键技能挑战所用的时间(单位:秒)及挑战失败
(用“×”表示)的情况如表 1:
序
号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
甲 × 96 93 × 92 × 90 86 × × 83 80 78 77 75
乙 × 95 × 93 × 92 × 88 83 × 82 80 80 74 73
表 1
据表 1 中甲、乙两位选手完成该项关键技能挑战所用时间的数据,应用统计软件得表 2:
均值/秒 方差
甲 85 50.2
乙 84 54
表 2
(1)在表 1 中,从选手甲完成挑战用时低于 90 秒的成绩中,任取 2 个,求这 2 个成绩都低
于 80 秒的概率;
(2)若该公司只有一个参赛名额,以完成该项关键技能挑战所用时间为标准,根据以上信
息,判断哪位选手代表公司参加职业技能挑战赛更合适?请说明你的理由.
解:(1)选手甲完成挑战用时低于 90 秒的成绩共有 6 个,其中低于 80 秒的成绩有 3 个,
分别记为 A1,A2,A3,其余的 3 个分别记为 B1,B2,B3,从 6 个成绩中任取 2 个的所有取法
有:
A1A2,A1A3,A1B1,A1B2,A1B3,
A2A3,A2B1,A2B2,A2B3,
A3B1,A3B2,A3B3,
B1B2,B1B3,
B2B3,
共 5+4+3+2+1=15(种),其中 2 个成绩都低于 80 秒的有 A1A2,A1A3,A2A3,共 3 种,
所以所取的 2 个成绩都低于 80 秒的概率 P= 3
15=1
5.
(2)甲、乙两位选手完成关键技能挑战的次数都为 10,挑战失败的次数都为 5,所以只需
要比较他们完成关键技能挑战的情况即可,
其中 x-
甲=85(秒), x-
乙=84(秒),
s 2甲=50.2,s 2乙=54.
答案①:选手乙代表公司参加职业技能挑战赛比较合适,因为在相同次数的挑战中,两
位选手在关键技能挑战的完成次数和失败次数都分别相同,但 x-
甲> x-
乙,乙选手平均用时更
短.
答案②:选手甲代表公司参加职业技能挑战赛比较合适,因为在相同次数的挑战中,两
位选手在关键技能挑战的完成次数和失败次数都分别相同,虽然 x-
甲> x-
乙,但两者相差不大,
水平相当,s 2甲
s 2甲,说明乙选手进步幅度更大,成绩
提升趋势更好.(答案不唯一,可酌情给分)
回归分析
[典型例题]
命题角度一 线性回归分析
某地 1~10 岁男童年龄 xi(单位:岁)与身高的中位数 yi(单位:cm)(i=1,2,…,10)
如下表:
x/岁 1 2 3 4 5 6 7 8 9 10
y/cm 76.5 88.5 96.8 104.1 111.3 117.7 124.0 130.0 135.4 140.2
对上表的数据作初步处理,得到下面的散点图及一些统计量的值.
x-
y-
∑
10
i=1 ( x-
i-x)2 ∑
10
i=1 (yi- y-
)2 ∑
10
i=1 (xi- x-
)(yi- y-
)
5.5 112.45 82.50 3 947.71 566.85
(1)求 y 关于 x 的线性回归方程(线性回归方程系数精确到 0.01);
(2)某同学认为 y=px2+qx+r 更适宜作为 y 关于 x 的回归方程类型,他求得的回归方程是
y^
=-0.30x2+10.17x+68.07.经调查,该地 11 岁男童身高的中位数为 145.3 cm.与(1)中的线性
回归方程比较,哪个回归方程的拟合效果更好?
附 : 回 归 方 程 y^
= a^
+ b^
x 中 的 斜 率 和 截 距 的 最 小 二 乘 估 计 公 式 分 别 为 : b^
=
∑
n
i=1 (xi-)(yi-)
∑
n
i=1 (xi-)2
,a^
= y
-
-b^
x
-
.
【解】 (1)b^
=
∑
10
i=1 (xi-)(yi-)
∑
10
i=1 (xi-)2
=566.85
82.50 ≈6.871≈6.87,
a^
= y-
-b^
x-
=112.45-6.871×5.5≈74.66,
所以 y 关于 x 的线性回归方程为y^
=6.87x+74.66.
(2)若回归方程为y^
=6.87x+74.66,当 x=11 时,y^
=150.23.
若回归方程为y^
=-0.30x2+10.17x+68.07,当 x=11 时,y=143.64.
|143.64-145.3|=1.66<|150.23-145.3|=4.93,
所以回归方程y^
=-0.30x2+10.17x+68.07 对该地 11 岁男童身高中位数的拟合效果更
好.
求回归直线方程的关键及实际应用
(1)关键:正确理解计算b^
,a^
的公式和准确地计算.
(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定
两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测
变量的值.
命题角度二 非线性回归分析
某机构为研究某种图书每册的成本费 y(单位:元)与印刷数量 x(单位:千册)的关系,
收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.
x-
y-
u-
∑
8
i=1 (xi- x-
)2 ∑
8
i=1 (xi- x-
)·(yi- y-
) ∑
8
i=1 (ui- u-
)2 ∑
8
i=1 (ui-
u-
)·(yi- y-
)
15.25 3.63 0.269 2 085.5 -230.3 0.787 7.049
表中 ui=1
xi, u-
=1
8 ∑
8
i=1ui.
(1)根据散点图判断:y=a+bx 与 y=c+d
x哪一个模型更适合作为该图书每册的成本费 y(单
位:元)与印刷数量 x(单位:千册)的回归方程?(只要求给出判断,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程(回归系数的结果精确到 0.01);
(3)若该图书每册的定价为 10 元,则至少应该印刷多少册才能使销售利润不低于 78 840
元?(假设能够全部售出,结果精确到 1)
附:对于一组数据(w1,v1),(w2,v2),…,(wn,vn),其回归直线v^
=α^
+β^
w 的斜率和截
距的最小二乘估计分别为β^
=
∑
n
i=1 (wi-)(vi-)
∑
n
i=1 (wi-)2
,α^
= v-
-β^
w-
.
【解】 (1)由散点图判断,y=c+d
x更适合作为该图书每册的成本费 y(单位:元)与印刷数
量 x(单位:千册)的回归方程.
(2)令 u=1
x,先建立 y 关于 u 的线性回归方程,
由于d^
=
∑
8
i=1 (ui-)(yi-)
∑
8
i=1 (ui-)2
=7.049
0.787≈8.957≈8.96,
所以c^
= y-
-d^
· u-
=3.63-8.957×0.269≈1.22,
所以 y 关于 u 的线性回归方程为y^
=1.22+8.96u,
所以 y 关于 x 的回归方程为y^
=1.22+8.96
x .
(3)假设印刷 x 千册,依题意得 10x-(1.22+8.96
x )x≥78.840,
解得 x≥10,
所以至少印刷 10 000 册才能使销售利润不低于 78 840 元.
求非线性回归方程的步骤
(1)确定变量,作出散点图.
(2)根据散点图,选择恰当的拟合函数.
(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方
程.
(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.
(5)根据相应的变换,写出非线性回归方程.
命题角度三 回归分析与正态分布的综合问题
某地一商场记录了 12 月份某 5 天当中某商品的销售量 y(单位:kg)与该地当日最高
气温 x(单位:℃)的相关数据,如下表:
x 11 9 8 5 2
y 7 8 8 10 12
(1)试求 y 与 x 的回归方程y^
=b^
x+a^
;
(2)判断 y 与 x 之间是正相关还是负相关;若该地 12 月某日的最高气温是 6 ℃,试用所求
回归方程预测这天该商品的销售量;
(3)假定该地 12 月份的日最高气温 X~N(μ,σ2),其中 μ 近似取样本平均数 x,σ2 近似取样
本方差 s2,试求 P(3.86.635,
所以有 99%的把握认为对下“禁奥令”的态度与性别有关.
(2)由题意,可知在这 10 人中,男、女生各 5 人,其中男生有 4 人、女生有 2 人认为不应
下“禁奥令”,ξ 的所有可能取值有 1,2,3,4.
P(ξ=1)=
CCC
CC = 12
100;
P(ξ=2)=
CC+CCCC
CC = 42
100;
P(ξ=3)=
CCC+CCC
CC = 40
100;
P(ξ=4)=
CC
CC= 6
100.
所以 ξ 的分布列是
ξ 1 2 3 4
P 12
100
42
100
40
100
6
100
所以 E(ξ)=12+2 × 42+3 × 40+4 × 6
100 =2.4.
独立性检验的关键
(1)根据 2×2 列联表准确计算 K2,若 2×2 列联表没有列出来,要先列出此表.
(2)K2 的观测值 k 越大,对应假设事件 H0 成立的概率越小,H0 不成立的概率越大.
[对点训练]
(2019·武汉市调研测试)2019 年,在庆祝中华人民共和国成立 70 周年之际,又迎来了以“创
军人荣耀,筑世界和平”为口号的第七届世界军人运动会(以下简称“军运会”).据悉,这次
军运会将于 2019 年 10 月 18 日至 27 日在美丽的江城武汉举行,届时将有来自 100 多个国家
的近万名军人运动员参赛.相对于奥运会、亚运会等大型综合赛事,军运会或许对很多人来
说还很陌生,所以武汉某高校为了在学生中更广泛地推介普及军运会相关知识内容,特在网
络上组织了一次“我所知晓的武汉军运会”知识问答比赛.为便于对答卷进行对比研究,组
委会抽取了 1 000 名男生和 1 000 名女生的答卷,他们的成绩(单位:分)频率分布直方图如下:
(注:答卷满分 100 分,成绩≥80 的答卷为“优秀”等级)
(1)从现有 1 000 名男生和 1 000 名女生的答卷中各取一份,分别求答卷成绩为“优秀”等
级的概率;
(2)求下面列联表中 a,b,c,d 的值,并根据列联表回答:能否在犯错误的概率不超过
0.025 的前提下认为“答卷成绩为‘优秀’等级与性别有关”?
男 女 总计
优秀 a b a+b
非优秀 c d c+d
总计 1 000 1 000 2 000
(3)根据男、女生成绩频率分布直方图,对他们的成绩的优劣进行比较.
附:
P(K2≥k0) 0.05 0.025 0.010
k0 3.841 5.024 6.635
K2= n(ad-bc)2
(a+b)(c+d)(a+c)(b+d),其中 n=a+b+c+d.
解:(1)男生答卷成绩为“优秀”等级的概率 P=(0.058+0.034+0.014+0.010)×5=0.58,
女生答卷成绩为“优秀”等级的概率 P=(0.046+0.034+0.016+0.010)×5=0.53.
(2)
男 女 总计
优秀 580 530 1 110
非优秀 420 470 890
总计 1 000 1 000 2 000
所以 a=580,b=530,c=420,d=470.
由 K2 = n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)得 , K2 =
2 000 × (580 × 470-530 × 420)2
1 110 × 890 × 1 000 × 1000 ≈5.061>5.024,
所以在犯错误的概率不超过 0.025 的前提下认为“答卷成绩为‘优秀’等级与性别有
关”.
(3)根据男、女生成绩频率分布直方图可得,男、女生成绩的中位数均在 80 到 85 之间,
但男生的成绩分布集中程度较女生成绩分布集中程度高,因此,可以认为男生的成绩较好且
稳定.
[A 组 夯基保分专练]
一、选择题
1.某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有 20
000 人,其中各种态度对应的人数如下表所示:
最喜爱 喜爱 一般 不喜欢
4 800 7 200 6 400 1 600
电视台为了了解观众的具体想法和意见,打算从中抽选出 100 人进行更为详细的调查,
为此要进行分层抽样,那么在分层抽样时,每类人中应抽选出的人数分别为( )
A.25,25,25,25 B.48,72,64,16
C.20,40,30,10 D.24,36,32,8
解析:选 D.法一:因为抽样比为 100
20 000= 1
200,
所以每类人中应抽选出的人数分别为
4 800× 1
200=24,7 200× 1
200=36,6 400× 1
200=32,1 600× 1
200=8.故选 D.
法二:最喜爱、喜爱、一般、不喜欢的比例为 4 800∶7 200∶6 400∶1 600=6∶9∶8∶2,
所以每类人中应抽选出的人数分别为 6
6+9+8+2×100=24, 9
6+9+8+2×100=36,
8
6+9+8+2×100=32, 2
6+9+8+2×100=8,故选 D.
2.(2019·湖南省五市十校联考)在某次赛车中,50 名参赛选手的成绩(单位:min)全部介于
13 到 18 之间(包括 13 和 18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,
第五组[17,18],其频率分布直方图如图所示,若成绩在[13,15)内的选手可获奖,则这 50 名
选手中获奖的人数为( )
A.39 B.35
C.15 D.11
解析:选 D.由频率分布直方图知成绩在[15,18]内的频率为(0.38+0.32+0.08)×1=0.78,
所以成绩在[13,15)内的频率为 1-0.78=0.22,则成绩在[13,15)内的选手有 50×0.22=
11(人),即这 50 名选手中获奖的人数为 11,故选 D.
3.(2019·武汉市调研测试)某学校为了了解本校学生的上学方式,在全校范围内随机抽查
部分学生,了解到上学方式主要有:A—结伴步行,B—自行乘车,C—家人接送,D—其他方
式.并将收集的数据整理绘制成如下两幅不完整的统计图.请根据图中信息,求本次抽查的
学生中 A 类人数是( )
A.30 B.40
C.42 D.48
解析:选 A.由条形统计图知,B—自行乘车上学的有 42 人,C—家人接送上学的有 30 人,
D—其他方式上学的有 18 人,采用 B,C,D 三种方式上学的共 90 人,设 A—结伴步行上学
的有 x 人,由扇形统计图知,A—结伴步行上学与 B—自行乘车上学的学生占 60%,所以x+42
x+90
= 60
100,解得 x=30,故选 A.
4.(2019·广东六校第一次联考)某单位为了落实“绿水青山就是金山银山”理念,制定节
能减排的目标,先调查了用电量 y(单位:kW·h)与气温 x(单位:℃)之间的关系,随机选取了
4 天的用电量与当天气温,并制作了如下对照表:
x(单位:℃) 17 14 10 -1
y(单位:kW·h) 24 34 38 a
由表中数据得线性回归方程y^
=-2x+60,则 a 的值为( )
A.48 B.62
C.64 D.68
解析:选 C.由题意,得 x=17+14+10-1
4 =10,y=24+34+38+a
4 =96+a
4 .样本点的中
心(x,y)在回归直线y^
=-2x+60 上,代入线性回归方程可得96+a
4 =-20+60,解得 a=64,
故选 C.
5.(2019·郑州市第二次质量预测)将甲、乙两个篮球队各 5 场比赛的得分数据整理成如图
所示的茎叶图,由图可知以下结论正确的是( )
A.甲队平均得分高于乙队的平均得分
B.甲队得分的中位数大于乙队得分的中位数
C.甲队得分的方差大于乙队得分的方差
D.甲、乙两队得分的极差相等
解析:选 C.由题中茎叶图得,甲队的平均得分 x 甲=26+28+29+31+31
5 =29,乙队的平
均得分 x 乙=28+29+30+31+32
5 =30,x 甲s 2乙,选项 C 正
确;甲队得分的极差为 31-26=5,乙队得分的极差为 32-28=4,两者不相等,选项 D 不正
确.故选 C.
6.(多选)CPI 是居民消费价格指数(consumer price index)的简称.居民消费价格指数是一
个反映居民家庭一般所购买的消费品和服务项目价格水平变动情况的宏观经济指标.如图是
根据国家统计局发布的 2017 年 6 月—2018 年 6 月我国 CPI 涨跌幅数据绘制的折线图(注:
2018 年 6 月与 2017 年 6 月相比较,叫同比;2018 年 6 月与 2018 年 5 月相比较,叫环比),根
据该折线图,则下列结论错误的是 ( )
A.2018 年 1 月至 6 月各月与去年同期比较,CPI 有涨有跌
B.2018 年 2 月至 6 月 CPI 只跌不涨
C.2018 年 3 月以来,CPI 在缓慢增长
D.2017 年 8 月与同年 12 月相比较,8 月环比更大
解析:选 ABC.A 选项,2018 年 1 月至 6 月各月与去年同期比较,CPI 均是上涨的,故 A
错误;B 选项,2018 年 2 月 CPI 是增长的,故 B 错误;C 选项,2018 年 3 月以来,CPI 是下
跌的,故 C 错误;D 选项,2017 年 8 月 CPI 环比增长 0.4%,12 月环比增长 0.3%,故 D 正
确.故选 ABC.
二、填空题
7.如图是某学校一名篮球运动员在 10 场比赛中所得分数的茎叶图,则该运动员在这 10
场比赛中得分的中位数为________,平均数为________.
解析:把 10 场比赛的所得分数按顺序排列为 5,8,9,12,14,16,16,19,21,24,
中间两个为 14 与 16,故中位数为14+16
2 =15,平均数为 1
10(5+8+9+12+14+16+16+19+
21+24)=14.4.
答案:15 14.4
8.已知一组数据 x1,x2,…,xn 的方差为 2,若数据 ax1+b,ax2+b,…,axn+b(a>0)的
方差为 8,则 a 的值为________.
解析:根据方差的性质可知,a2×2=8,故 a=2.
答案:2
9.给出下列四个命题:
①某班级一共有 52 名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为
4 的样本,如果 7 号、33 号、46 号同学在样本中,那么样本中另一位同学的编号为 23;
②一组数据 1,2,3,3,4,5 的平均数、众数、中位数都相同;
③若一组数据 a,0,1,2,3 的平均数为 1,则其标准差为 2;
④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y^
=a^
+b^
x,其中a^
=2,x=1,y=3,则b^
=1.
其中真命题有________(填序号).
解析:在①中,由系统抽样知抽样的分段间隔为 52÷4=13,故抽取的样本的编号分别为 7
号、20 号、33 号、46 号,故①是假命题;在②中,数据 1,2,3,3,4,5 的平均数为1
6(1+
2+3+3+4+5)=3,中位数为 3,众数为 3,都相同,故②是真命题;在③中,因为样本的平
均数为 1,所以 a+0+1+2+3=5,解得 a=-1,故样本的方差为1
5[(-1-1)2+(0-1)2+(1-
1)2+(2-1)2+(3-1)2]=2,标准差为 2,故③是假命题;在④中,回归直线方程为y^
=b^
x+2,
又回归直线过点(x,y),把(1,3)代入回归直线方程y^
=b^
x+2,得b^
=1,故④是真命题.
答案:②④
三、解答题
10.(2019·兰州市诊断考试)“一本书,一碗面,一条河,一座桥”曾是兰州的城市名片,
而现在“兰州马拉松”又成为了兰州的另一张名片,随着全民运动健康意识的提高,马拉松
运动不仅在兰州,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人数逐年增加.为
此,某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马
拉松运动的人中随机抽取 200 人,对其每周参与马拉松长跑训练的天数进行统计,得到以下
统计表:
平均每周进行长跑训练天数 不大于 2 3 或 4 不少于 5
人数 30 130 40
若某人平均每周进行长跑训练天数不少于 5,则称其为“热烈参与者”,否则称为“非热
烈参与者”.
(1)经调查,该市约有 2 万人参与马拉松运动,试估计其中“热烈参与者”的人数;
(2)根据上表的数据,填写下列 2×2 列联表,并通过计算判断是否能在犯错误的概率不超
过 0.01 的前提下认为“热烈参与马拉松”与性别有关?
热烈参与者 非热烈参与者 总计
男 140
女 55
总计
附:K2= n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)(n 为样本容量)
P(K2 0.500 0.400 0.250 0.150 0.100 0.050 0.025 0.010 0.005 0.001
≥k0)
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879
10.82
8
解:(1)以 200 人中“热烈参与者”的频率作为概率,则该市“热烈参与者”的人数约为 20
000× 40
200=4 000.
(2)2×2 列联表为
热烈参与者 非热烈参与者 总计
男 35 105 140
女 5 55 60
总计 40 160 200
K2=200 × (35 × 55-105 × 5)2
40 × 160 × 140 × 60 ≈7.292>6.635,
故能在犯错误的概率不超过 0.01 的前提下认为“热烈参与马拉松”与性别有关.
11.(2019·武汉市调研测试)中共十九大以来,某贫困地区扶贫办积极贯彻落实国家精准
扶贫的要求,带领广大农村地区人民群众脱贫奔小康.经过不懈的奋力拼搏,新农村建设取
得巨大进步,农民年收入也逐年增加.
为了更好地制定 2019 年关于加快提升农民年收入,力争早日脱贫的工作计划,该地扶贫
办统计了 2018 年 50 位农民的年收入(单位:千元)并制成如下频率分布直方图:
(1)根据频率分布直方图,估计 50 位农民的年平均收入 x(单位:千元)(同一组数据用该组
数据区间的中点值表示).
(2)由频率分布直方图,可以认为该贫困地区农民年收入 X 服从正态分布 N(μ,σ2),其中 μ
近似为年平均收入 x,σ2 近似为样本方差 s2,经计算得 s2=6.92.利用该正态分布,解决下列问
题:
(i)在 2019 年脱贫攻坚工作中,若使该地区约有占总农民人数的 84.14%的农民的年收入高
于扶贫办制定的最低年收入标准,则最低年收入大约为多少千元?
(ii)为了调研“精准扶贫,不落一人”的落实情况,扶贫办随机走访了 1 000 位农民.若每
个农民的年收入相互独立,问:这 1 000 位农民中年收入不少于 12.14 千元的人数最有可能是
多少?
附:参考数据与公式
6.92≈2.63,若 X~N(μ,σ2),则
①P(μ-σμ-σ)≈1
2+0.682 7
2 ≈0.841 4,
μ-σ≈17.40-2.63=14.77,
即最低年收入大约为 14.77 千元.
(ii)由 P(X≥12.14)=P(X≥μ-2σ)≈0.5+ 0.954 5
2 ≈0.977 3,得每个农民的年收入不少于
12.14 千元的事件的概率为 0.977 3,记这 1 000 位农民中年收入不少于 12.14 千元的人数为 ξ,
则 ξ~B(103,p),其中 p=0.977 3,于是恰好有 k 位农民的年收入不少于 12.14 千元的事件的
概率是 P(ξ=k)=Ck103pk(1-p)103-k,
从而由 P(ξ=k)
P(ξ=k-1)=
(1 001-k) × p
k × (1-p) >1,得 k<1 001p,
由 P(ξ=k)
P(ξ=k+1)=
(k+1)(1-p)
(1 000-k)p >1,得 k>1 001p-1,
而 1 001p=978.277 3,
所以,977.277 30.63,所以 C 同学物理成绩比数学成绩要好一些.
3.(2019·济南市模拟考试)某客户准备在家中安装一套净水系统,该系统为三级过滤,使
用寿命为十年.如图所示,两个一级过滤器采用并联安装,二级过滤器与三级过滤器为串联
安装.
其中每一级过滤都由核心部件滤芯来实现.在使用过程中,一级滤芯和二级滤芯都需要
不定期更换(每个滤芯是否需要更换相互独立),三级滤芯无需更换.若客户在安装净水系统的
同时购买滤芯,则一级滤芯每个 80 元.二级滤芯每个 160 元.若客户在使用过程中单独购买
滤芯,则一级滤芯每个 200 元,二级滤芯每个 400 元.现需决策安装净水系统的同时购买滤
芯的数量,为此参考了根据 100 套该款净水系统在十年使用期内更换滤芯的相关数据制成的
图表,其中图 1 是根据 200 个一级过滤器更换的滤芯个数制成的柱状图,表 1 是根据 100 个
二级过滤器更换的滤芯个数制成的频数分布表.
二级滤芯更换的个数 5 6
频数 60 40
表 1
以 200 个一级过滤器更换滤芯的频率代替 1 个一级过滤器更换滤芯发生的概率,以 100
个二级过滤器更换滤芯的频率代替 1 个二级过滤器更换滤芯发生的概率.
(1)求一套净水系统在使用期内需要更换的各级滤芯总个数恰好为 30 的概率;
(2)记 X 表示该客户的净水系统在使用期内需要更换的一级滤芯总数,求 X 的分布列及数
学期望;
(3)记 m,n 分别表示该客户在安装净水系统的同时购买的一级滤芯和二级滤芯的个数,
若 m+n=28,且 n∈{5,6},以该客户的净水系统在使用期内购买各级滤芯所需总费用的期
望值为决策依据,试确定 m,n 的值.
解:(1)由题意可知,若一套净水系统在使用期内需要更换的各级滤芯总个数恰好为 30,
则该套净水系统中的两个一级过滤器均需更换 12 个滤芯,二级过滤器需要更换 6 个滤芯.
设“一套净水系统在使用期内需要更换的各级滤芯总个数恰好为 30”为事件 A,因为一
个一级过滤器需要更换 12 个滤芯的概率为 0.4,二级过滤器需要更换 6 个滤芯的概率为 0.4,
所以 P(A)=0.4×0.4×0.4=0.064.
(2)由柱状图可知,
一个一级过滤器需要更换的滤芯个数为 10,11,12,对应的概率分别为 0.2,0.4,0.4,
由题意,X 可能的取值为 20,21,22,23,24,并且 P(X=20)=0.2×0.2=0.04,
P(X=21)=0.2×0.4×2=0.16,
P(X=22)=0.4×0.4+0.2×0.4×2=0.32,
P(X=23)=0.4×0.4×2=0.32,
P(X=24)=0.4×0.4=0.16.
所以 X 的分布列为
X 20 21 22 23 24
P 0.04 0.16 0.32 0.32 0.16
E(X)=20×0.04+21×0.16+22×0.32+23×0.32+24×0.16=22.4.
(3)因为 m+n=28,n∈{5,6},所以若 m=22,n=6,
则该客户在十年使用期内购买各级滤芯所需总费用的期望值为
22×80+200×0.32+400×0.16+6×160=2 848.
若 m=23,n=5,
则该客户在十年使用期内购买各级滤芯所需总费用的期望值为
23×80+200×0.16+5×160+400×0.4=2 832.
故 m,n 的值分别为 23,5.
4.某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.根据过去 50 周的资料显示,该地
周光照量 X(单位:小时)都在 30 小时以上,其中不足 50 小时的有 5 周,不低于 50 小时且不
超过 70 小时的有 35 周,超过 70 小时的有 10 周.根据统计,该基地的西红柿增加量 y(千克)
与使用某种液体肥料的质量 x(千克)之间的关系为如图所示的折线图.
(1)依据折线图,是否可用线性回归模型拟合 y 与 x 的关系?请计算相关系数 r 并加以说明
(精确到 0.01);(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每
周光照控制仪运行台数受周光照量 X 限制,并有如下关系:
周光照量 X(单位:小时) 3070
光照控制仪运行台数 3 2 1
若某台光照控制仪运行,则该台光照控制仪周利润为 3 000 元;若某台光照控制仪未运行,
则该台光照控制仪周亏损 1 000 元.以频率作为概率,商家欲使周总利润的均值达到最大,应
安装光照控制仪多少台?
附相关系数公式:r=
∑n
i=1
(xi-x)(yi-y)
∑n
i=1
(xi-x)2 ∑n
i=1
(yi-y)2
,
参考数据: 0.3≈0.55, 0.9≈0.95.
解:(1)由已知数据可得 x=2+4+5+6+8
5 =5,y=3+4+4+4+5
5 =4.
因为
5
∑
i=1
(xi-x)(yi-y)=(-3)×(-1)+0+0+0+3×1=6,
5
∑
i=1
(xi-x)2= (-3)2+(-1)2+02+12+32=2 5,
5
∑
i=1
(yi-y)2= (-1)2+02+02+02+12= 2,
所以相关系数 r=
∑5
i=1
(xi-x)(yi-y)
∑5
i=1
(xi-x)2 ∑5
i=1
(yi-y)2
= 6
2 5 × 2
= 9
10≈0.95.
因为|r|>0.75,所以可用线性回归模型拟合 y 与 x 的关系.
(2)记商家周总利润为 Y 元,由条件可知至少需安装 1 台,最多安装 3 台光照控制仪.
①安装 1 台光照控制仪可获得周总利润 3 000 元.
②安装 2 台光照控制仪的情形:
当 X>70 时,只有 1 台光照控制仪运行,此时周总利润 Y=3 000-1 000=2 000(元),P(Y=
2 000)=10
50=0.2,
当 3070 时,只有 1 台光照控制仪运行,此时周总利润
Y=1×3 000-2×1 000=1 000(元).
P(Y=1 000)=10
50=0.2.
当 50≤X≤70 时,有 2 台光照控制仪运行,此时周总利润
Y=2×3 000-1×1 000=5 000(元),
P(Y=5 000)=35
50=0.7,
当 30
查看更多