2019届二轮复习(理)专题60离散型随机变量的均值学案(全国通用)
1.理解取有限个值的离散型随机变量的均值、方差的概念.
2.借助直观直方图认识正态分布曲线的特点及曲线所表示的意义.
3.会求简单离散型随机变量的均值、方差,并能解决一些简单问题.
1.离散型随机变量的均值与方差
一般地,若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
(1)均值
称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望.它反映了离散型随机变量取值的平均水平.
(2)方差
称D(X)=(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,并称其算术平方根为随机变量X的标准差.
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b.
(2)D(aX+b)=a2D(X).(a,b为常数)
3.两点分布与二项分布的均值、方差
(1)若随机变量X服从两点分布,则E(X)=p,D(X)=p(1-p).
(2)若X B(n,p),则E(X)=np,D(X)=np(1-p).
4.正态分布
(1)正态曲线:函数φμ,σ(x)=,x∈(-∞,+∞),其中实数μ和σ为参数(σ>0,μ∈R).我们称函数φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线.
(2)正态曲线的特点
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图甲所示;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.
(3)正态分布的定义及表示
一般地,如果对于任何实数a,b(a
120
发电机最多可运行台数
1
2
3
若某台发电机运行,则该台发电机年利润为5 000万元;若某台发电机未运行,则该台发电机年亏损800万元.欲使水电站年总利润的均值达到最大,应安装发电机多少台?
解 (1)依题意,得p1=P(40120)==0.1.
由二项分布可知,在未来4年中,至多有1年的年入流量超过120的概率为
p=C(1-p3)4+C(1-p3)3p3
=4+4×3×=0.947 7.
Y
4 200
10 000
P
0.2
0.8
所以,E(Y)=4 200×0.2+10 000×0.8=8 840.
③安装3台发电机的情形.
依题意,当40120时,三台发电机运行,此时Y=5 000×3=15 000,因此P(Y=15 000)=P(X>120)=p3=0.1,由此得Y的分布列如下:
Y
3 400
9 200
15 000
P
0.2
0.7
0.1
所以,E(Y)=3 400×0.2+9 200×0.7+15 000×0.1=8 620.
综上,欲使水电站年总利润的均值达到最大,应安装发电机2台.
【感悟提升】随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.
【变式探究】某投资公司在2018年年初准备将1 000万元投资到“低碳”项目上,现有两个项目供选择:
项目一:新能源汽车.据市场调研,投资到该项目上,到年底可能获利30 ,也可能亏损15
,且这两种情况发生的概率分别为和;
项目二:通信设备.据市场调研,投资到该项目上,到年底可能获利50 ,可能损失30 ,也可能不赔不赚,且这三种情况发生的概率分别为,和.
针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由.
解 若按“项目一”投资,设获利为X1万元,则X1的分布列为
X1
300
-150
P
∴E(X1)=300×+(-150)×=200.学 .
若按“项目二”投资,设获利为X2万元,则X2的分布列为
X2
500
-300
0 ]
P
高频考点三 正态分布的应用
例3、为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的均值;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=i=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值 ,用样本标准差s作为σ的估计值 ,利用估计值判断是否需对当天的生产过程进行检查?剔除( -3 , +3 )之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量 服从正态分布N(μ,σ2),则P(μ-3σ< <μ+3σ)=0.997 4,0.997 416≈0.959 2,≈0.09.
解 (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
E(X)=16×0.002 6=0.041 6.
(ⅱ)由=9.97,s≈0.212,得μ的估计值为 =9.97,σ的估计值为 =0.212,由样本数据可以看出有一个零件的尺寸在( -3 , +3 )之外,因此需对当天的生产过程进行检查.
剔除(-3 , +3 )之外的数据9.22,剩下数据的平均数为×(16×9.97-9.22)=10.02.
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134.
剔除( -3 , +3 )之外的数据9.22,剩下数据的样本方差为×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
【感悟提升】解决正态分布问题有三个关键点:(1)对称轴x=μ;(2)标准差σ
;(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x=0.
【变式探究】从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组中的数据用该组区间的中点值作代表);
(2)由直方图可以认为,这种产品的质量指标值 服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①利用该正态分布,求P(187.8< <212.2);
②某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用①的结果,求E(X).
附:≈12.2.
若 N(μ,σ2),则P(μ-σ< <μ+σ)=0.682 6,
P(μ-2σ< <μ+2σ)=0.954 4.
解 (1)抽取产品的质量指标值的样本平均数和样本方差s2分别为
=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
高频考点四 离散型随机变量的均值与方差问题
例4、为回馈顾客,某商场拟通过模拟兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.
(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元,求:
①顾客所获的奖励额为60元的概率;
②顾客所获的奖励额的分布列及均值;
(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.
解 (1)设顾客所获的奖励额为X.
①依题意,得P(X=60)==,
即顾客所获的奖励额为60元的概率为.[2分]
②依题意,得X的所有可能取值为20,60.
P(X=60)=,P(X=20)==,
故X的分布列为
X
20
60
P
所以顾客所获的奖励额的均值为
E(X)=20×+60×=40.
(2)根据商场的预算,每个顾客的平均奖励额为60元,
所以,先寻找均值为60的可能方案.
对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,
因为60元是面值之和的最大值,
所以均值不可能为60元;
对于方案1,即方案(10,10,50,50),
设顾客所获的奖励额为X1,
则X1的分布列为
X1
20
60
100
P
X1的均值为E(X1)=20×+60×+100×=60,
X1的方差为D(X1)=(20-60)2×+(60-60)2×+(100-60)2×=.[9分]
对于方案2,即方案(20,20,40,40),
设顾客所获的奖励额为X2,
则X2的分布列为
X2
40
60
80
P
X2的均值为E(X2)=40×+60×+80×=60,
X2的方差为D(X2)=(40-60)2×+(60-60)2×+(80-60)2×=.
由于两种方案的奖励额的均值都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.
【方法技巧】求离散型随机变量的均值和方差问题的一般步骤
第一步:确定随机变量的所有可能取值;
第二步:求每一个可能取值所对应的概率;
第三步:列出离散型随机变量的分布列;
第四步:求均值和方差;
第五步:根据均值、方差进行判断,并得出结论(适用于均值、方差的应用问题);
第六步:反思回顾.查看关键点、易错点和答题规范性.
11. (2018年北京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:
电影类型
第一类
第二类
第三类
第四类
第五类
第六类
电影部数
140
50
300
200
800
510
好评率
0.4
0.2
0.15
0.25
0.2
0.1
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.
(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;
(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;
(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“”表示第k类电影得到人们喜欢,“”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差,,,,,的大小关系.
【答案】(1) 概率为0.025
(2) 概率估计为0.35
(3) >>=>>
(Ⅱ)设事件A为“从第四类电影中随机选出的电影获得好评”,
事件B为“从第五类电影中随机选出的电影获得好评”.
故所求概率为P()=P()+P()
=P(A)(1–P(B))+(1–P(A))P(B).
由题意知:P(A)估计为0.25,P(B)估计为0.2.
故所求概率估计为0.25×0.8+0.75×0.2=0.35.
(Ⅲ)>>=>>.
1.(2017·浙江)已知随机变量ξi满足P(ξi=1)=pi,P(ξi=0)=1-pi,i=1,2.若0<p1<p2<,则( )
A.E(ξ1)<E(ξ2),D(ξ1)<D(ξ2)
B.E(ξ1)<E(ξ2),D(ξ1)>D(ξ2)
C.E(ξ1)>E(ξ2),D(ξ1)<D(ξ2)
D.E(ξ1)>E(ξ2),D(ξ1)>D(ξ2)
答案 A
2.(2017·全国Ⅱ)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则D(X)= .
答案 1.96
解析 由题意得X B(100,0.02),
∴D(X)=100×0.02×(1-0.02)=1.96.
3. (2017·全国Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的均值;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=i=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值 ,用样本标准差s作为σ的估计值 ,利用估计值判断是否需对当天的生产过程进行检查?剔除( -3 , +3 )之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量 服从正态分布N(μ,σ2),则P(μ-3σ< <μ+3σ)=0.997 4,0.997 416≈0.959 2,≈0.09.
解 (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
E(X)=16×0.002 6=0.041 6.
(ⅱ)由=9.97,s≈0.212,得μ的估计值为 =9.97,σ的估计值为 =0.212,由样本数据可以看出有一个零件的尺寸在( -3 , +3 )之外,因此需对当天的生产过程进行检查.
剔除( -3 , +3 )之外的数据9.22,剩下数据的平均数为×(16×9.97-9.22)=10.02.
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134.
剔除( -3 , +3 )之外的数据9.22,剩下数据的样本方差为×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
4.(2017·江苏)已知一个口袋有m个白球,n个黑球(m,n∈N ,n≥2),这些球除颜色外完全相同.现将口袋中的球随机的逐个取出,并放入如图所示的编号为1,2,3,…,m+n的抽屉内,其中第k次取球放入编号为k的抽屉(k=1,2,3,…,m+n).
1
2
3
…
m+n
(1)试求编号为2的抽屉内放的是黑球的概率p;
(2)随机变量X表示最后一个取出的黑球所在抽屉编号的倒数,E(X)是X的均值,证明:E(X)<. ]
(1)解 编号为2的抽屉内放的是黑球的概率为
p==.
(2)证明 随机变量X的分布列为
X
…
…
P
…
…
随机变量X的均值为
E(X)=·=·.
3.(2017·天津)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为,,.
(1)设X表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X的分布列和均值;
(2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率.
解 (1)随机变量X的所有可能取值为0,1,2,3,
P(X=0)=××=,
P(X=1)=××+××+××=,
P(X=2)=××+××+××=,
P(X=3)=××=.
所以,随机变量X的分布列为
X
0
1
2
3
P
随机变量X的均值E(X)=0×+1×+2×+3×=.