- 2021-02-26 发布 |
- 37.5 KB |
- 26页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
高考数学二轮复习教案:第二编 专题六 第2讲 统计、统计案例
第2讲 统计、统计案例 「考情研析」 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等. 2.概率与统计的交汇问题是高考的热点,以解答题形式出现,难度中等. 核心知识回顾 1.三种抽样方法的特点 简单随机抽样:操作简便、适当,总体个数较少. 分层抽样:按比例抽样. 系统抽样:等距抽样. 2.必记公式 数据x1,x2,x3,…,xn的数字特征公式: (1)平均数:=. (2)方差:s2=[(x1-)2+(x2-)2+…+(xn-)2]. (3)标准差: s= . 3.重要性质及结论 (1)频率分布直方图的三个结论 ①小长方形的面积=组距×=频率; ②各小长方形的面积之和等于1; ③小长方形的高=,所有小长方形高的和为. (2)回归直线方程:一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)其回归方程=x+ ,其过样本点中心(,). (3)独立性检验 K2=(其中n=a+b+c+d为样本容量). 热点考向探究 考向1 抽样方法 例1 (1)从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为( ) A.480 B.481 C.482 D.483 答案 C 解析 ∵样本中编号最小的两个编号分别为007,032, ∴样本数据组距为32-7=25,则样本容量为=20,则对应的号码数x=7+25(n-1),当n=20时,x取得最大值,此时x=7+25×19=482.故选C. (2)(2019·广州普通高中高三综合测试)某公司生产A,B,C三种不同型号的轿车,产量之比依次为2∶3∶4,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n的样本,若样本中A种型号的轿车比B种型号的轿车少8辆,则n=( ) A.96 B.72 C.48 D.36 答案 B 解析 由题意,得n-n=-8,∴n=72.选B. 系统抽样与分层抽样的求解方法 (1)系统抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的号码和组距唯一确定.每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d为公差的等差数列{an},第k组抽取样本的号码ak=m+(k-1)d. (2)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,求解此类问题需先求出抽样比——样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总数与抽样比的乘积.在每层抽样时,应采用简单随机抽样或系统抽样进行. 1.(2019·云南省第二次高三统一检测) 某中学高一年级有学生1200人,高二年级有学生900人,高三年级有学生1500人,现按年级为标准,用分层抽样的方法从这三个年级学生中抽取一个容量为720的样本进行某项研究,则应从高三年级学生中抽取学生( ) A.200人 B.300人 C.320人 D.350人 答案 B 解析 由分层抽样可得高三抽取的学生人数为 ×720=300.故选B. 2.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入[1,450]的人做问卷A,编号落入[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为________. 答案 10 解析 由题意得系统抽样的抽样间隔为=30,又因为第一组内抽取的号码为9,则由451≤9+30k≤750(k∈N*),得14≤k≤24,所以做问卷B的人数为10. 考向2 用样本估计总体 例2 (1)甲、乙两名学生在5次数学考试中的成绩统计如茎叶图所示,若甲,乙分别表示甲、乙两人的平均成绩,则下列结论正确的是( ) A.甲>乙,乙比甲稳定 B.甲>乙,甲比乙稳定 C.甲<乙,乙比甲稳定 D.甲<乙,甲比乙稳定 答案 A 解析 因为甲=×(74+82+88+91+95)=86, 乙=×(77+77+78+86+92)=82,所以甲>乙. 因为s=×[(-12)2+(-4)2+22+52+92]=54, s=×[(-5)2+(-5)2+(-4)2+42+102]=36.4,所以s>s,故乙比甲稳定.故选A. (2)(2019·皖南八校高三第三次联考)从某地区年龄在25~55岁的人员中,随机抽出100人,了解他们对今年两会的热点问题的看法,绘制出频率分布直方图如图所示,则下列说法正确的是( ) A.抽出的100人中,年龄在40~45岁的人数大约为20 B.抽出的100人中,年龄在35~45岁的人数大约为30 C.抽出的100人中,年龄在40~50岁的人数大约为40 D.抽出的100人中,年龄在35~50岁的人数大约为50 答案 A 解析 根据频率分布直方图的性质得(0.01+0.05+0.06+a+0.02+0.02)×5=1,解得a=0.04,所以抽出的100人中,年龄在40~45岁的人数大约为0.04×5×100=20,所以A正确;年龄在35~45岁的人数大约为(0.06+0.04)×5×100=50,所以B不正确;年龄在40~50岁的人数大约为(0.04+0.02)×5×100=30,所以C不正确;年龄在35~50岁的人数大约为(0.06+0.04+0.02)×5×100=60,所以D不正确.故选A. (1)频率分布直方图中每个小矩形的面积为对应的频率,不要混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错. (2)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断. 1.(2019·福建省高三模拟)为比较甲、乙两名高二学生的数学素养,对课程标准中规定的数学六大素养进行指标测验(指标值满分为5分,分值高者为优),根据测验情况绘制了如图所示的六大素养指标雷达图,则下面叙述正确的是( ) A.乙的数据分析素养优于甲 B.乙的数学建模素养优于数学抽象素养 C.甲的六大素养整体水平优于乙 D.甲的六大素养中数据分析最差 答案 C 解析 根据雷达图得到如下数据所示. 由数据可知选C. 2. (2019·江西省吉安一中、九江一中、新余一中等八所重点中学高三4月联考)某地区某村的前三年的经济收入分别为100,200,300万元,其统计数据的中位数为x,平均数为y;经过今年政府新农村建设后,该村经济收入在上年基础上翻番,则在这4年里收入的统计数据中,下列说法正确的是( ) A.中位数为x,平均数为1.5y B.中位数为1.25x,平均数为y C.中位数为1.25x,平均数为1.5y D.中位数为1.5x,平均数为2y 答案 C 解析 依题意,前三年中位数x=200,平均数y==200,第四年收入为600万元,故中位数为=250=1.25x,平均数为 =300=1.5y.故选C. 考向3 回归分析与独立性检验 角度1 回归分析在实际中的应用 例3 某市地产数据研究所的数据显示,2016年该市新建住宅销售均价走势如下图所示,3月至7月房价上涨过快,政府从8月开始采取宏观调控措施,10月份开始房价得到很好的抑制. (1)地产数据研究所发现,3月至7月的各月均价y(万元/平方米)与月份x之间具有较强的线性相关关系,试建立y关于x的回归方程;政府若不调控,依此相关关系预测第12月份该市新建住宅销售均价; (2)地产数据研究所在2016年的12个月中,随机抽取三个月的数据作样本分析,若关注所抽三个月份的所属季度,记所属季度的个数为X,求X的分布列和数学期望. 参考数据:xi=25,yi=5.36, (xi-)(yi-)=0.64; 回归方程=x+中斜率和截距的最小二乘法估计公式分别为:=,=- . 解 (1) 月份x 3 4 5 6 7 均价y 0.95 0.98 1.11 1.12 1.20 计算可得=5,=1.072, (xi-)2=10, 所以==0.064,=- =1.072-0.064×5=0.752. 所以从3月份至7月份y关于x的回归方程为=0.064x+0.752. 将2016年的12月份x=12代入回归方程,得=0.064×12+0.752=1.52, 所以预测12月份该市新建住宅的销售均价约为1.52万元/平方米. (2)根据题意,X的可能取值为1,2,3. P(X=1)==,P(X=3)==, P(X=2)=1-P(X=1)-P(X=3)=, 所以X的分布列为 X 1 2 3 P 因此,X的数学期望E(X)=1×+2×+3×=. 在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. (2019·太原市高三模拟) 近年来随着互联网的高速发展,旧货交易市场也得以快速发展.某网络旧货交易平台对2018年某种机械设备的线上交易进行了统计,得到如图所示的频率分布直方图和散点图.现把直方图中各组的频率视为概率,用x(单位:年)表示该设备的使用时间,y(单位:万元)表示其相应的平均交易价格. (1)已知2018年在此网络旧货交易平台成交的该种机械设备为100台,现从这100台设备中,按分层抽样抽取使用时间x∈(12,20]的4台设备,再从这4台设备中随机抽取2台,求这2台设备的使用时间都在(12,16]的概率; (2)由散点图分析后,可用y=ebx+a作为此网络旧货交易平台上该种机械设备的平均交易价格y关于其使用时间x的回归方程. iyi izi 5.5 8.7 1.9 301.4 79.75 385 表中z=ln y,=i. ①根据上述相关数据,求y关于x的回归方程; ②根据上述回归方程,求当使用时间x=15时,该种机械设备的平均交易价格的预报值(精确到0.01). 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu 的斜率和截距的最小二乘估计分别为=,=- . 参考数据:e0.55=1.733,e-0.95=0.3867,e-1.85=0.1572. 解 (1)由图1中频率分布直方图可知,从2018年成交的该种机械设备中使用时间x∈(12,16]的台数为100×4×0.03=12,使用时间x∈(16,20]的台数为100×4×0.01=4, ∴按分层抽样所抽取4台中,使用时间x∈(12,16]的设备有3台,分别记为A,B,C;使用时间x∈(16,20]的设备有1台,记为d, ∴从这4台设备中随机抽取2台的结果为(A,B),(A,C),(A,d),(B,C),(B,d),(C,d),共有6种等可能出现的结果,其中这2台设备的使用时间x都在(12,16]的结果为(A,B),(A,C),(B,C),共有3种,所求事件的概率为=. (2)①由题意得z=ln y=ln ebx+a=bx+a, ∵===-0.3, =- =1.9+0.3×5.5=3.55, ∴z关于x的线性回归方程为z=-0.3x+3.55, ∴y关于x的回归方程为y=e-0.3x+3.55. ②由①知,当使用时间x=15时,y=e-0.3×15+3.55≈0.39,故该种机械设备的平均交易价格的预报值为0.39万元. 角度2 独立性检验在实际中的应用 例4 现如今,“网购”一词不再新鲜,越来越多的人已经接受并喜欢了这种购物方式,但随之也出现了商品质量不能保证与信誉不好等问题,因此,相关管理部门制定了针对商品质量与服务的评价体系,现从评价系统中选出成功交易200例,并对其评价进行统计:对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次. (1)依据题中的数据完成下表,并通过计算说明,能否有99.9%的把握认为“商品好评与服务好评”有关; 对服务好评 对服务不满意 合计 对商品好评 对商品不满意 合计 (2)若将频率视为概率,某人在该购物平台上进行了5次购物,设对商品和服务全好评的次数为随机变量X,求X的分布列(概率用算式表示)、数学期望和方差. 参考数据: P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解 (1)2×2列联表 对服务好评 对服务不满意 合计 对商品好评 80 40 120 对商品不满意 70 10 80 合计 150 50 200 K2=≈11.111>10.828. ∴有99.9%的把握认为“商品好评与服务好评”有关. (2)由题意可知,对商品和服务全好评的概率为=. X的取值为0,1,2,3,4,5. 且X~B. ∵P(X=0)=5=, P(X=1)=C14=, P(X=2)=C23=, P(X=3)=C32=, P(X=4)=C4=, P(X=5)=C5=, ∴分布列为 X 0 1 2 3 4 5 P ∵X~B, ∴E(X)=5×=2.D(X)=5××=. 独立性检验的关键 (1)根据2×2列联表准确计算K2,若2×2列联表没有列出来,要先列出此表. (2)K2的观测值k越大,对应假设事件H0成立的概率越小,H0不成立的概率越大. (2019·西安地区陕师大附中、西安高级中学等八校联考)西安市自2017年5月启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,斑马线前礼让行人也成为了一张新的西安“名片”. 但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患及机动车通畅率降低,交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到2×2列联表如下: 30岁以下 30岁以上 合计 闯红灯 60 未闯红灯 80 合计 200 近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口试行了对闯红灯行人进行经济处罚,并从试行经济处罚后穿越该路口行人中随机抽取了200人进行调查,得到下表: 处罚金额x(单位:元) 5 10 15 20 闯红灯的人数y 50 40 20 0 将统计数据所得频率代替概率,完成下列问题. (1)将2×2列联表填写完整(不需写出填写过程),并根据表中数据分析,在未试行对闯红灯行人进行经济处罚前,是否有99.9%的把握认为闯红灯与年龄有关; (2)当处罚金额为10元时,行人闯红灯的概率会比不进行处罚降低多少; (3)结合调查结果,谈谈如何治理行人闯红灯现象. 参考公式:K2=,其中n=a+b+c+d. 参考数据: P(K2≥k0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 1.132 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解 (1) 30岁以下 30岁以上 合计 闯红灯 20 60 80 未闯红灯 80 40 120 合计 100 100 200 ∵K2==≈33.333>10.828. ∴有99.9%的把握认为闯红灯与年龄有关. (2)∵未进行处罚前,行人闯红灯的概率为0.4,进行处罚10元后,行人闯红灯的概率为==0.2,∴降低了0.2. (3)①根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对30岁以上人群开展“道路安全”宣传教育;②由于处罚可以明显降低行人闯红灯的概率,可以进行适当处罚来降低行人闯红灯的概率. 真题押题 『真题模拟』 1.(2019·益阳市高三模拟)如图所示的三个统计图分别是随机抽查甲、乙、丙三地的若干个家庭教育年投入(万元),记A表示众数,B表示中位数,C表示平均数,则根据图表提供的信息,下面的结论正确的是( ) A.A甲=A乙=A丙,B甲=B乙=B丙 B.B丙>B甲=B乙,C甲=C乙=C丙 C.A丙>A甲=A乙,C丙>C甲>C乙 D.A丙>A甲=A乙,B丙>B甲>B乙 答案 C 解析 由甲地的条形图可知,家庭教育年投入的中位数为10,众数为10,平均数为10.32;由乙地的折线图可知,家庭教育年投入的中位数为10,众数为10,平均数为9.7;由丙地的扇形图可知,家庭教育年投入的中位数为12,众数为12,平均数为12.4.结合选项可知C正确.故选C. 2.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( ) A.中位数 B.平均数 C.方差 D.极差 答案 A 解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A. 3.(2019·郴州市高三第三次质量检测)新闻出版业不断推进供给侧结构性改革,深入推动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展.下面是2012年至2016年我国新闻出版业和数字出版业营收增长情况: 给出下列四个结论: ①2012年至2016年我国新闻出版业和数字出版业营收均逐年增加 ②2016年我国数字出版业营收超过2012年我国数字出版业营收的2倍 ③2016年我国新闻出版业营收超过2012年我国新闻出版业营收的1.5倍 ④2016年我国数字出版业营收占新闻出版业营收的比例未超过三分之一 其中所有正确结论的编号为( ) A.①② B.①②③ C.①②④ D.②③④ 答案 C 解析 根据图示数据可知①正确;对于②:1935.5×2=3871<5720.9,正确;对于③:16635.3×1.5>23595.8,不正确;对于④:23595.8×≈7865>5720.9,正确.故选C. 4.(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________. 答案 解析 这组数据的平均数为8,故方差为s2=×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=. 5.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图: 记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70. (1)求乙离子残留百分比直方图中a,b的值; (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 解 (1)由已知得0.70=a+0.20+0.15, 故a=0.35,b=1-0.05-0.15-0.70=0.10. (2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05. 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00. 6.(2019·湖北武汉高三第二次质量检测)光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能.近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如下表: 某位同学分别用两种模型:①=bx2+a,②=dx+c进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差等于yi-i): 经过计算得(xi-)(yi-)=72.8,(xi-)2=42,(ti-)(yi-)=686.8,(ti-)2=3570,其中ti=x,=i. (1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由; (2)根据(1)的判断结果及表中数据建立y关于x的回归方程,并预测该地区2020年新增光伏装机量是多少?(在计算回归系数时精确到0.01) 附:回归直线的斜率和截距的最小二乘估计公式分别为 =,=- . 解 (1)选择模型①. 理由如下:根据残差图可以看出,模型①的估计值和真实值比较相近,模型②的残差值相对较大一些,所以模型①的拟合效果相对较好. (2)由(1)可知,y关于x的回归方程为=x2+,令t=x2, 则=t+. 由所给数据可得=i=×(1+4+9+16+25+36+49+64)=25.5. =i=×(0.4+0.8+1.6+3.1+5.1+7.1+9.7+12.2)=5, ∴==≈0.19, =- ≈5-0.19×25.5≈0.16, 所以y关于x的回归方程为=0.19x2+0.16, 当x=10时,=0.19×102+0.16=19.16, 故预测该地区2020年新增光伏装机量为19.16兆瓦. 『金版押题』 7.某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满分:100分)数据,统计结果如表所示. 组别 [40,50) [50,60) [60,70) [70,80) [80,90) [90,100] 男 2 3 5 15 18 12 女 0 5 10 10 7 13 (1)若规定问卷得分不低于70分的市民称为“环保关注者” ,请完成下列2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下,认为是否为“环保关注者”与性别有关? 非“环保关注者” 是“环保关注者” 合计 男 女 合计 (2)若问卷得分不低于80分的人称为“环保达人”.现在从本次调查的“环保达人”中利用分层抽样的方法随机抽取5名市民参与环保知识问答,再从这5名市民中抽取2人参与座谈会,求抽取的2名市民中,既有男“环保达人”又有女“环保达人”的概率. 附表及公式:K2=,n=a+b+c+d. P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解 (1)由图中表格可得2×2列联表如下, 非“环保关注者” 是“环保关注者” 合计 男 10 45 55 女 15 30 45 合计 25 75 100 将2×2列联表中的数据代入公式计算得 K2的观测值k=≈3.03<3.841, 所以在犯错误的概率不超过0.05的前提下,不能认为是“环保关注者”与性别有关. (2)由题可知,利用分层抽样的方法可得男“环保达人”3人,女“环保达人”2人. 设男“环保达人”3人分别为A,B,C;女“环保达人”2人为D,E. 从中抽取两人的所有情况为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共10种情况,且这10种情况发生的可能性相等. 既有男“环保达人”又有“女环保达人”的情况有(A,D),(A,E),(B,D ),(B,E),(C,D),(C,E),共6种情况.所求概率P==. 配套作业 一、选择题 1.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( ) A.66% B.67% C.79% D.84% 答案 D 解析 ∵y与x具有线性相关关系,满足回归方程=0.6x+1.2,该城市居民人均工资为x=5,∴可以估计该城市的职工人均消费水平y=0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为=84%. 2.(2019·上海市嘉定(长宁)区高三第二次质量调研)产能利用率是指实际产出与生产能力的比率,工业产能利用率是衡量工业生产经营状况的重要指标,下图为国家统计局发布的2015年至2018年第2季度我国工业产能利用率的折线图. 在统计学中,同比是指本期统计数据与上一年同期统计数据相比较,例如2016年第二季度与2015年第二季度相比较;环比是指本期统计数据与上期统计数据相比较,例如2015年第二季度与2015年第一季度相比较.根据上述信息,下列结论中正确的是( ) A.2015年第三季度环比有所提高 B.2016年第一季度同比有所提高 C.2017年第三季度同比有所提高 D.2018年第一季度环比有所提高 答案 C 解析 2015年第二季度利用率为74.3%,第三季度利用率为74.0%,故2015年第三季度环比有所下降,故A错误;2015年第一季度利用率为74.2%,2016年第一季度利用率为72.9%,故2016年第一季度同比有所下降,故B错误;2016年第三季度利用率为73.2%,2017年第三季度利用率为76.8%,故2017年第三季度同比有所提高,故C正确;2017年第四季度利用率为78%,2018年第一季度利用率为76.5%,故2018年第一季度环比有所下降,故D错误.故选C. 3.(2019·大庆市高三第三次教学质量检测)在某线性回归分析中,已知数据满足线性回归方程=x+,并且由观测数据算得=5,=56,=10.5,则当x=10时,预测数值=( ) A.108.5 B.210 C.140 D.210.5 答案 A 解析 由题意得样本中心为(5,56),由于回归直线=10.5x+过样本中心,所以56=10.5×5+,解得=3.5,所以回归直线方程为=10.5x+3.5.当x=10时,=10.5×10+3.5=108.5.故选A. 4.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( ) A.相关系数r变大 B.残差平方和变大 C.R2变大 D.解释变量x与预报变量y的相关性变强 答案 B 解析 由散点图知,去掉D(3,10)后,y与x的线性相关性加强,且为正相关,所以r变大,R2变大,残差平方和变小,故选B. 5.对某两名高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到如图所示的折线图.下面关于这两名同学的数学成绩的分析中,正确的个数为( ) ①甲同学的成绩折线图具有较好的对称性,故而平均成绩为130分; ②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在[110,120)内; ③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关; ④乙同学在这连续9次测试中的最高分与最低分的差超过40分. A.1 B.2 C.3 D.4 答案 C 解析 由折线图可得②③④正确,甲的最高分是130,平均分在[110,120)内,则①不正确,即正确的有3个,故选C. 二、填空题 6.(2019·焦作市高三第四次模拟)条形图给出的是2017年全年及2018年全年全国居民人均可支配收入的平均数与中位数,饼状图给出的是2018年全年全国居民人均消费及其构成,现有如下说法: ①2018年全年全国居民人均可支配收入的平均数的增长率低于2017年; ②2018年全年全国居民人均可支配收入的中位数约是平均数的86%; ③2018年全年全国居民衣(衣着)食(食品烟酒)住(居住)行(交通通信)的支出超过人均消费的70%. 则上述说法中,正确的是________.(写出所有正确说法的序号) 答案 ①②③ 解析 2018年全年全国居民人均可支配收入的平均数的增长率为8.7%,而2017年全年全国居民人均可支配收入的平均数的增长率为9%,故①正确;因为≈0.862,所以2018年全年全国居民人均可支配收入的中位数约是平均数的86%,故②正确;因为6.5%+28.4%+23.4%+13.5%=71.8%,2018年全年全国居民衣(衣着)食(食品烟酒)住(居住)行(交通通信)的支出超过人均消费的70%,故③正确.故正确的是①②③. 7.(2019·武汉市高三4月调研)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图,请根据图中信息,求本次抽查的学生中A类人数是________. 答案 30 解析 根据选择D方式的有18人,所占比例为15%,得总人数为=120,故选择A方式的人数为120-42-30-18=30. 8.甲、乙两人要竞争一次大型体育竞技比赛射击项目的参赛资格,如图是在测试中甲、乙各射靶10次的条形图,则参加比赛的最佳人选为________. 答案 乙 解析 甲的平均数1=4×0.2+5×0.1+7×0.3+8×0.1+9×0.2+10×0.1=7.0,乙的平均数2=5×0.1+6×0.2+7×0.4+8×0.2+9×0.1=7.0,所以1=2;甲的方差s=×[(7-4)2×2+(7-5)2×1+(7-7)2×3+(7-8)2×1+(7-9)2×2+(7-10)2×1]=4,乙的方差s=×[(7-5)2×1+(7-6)2×2+(7-7)2×4+(7-8)2×2+(7-9)2×1]=1.2,所以s>s,所以参加比赛的最佳人选为乙. 三、解答题 9.为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示. (1)求图中a的值; (2)估计这种植物果实重量的平均数和方差s2(同一组中的数据用该组区间的中点值作代表); (3)已知这种植物果实重量不低于32.5克的即为优质果实,用样本估计总体.若从这种植物果实中随机抽取3个,其中优质果实的个数为X,求X的分布列和数学期望E(X). 解 (1)组距d=5,由5×(0.02+0.04+0.075+a+0.015)=1得a=0.05. (2)各组中点值和相应的频率依次为 中点值 30 35 40 45 50 频率 0.1 0.2 0.375 0.25 0.075 =30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40, s2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75. (3)由已知,这种植物果实的优质率p=0.9,且X服从二项分布B(3,0.9), X=0,1,2,3,P(X=k)=C·0.9k·0.13-k,X的分布列为 X 0 1 2 3 P 0.001 0.027 0.243 0.729 ∴E(X)=np=2.7. 10.(2019·聊城市高三一模)某小学为了了解四年级学生的家庭作业用时情况,从本校四年级随机抽取了一批学生进行调查,并绘制了学生作业用时的频率分布直方图,如图所示. (1)估算这批学生的作业平均用时情况; (2)作业用时不能完全反映学生学业负担情况,这与学生自身的学习习惯有很大关系,如果用时四十分钟之内评价为优异,一个小时以上为一般,其他评价为良好.现从优异和良好的学生里面用分层抽样的方法抽取300人,其中女生有90人(优异20人).请完成列联表,并根据列联表分析能否在犯错误的概率不超过0.05的前提下认为学习习惯与性别有关系? 男生 女生 合计 良好 优异 合计 附:K2=,其中n=a+b+c+d. P(K2≥k0) 0.100 0.050 0.025 0.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 解 (1)=10×(35×0.01+45×0.02+55×0.03+65×0.025+75×0.01+85×0.005)=57. 所以批学生作业用时的平均数为57. (2)优异学生数与良好学生数之比为0.01∶(0.02+0.03)=1∶5, 按照分层抽样得300人中优异50人,良好250人;女生90人,男生210人;女生优异20,良好70人,男生优异30人,良好180人, 列联表如下: 男生 女生 合计 良好 180 70 250 优异 30 20 50 合计 210 90 300 K2=≈2.857<3.841,故不能在犯错误的概率不超过0.05的前提下认为学习习惯与性别有关系. 11.(2019·云南省第二次高三统一检测)在某市创建全国文明城市的过程中,创文专家组对该市的中小学进行了抽检,其中抽检的一个环节是对学校的教师和学生分别进行问卷测评.下表是被抽检到的五所学校A,B,C,D,E的教师和学生的测评成绩(单位:分): 学校 A B C D E 教师测评成绩x 90 92 93 94 96 学生测评成绩y 87 89 89 92 93 (1)建立y关于x的回归方程=x+; (2)现从A,B,C,D,E这五所学校中随机选两所派代表参加座谈,求A,B两所学校至少有一所被选到的概率P. 附:=,=- . 解 (1)依据题意计算得 ==93, ==90, (xi-)2=(-3)2+(-1)2+02+12+32=20, (xi-)(yi-)=(-3)×(-3)+(-1)×(-1)+0×(-1)+1×2+3×3=21, ==, =- =90-×93=-. 所以所求回归方程为=x-. (2)从A,B,C,D,E这5所学校中随机选2所,具体情况为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共有10种. A,B两所学校至少有一所被选到的为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共有7种. 它们都是等可能发生的,所以A,B两所学校至少有一所被选到的概率P=.查看更多