- 2021-05-25 发布 |
- 37.5 KB |
- 10页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
【数学】2018届一轮复习人教A版变量间的相关关系、统计案例学案
1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程. 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用. 知识点一 两个变量的相关关系 1.相关关系的分类 (1)正相关:从散点图上看,点散布在从________到______的区域内; (2)负相关:从散点图上看,点散布在从左上角到________的区域内. 2.线性相关关系 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫________. 答案 1.(1)左下角 右上角 (2)右下角 2.回归直线 1.根据两个变量x,y之间的观测数据画成散点图如图所示,则这两个变量________线性相关关系.(填“具有”或“不具有”) 解析:图中的点分布零散,不在一条直线附近,所以不具有线性相关关系. 答案:不具有 2.(2017·泉州模拟)下列四个图象中,两个变量具有正相关关系的是( ) 解析:A中两个变量之间是函数关系,不是相关关系;在两个变量的散点图中,若样本点呈直线形带状分布,则两个变量具有相关关系,对照图形:B,D样本点呈直线形带状分布,B是负相关,D是正相关,C样本点不呈直线形带状分布.所以两个变量具有正相关关系的图是D. 答案:D 知识点二 回归分析 1.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的______ 最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,则==,=- ,其中,是回归方程的______,是在y轴上的截距. 2.样本相关系数 r=,用它来衡量两个变量间的线性相关关系的强弱. (1)当r>0时,表明两个变量________; (2)当r<0时,表明两个变量________; (3)r的绝对值越接近1,表明两个变量的线性相关性__________;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系. 答案 1.(1)距离的平方和 (2)斜率 2.(1)正相关 (2)负相关 (3)越强 3.最小二乘法的原理是( ) A.使得yi-(a+bxi)]最小 B.使得yi-(a+bxi)2]最小 C.使得y-(a+bxi)2]最小 D.使得yi-(a+bxi)]2最小 解析:根据回归方程表示到各点距离之和最小的直线方程,即总体偏差最小,亦即yi-(a+bxi)]2最小. 答案:D 4.当我们建立多个模型拟合某一数据组时,为了比较各个模型的拟合效果,我们可通过计算下列( )量来确定 ①残差平方和 ②回归平方和 ③相关指数R2 ④相关系数r A.① B.①③ C.①②③ D.③④ 解析:残差平方和越小,相关指数R2越大,拟合的效果越好. 答案:B 知识点三 独立性检验 1.分类变量:变量的不同“值”表示个体所属的________,像这类变量称为分类变量. 2.列联表:列出两个分类变量的________,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为 2×2列联表 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d K2=(其中n=a+b+c+d 为样本容量),则利用独立性检验判断表来判断“X与Y的关系”. 答案 1.不同类型 2.频数表 5.在性别与吃零食这两个分类变量的计算中,下列说法正确的是________. ①若K2的观测值为k=6.635,我们有99%的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性; ②从独立性检验可知有99%的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为99%; ③若从统计量中求出有99%的把握认为吃零食与性别有关系,是指有1%的可能性使得出的判断出现错误. 解析:由独立性检验的基本思想可得,只有③正确. 答案:③ 热点一 相关关系的判断 【例1】 (1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( ) A.-1 B.0 C. D.1 (2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________. ①x,y是负相关关系; ②在该相关关系中,若用y=c1ec2x拟合时的相关系数的平方为r,用=x+ 拟合时的相关系数的平方为r,则r>r; ③x、y之间不能建立线性回归方程. 【解析】 (1)所有点均在直线上,则样本相关系数最大即为1,故选D. (2)①显然正确;由散点图知,用y=c1ec2x拟合的效果比用=x+拟合的效果要好,故②正确;x,y之间能建立线性回归方程,只不过预报精度不高,故③不正确. 【答案】 (1)D (2)①② 【总结反思】 判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关. (2)相关系数:r>0时,正相关;r<0时,负相关. (3)线性回归方程中:>0时,正相关;<0时,负相关. (1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论: ①y与x负相关且=2.347x-6.423; ②y与x负相关且=-3.476x+5.648; ③y与x正相关且=5.437x+8.493; ④y与x正相关且=-4.326x-4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ (2)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( ) A.r2查看更多