【文档说明】高考数学(文数)一轮复习课件 第十章 算法初步、统计、统计案例 第四节 变量间的相关关系 统计案例(含详解).ppt,共(30)页,590.000 KB,由MTyang资料小铺上传
转载请保留链接:https://www.ichengzhen.cn/view-33615.html
以下为本文档部分文字说明:
1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是__________;与函数关系不同,_________是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关
系称为________,点散布在左上角到右下角的区域内,两个变量的相关关系为_______.第四节变量间的相关关系统计案例相关关系相关关系正相关负相关线性相关关系回归直线y^=b^x+a^y--b^x-2.
两个变量的线性相关(3)通过求Q=i=1nyi-bxi-a2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r>0时,表明两个变量_______;当r<0时,表明两个变量______
_.r的绝对值越接近于1,表明两个变量的线性相关性_____.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.正相关负相关越强K2=nad-bc2a+ba+c
b+dc+d(其中n=a+b+c+d为样本容量).3.独立性检验1.(教材习题改编)已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为y^=0.95x+a^,则a^=________.x0134y2.24.34.86.7[小题体验]解析:∵回归直线必过样本点的
中心(x,y),又x=2,y=4.5,代入回归方程,得a^=2.6.答案:2.62.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05
,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=50×13×20-10×7223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.解析:K2的观测值k≈4.844,这表明小概率事件发生.根据假
设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果
关系,也可能是伴随关系.2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x-,y-)点,可能所有的样本数据点都不在直线上.3.利用回归方程分析问题时,所得的数据易误认为是准确值,而实质上是预测值(期望值).1
.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,„,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心
(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg[小题纠偏]解析:由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A
正确.又线性回归方程必过样本中心点(x,y),因此B正确.由线性回归方程中系数的意义知,x每增加1cm,其体重约增加0.85kg,故C正确.当某女生的身高为170cm时,其体重估计值是58.79kg,而
不是具体值,因此D不正确.答案:D2.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y
的观测数据的平均值都是t,那么下列说法正确的是()A.l1和l2必定平行B.l1与l2必定重合C.l1和l2一定有公共点(s,t)D.l1与l2相交,但交点不一定是(s,t)解析:注意到回归直线必经过样本中心点.答案:C考点一相关关
系的判断[题组练透]1.(2015·湖北高考)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关解析:因为y=-0.1x+1的斜率小
于0,故x与y负相关.因为y与z正相关,可设z=b^y+a^,b^>0,则z=b^y+a^=-0.1b^x+b^+a^,故x与z负相关.答案:C2.某公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单
位:kg):施化肥量x15202530354045棉花产量y330345365405445450455(1)画出散点图.(2)判断是否具有相关关系.解:(1)散点图如图所示:(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.[谨记通法]判断相关关系的
2种方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.(2)相关系数法:利用相
关系数判定,当|r|越趋近于1相关性越强.考点二回归分析[典例引领]1.(2016·全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系
,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:i=17yi=9.32,i=17tiyi=40.17,i=17yi-y2=0.55,7≈2.646.参考公式:相关系数r=i=1nti-tyi-yi=
1nti-t2i=1nyi-y2,回归方程y^=a^+b^t中斜率和截距的最小二乘估计公式分别为b^=i=1nti-tyi-yi=1nti-t2,a^=y-b^t.解:(1)由折线图中的数据和附注中的参考数据得t=
4,i=17(ti-t)2=28,i=17yi-y2=0.55,i=17(ti-t)(yi-y)=i=17tiyi-ti=17yi=40.17-4×9.32=2.89,∴r≈2.890.55×2×2.646≈0.99.因为y与t的相关
系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系.(2)由y=9.327≈1.331及(1)得b^=i=17ti-tyi-yi=17ti-t2=2.8928≈0.103.a^=y-b^t≈1.331-0.103×4≈0.92.所以
y关于t的回归方程为y^=0.92+0.10t.将2016年对应的t=9代入回归方程得y^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.[由题悟法]1.回归直线方程中系数的2种求法(1)利用公式,求出回归系数b,a
.(2)待定系数法:利用回归直线过样本点中心求系数.2.回归分析的2种策略(1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数b.[即时应用](2016·河北省三市第二次联考)下表是高三某位文科生连续5次月考的历史、政
治的成绩,结果统计如下:月份91011121历史(x分)7981838587政治(y分)7779798283(1)求该生5次月考历史成绩的平均分和政治成绩的方差;(2)一般来说,学生的历史成绩与政治成绩有较强的线性
相关关系,根据上表提供的数据,求两个变量x,y的线性回归方程y^=b^x+a^.附:b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nx-y-i=1nx2i-nx2,a^=y-b^x解:(1)x=15
×(79+81+83+85+87)=83,∵y=15×(77+79+79+82+83)=80,∴s2y=15×[(77-80)2+(79-80)2+(79-80)2+(82-80)2+(83-80)2]=4.8.(2)∵i=15(xi-x)(yi-y)=30,i=15(xi
-x)2=40,∴b^=0.75,a^=y-b^x=17.75.故所求的线性回归方程为y^=0.75x+17.75.考点三独立性检验[典例引领](2017·皖北名校联考)某医院对治疗支气管肺炎的两种方案A,B进行比较研究,将志愿者分为两组,分别采用方案A和方
案B进行治疗,统计结果如下:有效无效总计使用方案A组96120使用方案B组72总计32(1)完成上述列联表,并比较两种治疗方案有效的频率;(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方
案选择有关?使用方案A组有效的频率为96120=0.8;使用方案B组有效的频率为7280=0.9.解:(1)列联表如下:有效无效总计使用方案A组9624120使用方案B组72880总计16832200解:K2=200×96×8-24×722120×80×1
68×32≈3.571<3.841,所以不能在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关.(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?附:K2=nad-bc
2a+bc+da+cb+d,其中n=a+b+c+d.P(K2≥k0)0.050.0100.001k03.8416.63510.828[由题悟法]解决独立性检验问题的3步骤(1)根据样本数据制成2×2列联表.(2)根据公式K2=n
ad-bc2a+bc+da+cb+d,计算K2的值.(3)查表比较K2与临界值的大小关系,作统计判断.[提醒]应用独立性检验方法解决问题,易出现不能准确计算K2值的错误.[即时应用]下表是110名性别不同的学生对某项运动所持态度的
调查表.男女总计爱好402060不爱好203050总计6050110附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.828若由K2=nad-bc2a+bc+da+cb+d算得K2=110×40×30-20×20260×50
×60×50≈7.822.参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误
的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析:依题意,因为P(7.822≥6.635)=0.010,因此有99%以上的把握认为“爱好该项运动与性别有关”,故选A.答案:A板块命题点专练(十五)点击此处