【文档说明】2020版高考数学文一轮复习通用版课件变量间的相关关系与统计案例.ppt,共(37)页,1.612 MB,由小橙橙上传
转载请保留链接:https://www.ichengzhen.cn/view-256663.html
以下为本文档部分文字说明:
变量间的相关关系与统计案例第三节课前自修区基础相对薄弱,一轮复习更需重视基础知识的强化和落实课堂讲练区考点不宜整合太大,挖掘过深否则会挫伤学习的积极性课时跟踪检测返回(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.1.变量间的
相关关系(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为;点散布在左上角到右下角的区域内,两个变量的这种相关关系为.正相关负相关2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这
条直线叫做回归直线.体现的不一定是因果关系.返回(2)回归方程为y^=b^x+a^,其中b^=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^
x.回归直线y^=b^x+a^必过样本点的中心(x,y),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.(3)通过求Q=i=1n(yi-bxi-a)2的最小值而得到回归直线的方法,
即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.返回(4)相关系数:当r>0时,表明两个变量;当r<0时,表明两个变量.r的绝对值越接近于1,表明两个变量的线性相关性.r的绝对值越接近于
0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.正相关负相关越强返回3.独立性检验(1)2×2列联表设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本
频数列联表(2×2列联表)如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)独立性检验利用随机变量K2(也可表示为χ2)的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中
n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.返回(1)求解回归方程的关键是确定回归系数a^,b^,应充分利用回归
直线过样本中心点(x,y).(2)根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.(3)根据回归方程计算的y^值,仅是一个预报值,不是真实发生的值.二、常用结论汇总——规律多一点三、基础小题强化——功底牢一点返回(一)判一判(对的打
“√”,错的打“×”)(1)散点图是判断两个变量是否相关的一种重要方法和手段.()(2)回归直线方程y^=b^x+a^至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(3)若事件X,Y关系越密切,则由观测数据计
算得到的K2的观测值越小.()(4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.()√××√三、基础小题强化——功底牢一点返回(二)选一选1.已知变量x和y满足关系y^=-0.1x+1,变量y^与z正相关.则下列结论中正确的是()A.x与y^负相关,x与z负相关B.x与y^正相关,x与
z正相关C.x与y^正相关,x与z负相关D.x与y^负相关,x与z正相关答案:A返回2.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98B.模型2的相关指数R2
为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25答案:A返回(三)填一填3.已知x,y的取值如下表,从散点图可以看出y与x具有线性相关关系,且回归方程为y^=0.95x+a^,则a^=________.x0134y2.2
4.34.86.7解析:∵回归直线必过样本点的中心(x,y),又x=2,y=4.5,代入回归方程,得a^=2.6.答案:2.6返回4.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下列
联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.解析:K2
的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%返回考点一回归分析课堂讲练区返回考法(一)求线性回归方程[典例]
(2019·湘东五校联考)已知具有相关关系的两个变量x,y的几组数据如如右表所示:x246810y3671012(1)请根据上表数据在网格纸中绘制散点图;参考公式:b^=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x.(2)请根据上表数据,用最
小二乘法求出y关于x的线性回归方程y^=b^x+a^,并估计当x=20时y的值.返回[解](1)散点图如图所示:返回(2)依题意,x=15×(2+4+6+8+10)=6,y=15×(3+6+7+10+12
)=7.6,i=15x2i=4+16+36+64+100=220,i=15xiyi=6+24+42+80+120=272,∴b^=i=15xiyi-5xyi=15x2i-5x2=272-5×6×7.6220-5×62=4440=1.1,∴a^=7
.6-1.1×6=1,∴线性回归方程为y^=1.1x+1,故当x=20时,y=23.返回考法(二)相关系数及应用[典例]如图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图.由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明
.返回参考数据:i=17yi=9.32,i=17tiyi=40.17,i=17(yi-y)2=0.55,7≈2.646.参考公式:相关系数r=i=1n(ti-t)(yi-y)i=1n(ti-t)2i=1n(yi-y)2.返回[解]由折线图中数据和参考数据及
公式得t=4,i=17(ti-t)2=28,i=17(yi-y)2=0.55,i=17(ti-t)(yi-y)=i=17tiyi-ti=17yi=40.17-4×9.32=2.89,r≈2.890.55×2×2.646≈0.99.因为y与t的相关系数近似为0
.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.返回[解题技法]1.线性回归分析问题的类型及解题方法(1)求线性回归方程:①利用公式,求出回归系数b^,a^.②待定系数法:利用回归直线过样本点中心求系数.(2)利用回归方程进行预测:把回归
直线方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数b^.返回2.模型拟合效果的判断(1)残差平方和越小,模型的拟合效果越好.(2)相关指数R2越大,模型的拟合效果越好.(3)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相
关性越强.返回[题组训练]1.(2019·惠州调研)某商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x/℃171382月销售量y/件
24334055由表中数据算出线性回归方程y^=b^x+a^中的b^=-2,气象部门预测下个月的平均气温约为6℃,据此估计该商场下个月毛衣销售量约为()A.46件B.40件C.38件D.58件返回解析:由题中数据,得x=10,y=38,回归直线
y^=b^x+a^过点(x,y),且b^=-2,代入得a^=58,则回归方程y^=-2x+58,所以当x=6时,y=46,故选A.答案:A返回2.近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的
推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表:x1234567y6011021034066010101960根据以上数据,绘制
了散点图.返回(1)根据散点图判断,在推广期内,y=a+bx与y=c·dx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型(给出判断即可,不必说明理由)?参考数据:yvi=17xiyii=17xivi100.546212.54253507
8.123.47其中vi=lgyi,v=17i=17vi.(2)根据(1)的判断结果及上表中数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.返回参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v^=α^+β^μ的斜
率和截距的最小二乘估计公式分别为β=i=1nuivi-nuvi=1nu2i-nu2,α^=v-β^U.解:(1)根据散点图可以判断,y=c·dx适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型.返回(2)y=c·dx两边同时
取常用对数,得lgy=lg(c·dx)=lgc+xlgd,设lgy=v,则v=lgc+xlgd.∵x=4,v=2.54,i=17x2i=140,∴lgd=i=17xivi-7xvi=17x2i-7x2≈78.12-7×4×2.54140-7×42=0.25,把(4,2
.54)代入v=lgc+xlgd,得lgc=1.54,∴v^=1.54+0.25x,∴y^=101.54+0.25x=101.54·(100.25)x.把x=8代入上式,得y^=101.54+0.25×8=103.54=103×100.
54=3470,∴y关于x的回归方程为y^=101.54·(100.25)x,活动推出第8天使用扫码支付的人次为3470.返回考点二独立性检验返回[典例](2018·全国卷Ⅲ节选)某工厂为提高生产效率,开展技
术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:返回
(1)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),(2)根据(1)中的列联表,能否有99%的把握认为两种
生产方式的效率有差异?返回[解](1)由茎叶图知m=79+812=80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(2)因为K2=40(15×15-5×5)220×20×20×20=10>6.63
5,所以有99%的把握认为两种生产方式的效率有差异.返回[解题技法]2个明确(1)明确两类主体;(2)明确研究的两个问题2个关键(1)准确画出2×2列联表;(2)准确求解K23个步骤(1)根据样本数据制成2×2列联表;(2)根据公式K2=n(ad-bc)2(a+b)(c+d)
(a+c)(b+d),计算K2的值;(3)查表比较K2与临界值的大小关系,作统计判断返回[题组训练]1.(2019·沧州模拟)某班主任对全班50名学生进行了作业量的调查,数据如表:认为作业量大认为作业量不大总计男生18927女生81523总计262450已知P(K2≥3
.841)≈0.05,P(K2≥5.024)≈0.025,P(K2≥6.635)≈0.010.则________(填“有”或“没有”)97.5%的把握认为“学生的性别与认为作业量大有关”.返回解析:因为K2=50×(18×15-8×9)226×24×27×23≈
5.059>5.024,所以有97.5%的把握认为“学生的性别与认为作业量大有关”.答案:有返回2.为考察某种疫苗预防疾病的效果,进行动物试验,得到统计数据如下:未发病发病总计未注射疫苗20xA注射疫苗30yB总计5050100现从所有试验动物中任取一只
,取到“注射疫苗”动物的概率为25.返回(1)求2×2列联表中的数据x,y,A,B的值.(2)绘制发病率的条形统计图,并判断疫苗是否影响到了发病率?(3)能否在犯错误的概率不超过0.001的前提下认为疫苗有效?附:K2=n(ad-bc)2(a+b)(c
+d)(a+c)(b+d),n=a+b+c+d.临界值表:P(K2≥k0)0.050.010.0050.001k03.8416.6357.87910.828返回解:(1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物”为
事件M,由已知得P(M)=y+30100=25,所以y=10,则B=40,x=40,A=60.(2)未注射疫苗发病率为4060=23≈0.67,注射疫苗发病率为1040=14=0.25.发病率的条形统计图如图所示,由图可以看出
疫苗影响到了发病率.(3)因为K2=100×(20×10-40×30)260×40×50×50≈16.67>10.828.所以能在犯错误的概率不超过0.001的前提下认为疫苗有效.