【文档说明】高考数学(理数)一轮复习课件:第十章 统计与统计案例 第二节 统计案例 (含详解).ppt,共(51)页,939.500 KB,由MTyang资料小铺上传
转载请保留链接:https://www.ichengzhen.cn/view-34144.html
以下为本文档部分文字说明:
第二节统计案例本节主要包括2个知识点:1.回归分析;2.独立性检验.突破点(一)回归分析基础联通抓主干知识的“源”与“流”1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种_____
____关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为_______,点散布在左上角到右下角的区域内,两个变量的相关关系为______.非确定性正相关负相关2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的_________附近,称两个变量之间具有_____________,这条直线叫做回归直线.(2)回归方程为y^=b^x+a^,其中b^=______________
_,a^=________.一条直线线性相关关系i=1nxiyi-nx-y-i=1nx2i-nx-2y--b^x-(3)通过求Q=i=1nyi-bxi-a2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的
距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r>0时,表明两个变量_______;当r<0时,表明两个变量_______.r的绝对值越接近于1,表明两个变量的线性相关性____;r的绝对值越接近于0,表明两个变量之间________________
________.通常|r|大于_____时,认为两个变量有很强的线性相关性.正相关负相关越强几乎不存在线性相关关系0.75考点贯通抓高考命题的“形”与“神”相关关系的判断[例1](1)下列四个散点图中,变量x与y之间具有负的线性相关关系的是()[解析]观察散点图可知,只有D选项的散点
图表示的是变量x与y之间具有负的线性相关关系.[答案]D(2)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r
2<0<r3<r1D.r2<r4<0<r1<r3[解析]由相关系数的定义以及散点图所表达的含义可知r2<r4<0<r3<r1.[答案]A[方法技巧]判断相关关系的两种方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本
点都落在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强.线性回归分析1.求回归直线方程的步骤2.利用回归直线方程进行预测是对总体的估计,此估计值不是准确值.进行预测时,把自变量代入回归直
线方程即可对因变量进行估计.[例2](2017·山西四校联考)某地随着经济的发展,居民收入逐年增长,下表是该地某银行连续五年的储蓄存款(年底余额),如下表1:年份x20112012201320142015储蓄存款y(千亿元)567810为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2
010,z=y-5得到下表2:时间代号t12345z01235(1)求z关于t的线性回归方程;(2)通过(1)中的方程,求出y关于x的回归方程;(3)用所求回归方程预测到2020年年底,该地储蓄存款额可达多少?(附:对于线性回归方程y^=b^x+a^,其中b^=i=
1nxiyi-nx-y-i=1nx2i-nx-2,a^=y--b^x-)[解](1)t-=3,z-=2.2,i=15tizi=45,i=15t2i=55,b^=45-5×3×2.255-5×9=1.2,a^=z--b^t-=2.2
-1.2×3=-1.4,∴z^=1.2t-1.4.(2)将t=x-2010,z=y-5,代入=1.2t-1.4,得y-5=1.2(x-2010)-1.4,即=1.2x-2408.4.(3)∵=1.2×2020-2408.4=15.6,∴预测到2020年年底,该地储蓄存款
额可达15.6千亿元.[方法技巧]1.回归直线方程中系数的两种求法(1)公式法:利用公式,求出回归系数b^,a^.(2)待定系数法:利用回归直线过样本点中心(x-,y-)求系数.2.回归分析的两种策略(1)利用回归方程进
行预测:把回归直线方程看作一次函数,求函数值.(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数b^.能力练通抓应用体验的“得”与“失”1.[考点一]两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系
是()A.①②③B.②③①C.②①③D.①③②解析:第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中,散点图中的点的分布没有什么规律,则
是不相关,所以应该是①③②.答案:D2.[考点一]为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴,y轴的单位长度相同),用回归直线方程y^=b^x+a^
近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,b^的值为1.25B.线性相关关系较强,b^的值为0.83C.线性相关关系较强,b^的值为-0.87D.线性相关关系较弱,无研究价值解析:由散点图可以看出两个变量所构成的点在一条直线附近,所以线性
相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.答案:B3.[考点一]四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y^=2.3
47x-6.423;②y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D
.①④解析:正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④.答案:D4.[考点二]已知x,y的取值如下表:x2345y2.23.85.56.5从散点图分析,y与x线性相关,且回归方程为y^=1.46x+a^,则实数a^
的值为________.解析:x=2+3+4+54=3.5,y=2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x,y).把(3.5,4.5)代入回归方程,计算得a^=-0.61.答案:-0.615.[考点二]为了解某地区某种农产品的年产量x(
单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:x12345y7.06.55.53.82.2(1)求y关于x的线性回归方程y^=b^x+a^;(2)若每吨该农产
品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保留两位小数)参考公式:b^=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx
2i-nx-2,a^=y--b^x-解:(1)由题知x-=3,y-=5,i=15xiyi=62.7,i=15x2i=55,b^=i=15xiyi-5x-y-i=15x2i-5x-2=62.7-5×3×555-5×3
2=-1.23,=-=5-(-1.23)×3=8.69,所以y关于x的线性回归方程为=-1.23x+8.69.(2)年利润z=x(-1.23x+8.69)-2x=-1.23x2+6.69x=-1.23
x-6.692.462+1.23×6.692.462即当x=6.692.46≈2.72时,年利润z最大.突破点(二)独立性检验基础联通抓主干知识的“源”与“流”1.分类变量变量的不同“值”表示个体所属的不同类别,像这类变量称为
分类变量.2.列联表列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b
+c+dK2=nad-bc2a+bc+da+cb+d(其中n=a+b+c+d为_________),可利用独立性检验判断表来判断“X与Y的关系”.样本容量考点贯通抓高考命题的“形”与“神”独立性检验的实际应用[典例](2017·沈阳模拟)为考查
某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为25.未发病发病总计未注射疫苗20xA注射疫苗30yB总计5050100(1)求2×2列联表中的数据x,y,A,B的值;[解]设“从所有
试验动物中任取一只,取到‘注射疫苗’动物”为事件A,由已知得P(A)=y+30100=25,所以y=10,则B=40,x=40,A=60.(2)绘制发病率的条形统计图,并判断疫苗是否影响到了发病率?[解]未注射疫苗发病率为4060=23≈0.67,注射疫苗发病率为1040=1
4=0.25.发病率的条形统计图如图所示,由图可以看出疫苗影响到了发病率.(3)能够有多大把握认为疫苗有效?附:K2=nad-bc2a+bc+da+cb+d,n=a+b+c+dP(K2≥k0)0.05
0.010.0050.001k03.8416.6357.87910.828[解]K2=100×20×10-40×30260×40×50×50=503≈16.67>10.828.所以至少有99.9%的把握认为疫苗有效.[易错提醒](1)独立性检验的关键是正确列
出2×2列联表,并计算出K2的值.(2)独立性检验是对两个变量有关系的可信程度的判断,而不是对它们是否有关系的判断.能力练通抓应用体验的“得”与“失”1.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽
样调查,得到如下所示的2×2列联表:男女总计走天桥402060走斑马线203050总计6050110由K2=nad-bc2a+bc+da+cb+d,算得K2=110×40×30-20×20260×50×60×5
0≈7.8.附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A.有99%以上的把握认为“选择过马路的方式与性别有关”B.有99%以上的把握认为“选择过马路的方式与性别无关”C.在犯错
误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”解析:由K2≈7.8.得P(K2≥6.635)=0.01=1-99%,所以有99%以上的把握认为“选择过马路
的方式与性别有关”.答案:A2.已知某班n名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a,b,c成等差数列,且成绩在[90,100]内的有6人.(1)求n的值;(2)规定60分以下为不及格,若不及格的人中女
生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析是否有90%的把握认为“本次测试的及格情况与性别有关”?附:P(K2≥k0)0.100.050.0100.005k02.7063.8416.6357.879K2=nad-bc2a+bc+da+cb+d解:
(1)依题意得100.035+0.025+c+2b+a=1,2b=a+c,解得b=0.01.因为成绩在[90,100]内的有6人,所以n=60.01×10=60.(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格
的人中,男生比女生少4人,借助独立性检验分析是否有90%的把握认为“本次测试的及格情况与性别有关”?(2)由于2b=a+c,而b=0.01,可得a+c=0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,设及格的人中,女生有x人
,则男生有x-4人,于是x+x-4=48,解得x=26,故及格的人中,女生有26人,男生有22人.于是本次测试的及格情况与性别的2×2列联表如下:及格不及格总计男22830女26430总计481260结
合列联表计算可得K2=60×22×4-8×26230×30×48×12=1.667<2.706,故没有90%的把握认为“本次测试的及格情况与性别有关”.[全国卷5年真题集中演练——明规律]1.(2016·全国丙卷)
下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理
量.参考数据:i=17yi=9.32,i=17tiyi=40.17,i=17yi-y2=0.55,7≈2.646.参考公式:相关系数r=i=1nti-tyi-yi=1nti-t2i=1nyi-y2,回归方
程y^=a^+b^t中斜率和截距的最小二乘估计公式分别为b^=i=1nti-tyi-yi=1nti-t2,a^=y-b^t.解:(1)由折线图中的数据和附注中的参考数据得t=4,i=17(ti-t)2=28,i=17yi-y2=0.55,i=17(ti-t
)(yi-y)=i=17tiyi-ti=17yi=40.17-4×9.32=2.89,∴r≈2.890.55×2×2.646≈0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.解:由y=9.327≈1.331及(1)得b^
=i=17ti-tyi-yi=17ti-t2=2.8928≈0.103.a^=y-b^t≈1.331-0.103×4≈0.92.所以y关于t的回归方程为y^=0.92+0.10t.将2016年对应的t=9代入回归方程得y^=0.92+0.10×9=1.8
2.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.2.(2015·新课标全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和
年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,„,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xywi=18(xi-x)2i=18(wi-w)2i=18(xi-x)(yi-y)i=18(wi-w)(yi
-y)46.65636.8289.81.61469108.8表中wi=xi,w=18i=18wi.(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1
)的判断结果及表中数据,建立y关于x的回归方程.(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最
大?附:对于一组数据(u1,v1),(u2,v2),„,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β^=i=1nui-uvi-vi=1nui-u2,α^=v-β^u.解:(1)由散点图可以判断,y=c+dx适宜作为年销售量y
关于年宣传费x的回归方程类型.解:令w=x,先建立y关于w的线性回归方程.由于d^=i=18wi-wyi-yi=18wi-w2=108.81.6=68,c^=y-d^w=563-68×6.8=100.6,所以y关于w的线性回归方程y^=100.
6+68w,因此y关于x的回归方程为y^=100.6+68x.(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.解:①由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2
-49=66.32.②根据(2)的结果知,年利润z的预报值z^=0.2(100.6+68x)-x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.(3)已知这种产品
的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?3.(2014·新课标全国卷Ⅱ)某地区2
007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1
)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b^=i=1nti-tyi-yi=1nt
i-t2,a^=y-b^t解:(1)由所给数据计算得t=17(1+2+3+4+5+6+7)=4,y=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,i=17(ti-t)2=9+4+
1+0+1+4+9=28,(1)求y关于t的线性回归方程;i=17(ti-t)(yi-y)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b^=i
=17ti-tyi-yi=17ti-t2=1428=0.5,a^=y-b^t=4.3-0.5×4=2.3,所求回归方程为y^=0.5t+2.3.解:由(1)知,b^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增
加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得y^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.(2)利用(1)中的回归方程,
分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.