【文档说明】(通用版)高考数学(文数)一轮复习考点梳理与过关练习42《变量间的相关关系》(含详解).doc,共(45)页,1.819 MB,由MTyang资料小铺上传
转载请保留链接:https://www.ichengzhen.cn/view-24624.html
以下为本文档部分文字说明:
考点42变量间的相关关系变量的相关性(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.回归分析了解回归分析的基本思
想、方法及其简单应用.1.相关关系当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫做相关关系.即相关关系是一种非确定性关系.当一个变量的值由小变大时,另一个变量的值也由小变大,则
这两个变量正相关;当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关.【注意】相关关系与函数关系的异同点:共同点:二者都是指两个变量间的关系.不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是
伴随关系.2.散点图将样本中的n个数据点()(1,)2iixyin,,,描在平面直角坐标系中,所得图形叫做散点图.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在从左上角到右下角的区域内,两个变量的相关关系为负相关.具有正相关关系的两个变量的散点图如图1
,具有负相关关系的两个变量的散点图如图2.3.回归分析如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线.回归直线对应的方程叫做回归直线方程(简称回归方程
).4.回归方程的求解(1)求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.若变量x与y具有线性相关关系,有n个样本数据()(1,)2iixyin,,,,则回归方程ˆˆˆybxa中1122211()()()ˆnniiiiiinniiiixxyyx
ynxybxxxnx,ˆˆaybx.其中1211,nniixxxxnnx2111nniiyynnyyy,(,)xy称为样本点的中心.(2)线性回归模型yb
xae,其中e称为随机误差,自变量x称为解释变量,因变量y称为预报变量.【注意】①回归直线ˆˆˆybxa必过样本点的中心(,)xy,这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.②利用回归直线方程不但可以预测在x取某一个值时,y的估计值,同时也能
知道x每增加1个单位,ˆy的变化量.③在回归直线方程中,ˆb既表示直线的斜率,又表示自变量x的取值每增加一个单位时,函数y的改变量.5.相关系数(1)样本相关系数r的计算公式我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计
算公式为12211()()()()niiinniiiixxyyrxxyy.(2)样本相关系数r的性质①||1r;②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;③|r|越接近于1,表明两个变量的线性相关
性越强;④|r|越接近于0,表明两个变量的线性相关性越弱.6.非线性回归分析对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成线性回归问题,然后用线性回归的方法进行研究.在大量的实际问题中,所研究的两个变量
不一定都呈线性相关关系,当两变量y与x不具有线性相关关系时,要借助散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决.7.刻画回归效果的方式方式方法计算公式刻画效果2R2R2121ˆ
()1()niiiniiyyyy2R越接近于1,表示回归的效果越好残差图ˆie称为相应于点(,)iixy的残差,ˆieˆiiyy残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高.残差
平方和21ˆ()niiiyy残差平方和越小,模型的拟合效果越好考向一相关关系的判断判定两个变量正、负相关性的方法:(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关;(
2)相关系数:r>0时,正相关;r<0时,负相关;(3)线性回归方程中:ˆ0b时,正相关;ˆ0b时,负相关.典例1给出下列有关线性回归分析的四个命题:①线性回归直线未必过样本数据点的中心(,)xy;②回归直线就是散点图中经过样
本数据点最多的那条直线;③当相关系数0r时,两个变量正相关;④如果两个变量的相关性越强,则相关系数r就越接近于1.其中真命题的个数为A.1B.2C.3D.4【答案】A【解析】对于①,线性回归直线一定过样本数据点的中心(,)xy
,故①错误;对于②,回归直线在散点图中可能不经过任何一个样本数据点,故②错误;对于③,当相关系数0r时,两个变量正相关,故③正确;对于④,如果两个变量的相关性越强,则相关性系数r就越接近于1或1,故④错误.故真命题的个数为1,故选A.1.已知变量x和y满足关系y=-0.1x+1,变量y与z正
相关.下列结论中正确的是A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关2.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U
与V相对应的一组数据为(10,5),(11.3,4)(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则A.r2<r1<0B.0<r2<r1C.r2<0<r1
D.r2=r1考向二线性回归方程及应用求回归直线方程的一般步骤:(1)作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系.(2)当两变量具有线性相关关系时,求回归系数ˆˆab、,写出回归直线方程
.(3)根据方程进行估计.典例2某车间加工的零件数x与加工时间y的统计数据如下表:零件数x(个)102030加工时间y(分钟)213039现已求得上表数据的回归方程ˆˆˆybxa中的ˆb值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为A.84分钟B.9
4分钟C.102分钟D.112分钟【答案】C【解析】因为11(102030)20,(213039)3033xy,又回归直线ˆˆˆybxa恒过样本点的中心(),xy,且知ˆb值为0.9,所以300.92ˆ01
ˆ2aa,所以回归直线方程为ˆ0.9yx12,从而当100x时,0.910012ˆ102y,由此可以预测,加工100个零件所需要的加工时间约为102分钟,故选C.典例3一商场对每天进店人数
和商品销售件数进行了统计对比,得到如下表格:(1)在给定的坐标系中画出表中数据的散点图,并由散点图判断销售件数与进店人数是否线性相关?(给出判断即可,不必说明理由)(2)建立关于的回归方程(系数精确到0.0
1),并预测进店人数为80时,商品销售的件数(结果保留整数).参考数据:,,7215075iix,,,713245iiixy.参考公式:回归方程,其中1221ˆniiiniixynxybxnx,
ˆˆaybx.【解析】(1)散点图如图所示:由散点图可以判断,商品件数与进店人数线性相关.(2)因为713245iiixy,25x,15.43y,7215075iix,274375x,72700xy,所以7172217324527000.785075437ˆ57iiiii
xyxybxx,ˆˆaybx15.430.78254.07.所以回归方程为,当时,.所以预测进店人数为80时,商品销售的件数为58.3.已知,xy的取值如下表,从散点图知,
,xy线性相关,且0.6yxa,则下列说法正确的是x1234y1.41.82.43.2A.回归直线一定过点(2.2,2.2)B.x每增加1个单位,y就增加1个单位C.当5x时,y的预报值为3.7D.x每增加1个单位
,y就增加0.7个单位4.某学习小组在研究性学习中,对昼夜温差大小与绿豆种子一天内出芽数之间的关系进行研究,该小组在4月份记录了1日至6日每天昼夜最高、最低温度(如图1),以及浸泡的100颗绿豆种子当天内的
出芽数(如图2).根据上述数据作出散点图,可知绿豆种子出芽数y(颗)和温差(C)x具有线性相关关系.(1)求绿豆种子出芽数y(颗)关于温差(C)x的回归方程ˆˆˆybxa;(2)假如4月1日至7日的日温差
的平均值为11℃,估计4月7日浸泡的10000颗绿豆种子一天内的出芽数.附:1122211,ˆˆˆnniiiiiinniiiixxyyxynxybaybxxxxnx
.考向三非线性回归方程及应用求非线性回归方程的步骤:1.确定变量,作出散点图.2.根据散点图,选择恰当的拟合函数.3.变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.4.分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.5.
根据相应的变换,写出非线性回归方程.典例4噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D(单位:分贝)与声音能量I(单位:2W/cm)之间的关系,将测量得到的声音强度iD和声音能量iI(i=1,2,…,10)数据作了初步处理,得到如图散点图
及一些统计量的值.IDW1021()iiII1021()iIWW111.041045.711.5211.56100.51101()()iiiIIDD101()()iiiWWDD
116.88105.1表中lgiiWI,101110iiWW.(1)根据散点图判断,11DabI与22lgDabI哪一个适宜作为声音强度D关于声音能量I的回归方程类型?(给出判断即可,不必说明理由)(2)根据表中
数据,求声音强度D关于声音能量I的回归方程;(3)当声音强度大于60分贝时属于噪音,会产生噪音污染,城市中某点P共受到两个声源的影响,这两个声源的声音能量分别是1I和2I,且10121410II.已知点P的声音能量等于声音能量1
I与2I之和,请根据(1)中的回归方程,判断P点是否受到噪音污染的干扰,并说明理由.附:对于一组数据1122,,,,,,nnuvuvuv,其回归直线Vau的斜率和截距的最小二乘估计分别为:121
,njiiniiuuvvvuuu.【解析】(1)根据散点图,可知22lgDabI更适合.(2)令lgiiWI,先建立D关于W的线性回归方程.∵10110215.1ˆ100.51iiiiiWWDDbW
W,∴ˆ160.ˆ7aDbW,∴D关于W的线性回归方程是ˆ10160.7DW,即D关于I的回归方程是ˆ10lg160.7DI.(3)点P的声音能量12III,∵10121410II,∴1
01212121410IIIIIII101021124105910IIII,根据(2)中的回归方程,点P的声音强度D的预报值10min10lg910160.710lg960.760D,∴点P会受到噪音污染的干扰.5.近期,某公交公
司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推
出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:根据以上数据,绘制了如图所示的散点图.(1)根据散点图判断,在推广期内,(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x
的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:其中711lg,7iiiiy.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:12
21ˆˆˆˆ,niiiniiunuauunu.1.已知变量x,y之间具有线性相关关系,其散点图如图所示,回归直线l的方程为y^=b^x+a^,则下列说法正确的是A.a^>0,b^<0
B.a^>0,b^>0C.a^<0,b^<0D.a^<0,b^>02.下列说法错误的是A.相关关系是一种非确定性关系B.线性回归方程对应的直线ybxa$$$,至少经过其样本数据点1122,,,,,,nnxyxyxy中的一个点C.
在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,2R为0.98的模型比2R为0.80的模型拟合的效果好3.在一组样本数据112212()()()(2nnnxyxyxynxxx,,,,,,,,,,不全相等)的散点图中,若所有样本点()(,1
,2,,)iixyin都在直线112yx上,则这组样本数据的样本相关系数为A.-1B.0C.12D.14.已知5个学生的数学和英语成绩如下表:学生ABCDE数学8075706560英语7066686462则数学与英语成绩之间A.是函数关
系B.是相关关系,但相关性很弱C.具有较好的相关关系,且是正相关D.具有较好的相关关系,且是负相关5.已知变量与负相关,且由观测数据算得样本平均数,则由该观测的数据算得的线性回归方程可能是A.B.C.D.6.某考察团对全国
10大城市的职工人均工资x与居民人均消费y进行统计调查,y与x具有相关关系,回归方程为0.66.52ˆ16yx(单位:千元),若某城市居民消费水平为7.675千元,估计该城市消费额占人均工资收入的百分比约为A.66%B.72.3%C.67.3%D.83%7.在
2019年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x元99.5m10.511销售量y件11n865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是3.240yx,且2
0mn,则其中的nA.10B.11C.12D.10.58.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响.对近8年的年宣传费和年销售量数据
作了初步处理,得到下面的散点图及一些统计量的值.有下列5个曲线类型:①ybxa;②ycxd;③;④;⑤,则较适宜作为年销售量关于年宣传费的回归方程的是A.①②B.②③C.②④D.③⑤9.下列四个结论:①在回归分析模型中,
残差平方和越大,说明模型的拟合效果越好;②某学校有男教师60名、女教师40名,为了解教师的体育爱好情况,在全体教师中抽取20名调查,则宜采用的抽样方法是分层抽样;③线性相关系数r越大,两个变量的线性相关性越弱;
反之,线性相关性越强;④在回归方程0.52yx中,当解释变量x每增加一个单位时,预报变量y增加0.5个单位.其中正确的结论是A.①②B.①④C.②③D.②④10.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系
.对某小组学生每周用于数学的学习时间x与数学成绩y进行数据收集如下表:x1516181922y10298115115120由表中样本数据求得回归方程为ˆˆˆybxa,则点ˆ()ˆ,ab与直线x+18y=100的位置关系是A.ˆ1810ˆ0abB
.ˆ1810ˆ0abC.ˆ1810ˆ0abD.ˆˆ18ab与100的大小无法确定11.以模型ekxyc去拟合一组数据时,为了求出回归方程,设lnzy,其变换后得到线性回归方程0.34zx,则cA.0.3B.0.3
eC.4D.4e12.千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:年份(届)201420152017学科竞赛获省级一等奖及以上的学生人数x51495557
被清华、北大等世界名校录取的学生人数y10396108107根据上表可得回归方程y^=b^x+a^中的b^为1.35,该校2018届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清
华、北大等世界名校录取的学生人数为A.111B.117C.118D.12313.由身高(cm)预报体重(kg)满足y=0.849x-85.712,若要找到41.638kg的人,________是在150cm的人群
中(填“一定”或“不一定”).14.已知方程ˆ0.8582.71yx是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm,ˆy的单位是kg,那么针对某个体(160,53)的残差是________.15.已知一组数据确定的回归直线方程为,且,发现两组数据,误差较大,去掉这两组数
据后,重新求得回归直线的斜率为,当时,____________.16.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-13附近波动.经计算61iix=11,61iiy=13,
621iix=21,则实数b的值为________.17.下表是某学生在4月份开始进人冲刺复习至高考前的5次大型联考数学成绩(分).(1)请画出上表数据的散点图;(2)①请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;②若在4月份开始进入冲刺复习前,该生的数学分数最好为116分,并
以此作为初始分数,利用上述回归方程预测高考的数学成绩,并以预测高考成绩作为最终成绩,求该生4月份后复习提高率.(复习提高率=,分数取整数)附:回归直线的斜率和截距的最小二乘估计公式分别为1221ˆniiiniixynxybxn
x,.18.某电视厂家准备在五一举行促销活动,现在根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万台)的数据如下:(1)若用线性回归模型拟合y与x的关系,求出y关于x的线
性回归方程(其中71279.4iiixy;参考方程:回归直线1221ˆniiiniixynxybxnx,ˆˆaybx)(2)若用模型ycdx拟合y与x的关系,可得回归方程ˆ1.6
30.99yx,经计算线性回归模型和该模型的2R分别约为0.75和0.88,请用2R说明选择哪个回归模型更好;(3)已知利润z与x,y的关系为z=200y﹣x.根据(2)的结果回答:当广告费x=20时,销售量及利润的预报值是多少
?(精确到0.01)参考数据:52.236.19.二手车经销商小王对其所经营的型号二手汽车的使用年数(单位年)与销售价格(单位:万元/辆)进行整理,得到如下数据:下面是关于的折线图.(1)由折线图可以看出,可以用线性回归模型拟
合与的关系,求关于的回归方程,并预测当某辆型号二手车使用年数为9年时售价约为多少?(小数点后保留两位有效数字)(2)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(1)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?参考公式:回归方
程ˆˆˆybxa中斜率和截距的最小二乘估计公式分别为:1122211()()()ˆnniiiiiinniiiixxyyxynxybxxxnx,ˆˆaybx.参考数据:6621147.64,139,
2,ln1.460.38,ln0.7110.34iiiiixzxz.20.某商场营销人员进行某商品的市场营销调查时发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到下表:反馈点数t(百分
比)12345销量y(千件)/天0.50.611.41.7(1)经分析发现,可用线性回归模型ˆˆ0.08ybt拟合当地该商品销量y(千件)与返还点数t之间的相关关系,试预测若返回6个点时该商品每天的销量;(2)若节日期间营销
部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:返还点数预期值区间(百分比)[1,3)[3,5)[5,7)[7,9)[9,11)[11,
13)频数206060302010将对返点点数的心理预期值在[1,3)和[11,13]的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,求抽出的3人中至少有1
名“欲望膨胀型”消费者的概率.21.《中华人民共和国道路交通安全法》第47条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,《中华人民共和国道路交通安全法》第90条规定:
对不礼让行人的驾驶员处以扣3分,罚款50元的处罚.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为统计数据:月份12345违章驾驶员人数1201051009085(1)请利用所给数据求违章人数y与月份x之间的回归直线
方程ˆˆˆybxa,并预测该路口7月份不“礼让斑马线”的违章驾驶员的人数;(2)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如下22列联
表:不礼让斑马线礼让斑马线合计驾龄不超过1年22830驾龄1年以上81220合计302050能否据此判断有97.5%的把握认为“礼让斑马线”的行为与驾龄有关?参考公式:在回归直线方程ˆˆˆybxa中,1221ˆniiiniixynxybxnx,ˆˆaybx,参考公式:
22nadbcKabcdacbd(其中nabcd).临界值表:20PKk0.1500.1000.0500.0250.0100.0050.0010k2.0722.7063.8415.0246.6357.87910.82822.为了缓解日益拥堵的交通
状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:①“盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高
到低分配名额.某人拟参加2018年5月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的数据,统计了最近5个月参与竞拍的人数(见下表):(1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数y(万人)与
月份编号t之间的相关关系.请用最小二乘法求y关于t的线性回归方程:,并预测2018年5月份参与竞拍的人数.(2)某市场调研机构从拟参加2018年5月份车牌竞拍人员中,随机抽取了200人,对他们的拟报价价格进行了调查,得到如下频数分布表和频率分布直方图:
(i)求的值及这200位竟拍人员中报价大于5万元的人数;(ii)若2018年5月份车牌配额数量为3000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价.参考公式及数据:①,其中1221,ˆˆˆni
iiniixynxybaybxxnx;②5521155,18.8iiiiitty.23.为利于分层教学,某学校根据学生的情况分成了A,B,C三类,经过一段时间的学习后在三类
学生中分别随机抽取了1个学生的5次考试成绩,其统计表如下:A类第x次12345分数y(满分150)1458395721105110iixx,552211180iiiixxyy;B类第x次12345分数y(满分150)859390761
015110iixx,55221160iiiixxyy;C类第x次12345分数y(满分150)85921011001125110iixx,55221163iiiixxyy
;(1)经计算已知A,B类学生成绩的相关系数分别为1045r.,2025r.,请计算出C类学生成绩的相关系数,并通过数据的分析回答抽到的哪类学生学习成绩最稳定;(结果保留两位有效数字,r越大认为成绩越稳定)(2)利用(1)中成绩最稳定的学
生的样本数据,已知线性回归直线方程为62ˆˆy.xa,利用线性回归直线方程预测该生第十次的成绩.附:相关系数12211niiinniiiixxyyrxxyy,线性回归直线方程ˆ
ˆˆybxa中,121niiinii(xx)(yy)(xxˆb),ˆˆaybx.24.某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如
下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型:①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示
的残差图及一些统计量的值:xy61iiixy621iix7301464.24364(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.(2)残差绝对值大于2的数据被认为是异常数据,需要剔除;(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;(ⅱ)广告投入
量x=18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y^=b^x+a^的斜率和截距的最小二乘估计分别为1122211()()ˆ()nniiiiiinniiiix
xyyxynxybxxxnx,ˆˆaybx.1.(2015新课标全国Ⅱ文科)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是A.逐年比较,2008年减少二氧化硫排
放量的效果最显著B.2007年我国治理二氧化硫排放显现C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关2.(2014湖北文科)根据如下样本数据:x345678
y4.02.50.50.52.03.0得到的回归方程为abxyˆ,则A.0a,0bB.0a,0bC.0a,0bD.0a,0b3.(2018新课标全国Ⅱ文科)下图是某地区2000年至年环境基础设施
投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5
yt;根据2010年至年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5yt.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.4.(2017新课标全国Ⅰ文科)为
了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929
.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得16119.9716iixx,16162221111()(16)0.2121616iii
isxxxx,1621(8.5)18.439ii,161()(8.5)2.78iixxi,其中ix为抽取的第i个零件的尺寸,1,2,,16i.(1)求(,)ixi(1,2,,16)i的相关系数r
,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(3,3)x
sxs之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)xsxs之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差
.(精确到0.01)附:样本(,)iixy(1,2,,)in的相关系数12211()()()()niiinniiiixxyyrxxyy,0.0080.09.5.(新课标全国Ⅲ文科)下图是我国2008年
至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测年我国生活垃圾无害化处理量.附注:参考数据:719.32iiy
,7140.17iiity,721()0.55iiyy,72.646.参考公式:相关系数12211()()()()niiinniiiittyyrttyy,回归方程ˆˆyabt中斜率和截距的最小二乘估计公式分别为:121()()()niiiniittyy
btt,ˆ=.aybt6.(2015新课标全国Ⅰ文科)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的宣传费ix和年销售量(1,2,,8)
iyi数据作了初步处理,得到下面的散点图及一些统计量的值.xyw821()iixx821()iiww81()()iiixxyy81()()iiiwwyy46.65636.8289.81.61469108.8表中iw=ix,8118
iiww.(1)根据散点图判断,yabx与ycdx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y关于x的
回归方程;(3)已知这种产品的年利润z与x,y的关系为0.2zyx,根据(2)的结果回答下列问题:①年宣传费49x时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据11(,)uv,22(,)uv,…,(,)nnuv,其回归直线vu的斜率
和截距的最小二乘估计分别为:121()()=()niiiniiuuvvuu,ˆˆ=vu.7.(2015重庆文科)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t1
2345储蓄存款y(千亿元)567810(1)求y关于t的回归方程ˆˆˆybta;(2)用所求回归方程预测该地区2015年(6t)的人民币储蓄存款.附:回归方程ˆˆˆybta中,1221ˆniiiniitynt
ybtnt,ˆˆaybt.1.【答案】C【解析】因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,所以可设z=b^y+a^,b^>0,则z=b^y+a^=-0.1b^x+b^+a^,故x与z负相关.2.【答案】C【解析】根据题中提供的数据,变量Y随X的增
大而增大,故Y与X正相关,即r1>0;变量V随U的增大而减小,故V与U负相关,即r2<0,故r2<0<r1.3.【答案】C【解析】由已知得,12342.54x,1.41.82.43.22.2
4y,故A错误;由回归直线0.6ˆˆyxa恒过样本中心点(2.5,2.2),得ˆ2.20.62.5a,解得ˆa0.7.∴回归直线方程为ˆ0.60.7yx.x每增加1个单位,y就增加0.6个单位,故B,D错误;当x=5时,y的预测值为3.7,故C正确.故选
C.4.【解析】(1)依照最高(低)温度折线图和出芽数条形图可得如下数据表:日期1日2日3日4日5日6日变式拓展温差x781291311出芽数y232637314035故10x,32y,ixx322131iyy96518362
13926251381377iiixxyy,62222222132213128iixx,所以,12172ˆ71184niiiniixxyybxx
,则11932ˆˆ1042aybx,所以,绿豆种子出芽数y(颗)关于温差(C)x的回归方程为11942yx;(2)因为4月1日至7日温差的平均值为11C,所以4月7日的温差77116017(C)x,所以,71191751
.2542y,所以,4月7日浸泡的10000颗绿豆种子一天内的出芽数约为5125颗.5.【解析】(1)根据散点图判断,适宜作为扫码支付的人数关于活动推出天数的回归方程类型.(2),∴两边同时取常用对数得lglglgl
gxycdcxd.设lgyv,.721140iix,7172221750.12741.547ˆlg0.2514074287iiiiixvxvdxx,把样本点的中心代入,得ˆlg0.54c,,∴ˆl0.540.25gyx,则关于的回归方程为.把代
入上式,得.故活动推出第天使用扫码支付的人次为.1.【答案】D【解析】由题图可知,回归直线的斜率是正数,即b^>0;回归直线在y轴上的截距是负数,即a^<0,故选D.2.【答案】B【解析】对于选项A,相关关系是一种非确定的关系,而函数关系是一种确定的关系,A选
项正确;对于选项B,回归直线ybxa$$$过样本数据1122,,,,,,nnxyxyxyL的中心,xy,并不一定过样本数据中的某一个点,B选项错误;对于C选项,在残差图中,残差点分布的带状区域的宽度越狭窄,说明数据越逼近回归直线,两个变量的相关关系越强,其拟合精确度越高,C
选项正确;对于D选项而言,2R越大,其拟合效果越好,D选项正确.故选B.3.【答案】D【解析】所有样本点均在直线上,则样本相关系数最大,即为1.4.【答案】C考点冲关【解析】画出散点图,通过散点图进行判断.设数学成绩和英语成绩分别为x,y,画出散点图,如图,从图上可以看出数学成绩
和英语成绩具有较好的相关关系,且是正相关.故选C.5.【答案】C【解析】因为变量与负相关,所以,排除A、B选项;因为,代入检验即可得到C正确.所以选C.6.【答案】D【解析】由题意知,ˆ7.675y,代入回归方程得,9.262x,所以该城市消费额占人均工资收入的百分比约
为7.675100%83%9.262,故选D.7.【答案】A【解析】由题意,可得99.510.5114055mmx,118653055nny,又由回归直线方程3.240yx
,得30403.24055nm,即165210mn,又因为20mn,解得10,10mn,故选A.8.【答案】B【解析】从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y=或y=p+
qlnx较适宜,故选B.9.【答案】D【解析】根据残差的意义,可知当残差的平方和越小,模拟效果越好,所以①错误;当个体差异明显时,选用分层抽样法抽样,所以②正确;根据线性相关系数特征,当相关系数r越大,两个变量的线性相关性越强,所以③错误;根据回归方程的系数为0.5,可知当解释变
量x每增加一个单位时,预报变量y增加0.5个单位.综上,②④正确,故选D.10.【答案】B【解析】x=(15+16+18+19+22)×15=18,y=(102+98+115+115+120)×15=110,所以样本点的中心为(18,110),所以有ˆ110
18ˆba,即点ˆ()ˆ,ab满足ˆˆ18ab=110>100.11.【答案】D【解析】因为ekxyc,所以两边同时取对数得lnlnykxc,设lnzy,得lnzkxc,又因为变换后得到线性回归方程
0.34zx,所以ln4c,解得4ec.12.【答案】B【解析】因为x-=53,y-=103.5,所以a^=y--b^x-=103.5-1.35×53=31.95,所以回归直线方程为y^=1.35x+31.95.当x=63时,代入解得y^=117,故选B
.13.【答案】不一定【解析】由回归分析可知,体重为41.638kg的人的身高多数在150cm左右.故答案为:不一定.14.【答案】0.29【解析】把160x代入ˆ0.8582.71yx,得ˆ0.851608
2.7153.29y,所以残差ˆˆ5353.290.29eyy.15.【答案】5【解析】∵一组数据确定的回归直线方程为,且,∴,解得,∴原样本点的中心为(2,4).由题意得去掉数据后新数据
的样本点的中心为(2,4),重新求得的回归直线的斜率估计值为,∴可设新的回归直线方程为,将点(2,4)代入上式后得,解得,∴新的回归直线的方程为,将代入回归直线方程求得.16.【答案】57【解析】令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-
13,此时t-=6216iix=72,y-=616iiy=136,代入y=bt-13,得136=b×72-13,解得b=57.17.【解析】(1)散点图如图:(2)①计算得,,511992iiixy,52155iix,,5531291935xy,所以,,故关于的线性回归
方程为.②由上述回归方程可得高考应该是第六次考试,故,则(分),故净提高分为(分),所以该生的复习提高率为.18.【解析】(1)由题意有8x,4.2y,71279.4iiixy,217708ii
x,∴71722217279.4784.2ˆ0.17708787iiiiixyxybxx,则ˆˆ4.20.1782.84aybx,∴y关于x的线性回归方程为ˆ0.172.84y
x;(2)R2越接近于1,模型的拟合效果越好,故选用ˆ1.630.99yx;(3)广告费x=20时,销售量预报值ˆ1.630.99206.0576.06y(万台),故利润的预报值2001.630.9920201191.46z(万元).19.【解析】(
1)由题意,计算得,,且6147.64iiixz,621139iix,计算得616222147.6464.526.360.36139ˆ64.517.5iiiiixznxzbxnx,∴,∴
z关于x的线性回归方程是,又,∴y关于x的回归方程是.令,解得,即预测当某辆A型号二手车使用年数为9年时,售价约1.46万元.(2)当时,,∴,解得,因此预测在收购该型号二手车时,车辆的使用年数不得超过
11年.20.【解析】(1)易知123450.50.611.41.73,1.0455ty,所以1.04=3b+0.08,所以0.32b.则y关于t的线性回归方程为0.320.08yt,当6t时,2.00y,即返回6个点时该商品每天销量约为2
千件.(2)设从“欲望膨胀型”消费者中抽取x人,从“欲望紧缩型”消费者中抽取y人,由分层抽样的定义可知6301020xy,解得2,4xy,在抽取的6人中,2名“欲望膨胀型”消费者分别记为12,AA,
4名“欲望紧缩型”消费者分别记为1234,,,BBBB,则所有的抽样情况共20种,其中至少有1名“欲望膨胀型”消费者的情况有16种,记事件A为“抽出的3人中至少有1名„欲望膨胀型‟消费者”,则16()0.820PA.21.【解析】(1)利用所给数据,计算得x=15×(1+
2+3+4+5)=3,y=15×(120+105+100+90+85)=100,则51522155iiiiixyxybxx=21415531005553=8.5,aybx=100﹣(﹣8.5)×3=125.5,∴y与x之间的回归直线方程为8.512
5.5yx,当7x时,ˆ8.57125.566y,即预测该路口7月份不“礼让斑马线”的违章驾驶员有66人.(2)由列联表中数据,计算得2250(221288)505.5565.024302030209K
,由此能判断有97.5%的把握认为“礼让斑马线”的行为与驾龄有关.22.【解析】(1)易知1234535t,0.50.611.41.71.045y,计算得12221551
8.8531.040.325ˆ553iiiiityntybtnt,则,则关于的线性回归方程为,当时,,即2018年5月份参与竞拍的人数估计为2万人.(2)(i)由,解得.由频率和为1,得,解得,则200位竞拍人员报价大于5万元的人数为.(ii)
2018年5月份实际发放车牌数量为3000,根据竞价规则,报价在最低成交价以上人数占总人数比例为3000100%15%20000.又由频率分布直方图知竞拍报价大于6万元的频率为,所以根据统计思想(样本估计总体)可预测2018年5月份
竞拍的最低成交价为6万元.23.【解析】(1)根据所给数据,可得对于C类学生:3x,98y,则5162iiixxyy,所以36209863r.,又1045r.,2025r.,则从C类学生抽到的学生的成绩最稳定.(2)由(1
)知3x,98y,所以98623794ˆa..,所以62794ˆy.x.当10x时,1414ˆy.,所以预测第10次的成绩为1414.分.24.【解析】(1)应该选择模型①,因为模型①的残差点比较均匀地
落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.(2)(ⅰ)剔除异常数据,即3月份的数据后,得x-=15×(7×6-6)=7.2,y-=15×(30×6-31.8)=29.64.51iiixy=1464.24-6×31.8=1273.
44,521iix=364-62=328.则51522151273.4ˆ457.229.64206.4332857.27.268.85iiiiixyxyxxb,a^=y--b^x-=29.64-3×7.2=8.04.所以y关于x的回归方程为y^=
3x+8.04.(ⅱ)把x=18代入(ⅰ)中所求回归方程,得y^=3×18+8.04=62.04,故预报值为62.04万元.1.【答案】D【解析】由柱形图得,从2006年以来,我国二氧化硫排放量呈下降趋势,故年排放量与年份负相关,直通高考故选D.2.【答案】B【解析】依题
意,画散点图知,两个变量负相关,所以0b,0a.选B.3.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y$=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y$=99+17.5×9=256.5(亿
元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至年的数据建立的线性模型①不能
很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至年的数据建立的线性模型y$=99+17.5t可以较好
地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.4.【解析】(1)由
样本数据得(,)(1,2,,16)ixii的相关系数为16116162211()(8.5)2.780.180.2121618.439()(8.5)iiiiixxirxxi
.由于||0.25r,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i)由于9.97,0.212xs,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)xsxs以外,因此需对当天的生产过程进行检查.(i
i)剔除离群值,即第13个数据,剩下数据的平均数为1(169.979.22)10.0215,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162221160.212169.971591.134iix,剔除第13个数据,剩下数据的样本方差
为221(1591.1349.221510.02)0.00815,这条生产线当天生产的零件尺寸的标准差的估计值为0.0080.09.【考点】相关系数,方差、均值的计算【名师点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“
新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.5.【解析】(1)由折线图中数据和附注中参考数据得4t,721()28iitt,721()0.55iiyy,777111()()40.174
9.322.89iiiiiiiittyytyty,99.0646.2255.089.2r.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)由331.1732.9y及(1)得71721
()()2.89ˆ0.10328()iiiiittyybtt,ˆˆ1.3310.10340.92aybt.所以,y关于t的回归方程为:ty10.092.0ˆ.将年对应的9t代入回归方程得:82.1910.092.0ˆy.所以预测年我国生活垃圾无
害化处理量将约为1.82亿吨.【解题必备】判断两个变量是否线性相关以及相关程度的大小通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出r,然后根据r的大小进行判断.求线性回归方程时要严格按照公式求解,一定要注意计算的准确性.6.【解析】(1)由散点图可以判断
,ycdx适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令wx,先建立y关于w的线性回归方程,由于1011021()()=()iiiiiwwyydww108.8=681.6,563686.810
0.6cydw.所以y关于w的线性回归方程为ˆ100.668yw,因此y关于x的回归方程为ˆ100.668yx.(3)①由(2)知,当49x时,年销售量y的预报值ˆ100.668476695.y,年利润z的预报值ˆ
576.60.24966.32z.②根据(2)的结果知,年利润z的预报值ˆ0.2(100.668)13.620.12zxxxx,∴当x13.6=6.82,即46.24x时,ˆz取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.
7.【解析】(1)列表计算如下:iitiy2itiity11515226412337921448163255102550153655120这里111151365,3,7.2.55nniiiintyyntn=========邋又2221
1555310,120537.212.nnttityiiiiltnltyntyt===-=-?=-=-创=邋从而12ˆˆˆ1.2,7.21.233.610tyttlbaytbl====-=-?.故所求回归方程为ˆ1.23
.6yt=+.(2)将6t=代入回归方程可预测该地区2015年的人民币储蓄存款为ˆ1.263.610.8().y=?=千亿元