【西南财大课件计量经济学】JLJJ四章

PPT
  • 阅读 500 次
  • 下载 0 次
  • 页数 47 页
  • 大小 472.247 KB
  • 2023-08-09 上传
  • 收藏
  • 违规举报
  • © 版权认领
下载文档22.00 元 加入VIP免费下载
此文档由【精品优选】提供上传,收益归文档提供者,本网站只提供存储服务。若此文档侵犯了您的版权,欢迎进行违规举报版权认领
【西南财大课件计量经济学】JLJJ四章
可在后台配置第一页与第二页中间广告代码
【西南财大课件计量经济学】JLJJ四章
可在后台配置第二页与第三页中间广告代码
【西南财大课件计量经济学】JLJJ四章
可在后台配置第三页与第四页中间广告代码
【西南财大课件计量经济学】JLJJ四章
【西南财大课件计量经济学】JLJJ四章
还剩10页未读,继续阅读
【这是免费文档,您可以免费阅读】
/ 47
  • 收藏
  • 违规举报
  • © 版权认领
下载文档22.00 元 加入VIP免费下载
文本内容

【文档说明】【西南财大课件计量经济学】JLJJ四章.pptx,共(47)页,472.247 KB,由精品优选上传

转载请保留链接:https://www.ichengzhen.cn/view-323456.html

以下为本文档部分文字说明:

第四章多重共线性1重点与难点:多重共线性的概念及经济意义;不同程度多重共线性的后果;多重共线性的诊断思路,与异方差性、自相关性的区别;多重共线性的补救措施(思路、做法),与异方差性、自相关性的区别。教学要求(目的):本章讨论违背古典假定(多重共

线性)时,线性回归模型的建立。通过本章的学习要求:掌握多重共线性的概念;模型中出现多重共线性的不良后果;掌握诊断多重共线性的若干方法;掌握修正多重共线性的若干方法;根据本章知识,能够独立解决模型中的多重共线性问题。2回顾6

项基本假定:(1)解释变量间不相关(无多重共线性)(2)E(ui)=0(随机项均值为零)(3)Var(ui)=(同方差)(4)Cov(ui,uj)=0(随机项无自相关)(5)Cov(X,ui)=0(随机项与解释变量X不相关)(6)随机扰动服从正态分布23问题的提出:•在前述

基本假定下,OLS估计具有BLUE的优良性。•然而实际问题中,这些基本假定往往不能满足,使OLS方法失效,不再具有BLUE特性。•估计参数时,必须检验基本假定是否满足,并针对基本假定不满足的情况,采取相应的补救措施或者新的方法。•对基本

假定是否满足的检验称为计量经济学检验。4不满足基本假定的情形(1)1、通常不会发生随机扰动项均值不等于0的情形。若发生也不会影响解释变量的系数,只会影响截距项。2、随机扰动项正态性假设一般能够成立,就算不成立,在大样本下也会近似成立。(所以不讨论以上假定是否违背的问题)5不

满足基本假定的情形(2)4、随机扰动项相关=>序列自相关——时间序列数据经常出现序列相关性。则称模型存在多重共线如果这一假定不满足,存在。)(即无关的的各列向量之间是线性矩阵的基本假定是中,对在多元线性回归模型-1''XX0,|XX|),()(:X:

==nkkXrXXY3、解释变量之间相关=>多重共线5、随机扰动项方差不等于常数=>异方差——截面数据时,经常出现异方差6第五节解决多重共线性实例第一节什么是多重共线性第二节多重共线性产生的后果第三节多重共线性的检验第四节多重共线性的补救措施主要内

容7先从两个实例谈起例1:某地区为研究不同家庭的消费Y与收入X2的关系,在此基础上,还引进了消费者家庭财富状况X3作为第二个解释变量。模型为:9531.02=RSE=(6.7525)(0.8229)(0.0807)t=(3.6690)(1.14

42)(-0.5261)F=92.4020例2:某国家分折汽车保养费用支出Y(元)与汽车的行程数X2(公里)以及汽车拥有的时间X3(周)的关系。建立如下模型:946.02=RSE=(121.50)(28.79)(21.41)t=(0.06)(0.958)(

-7.06)320424.09415.07747.24ˆXXY−+=325.1516158.2729.7ˆXXY−+=第一节什么是多重共线性注:例2中X3的t值大,但X3的系数符号与经济意义不符号。原因?注:例1中X2、X3的t值小。且X3的系数符号与经济意义不符

号。原因?8式中:是不全为0的常数,则称解释变量之间存在完全多重共线性。ikikiiiuXXXY+++++=33221uTNSC++++=332103322=+++kkXXXk、、、32一、多重共线性的定义

(表现为两种情形)(一)完全的多重共线性线性回归模型中的若干解释变量或全部解释变量的样本观测值之间具有某种严格的线性关系。即对于一般线性回归模型各解释变量的样本观测值之间存在一个或多个如下的关系式例如,设有回归模型uTNSC++++=43

21其中:C为居民个人消费;S为个人工资收入;N为非劳动收入;T为总收入因为NST+=所以解释变量之间存在完全共线性。91032232322=−−−=rXXXXXXkkk之间的相关系数,,与即:)上式为,如设线性组合,即线性函数成其它解释变量的精确以写某个(或某些)解释可完全多

重共线性意味着完全代替。的作用可由对。关系数为的相与的常数),这时是不为(例如23232310:XYXXXXX=10),表出以由其余的列向量线性可中,至少有一个列向量(或:向量矩阵异的,其逆矩阵不存在是奇),矩阵,(即于不再是列满秩的

,秩小阵的系数矩共线性,正规方程组中线性变量之间存在完全注:0)(=XXXXXkXRankkX性)。估计量所具有的统计特(但这些解不具有解。。正规方程有无穷多个将不能唯一解出)(故由正规方程组:OLSYXXXXXYXˆˆˆ1=→=−11称解释变量之间存在着近似(不完

全)多重共线性。03322=++++uXXXkk(二)近似(不完全)多重共线性(实际中多为此情况)若解释变量之间满足近似线性关系:例如,用时间序列数据建立回归模型时,由于许多经济变量都有随时间的推移而同方向变动的特征,往往使得解释变量之间也具有很高的线性相关性;例如,影响家庭消

费支出的家庭收入和家庭财富两个变量之间就存在明显的高度相关关系(但不是完全线性相关关系);例如,影响企业产出的劳动投入和资本投入二者之间也往往具有相当高的相关关系,但也不是完全线性相关关系.。的相关系数近似等于与这时重共线性,的常数)存在不

完全多是不为(例如,102323XXuXX+=12相当差)。(但该估计量的准确性的最小二乘估计量。)的逆存在。即可求阵(非奇异,矩又列满秩了,矩阵阵正规方程组中的系数矩性,变量之间存在近似共线若线性回归模型的解释注:XXXXX注意:解释变量之间无多重共线性,是指解释变量之间

不存在线性相关性,但并不排除解释变量之间存在非线性关系。对角线元素较大),(-1''XX0|XX|13二、产生多重共线性的背景1、趋同性:经济变量在时间上常存在共同的变化趋势(时间序列数据)例如,宏观经济处于上升阶段时,国内生产总值增长,净出

口也增长;例如,经济的增长带动了收入的增长,随之使商品销售额有所增长,相应地市场利率,零售物价指数,储蓄额等变量也会发生变化。如将这些变量作为解释变量引入模型,它们之间极有可能存在很强的相关性2、经济变量之间本身具有内在

联系(截面数据建模)例,利用截面数据来研究企业生产函数时,从投入的要素看,资本投入、劳动力投入等,都与企业的生产规模密切相关(较大的企业,资本投入和劳动力投入都会较多,反之较少。因此,资本投入与劳动力投入之间几乎是高度线性相关的,它们之间往往存在严重的多重共线性。143、模型中大量地采用滞后

变量也易产生多重共线性(同一变量的逐次值在经济性质上无区别,一般都存在相互关系)例如,在研究消费函数Y的时候,如果记可支配收入为X,若在模型中引入本期可支配收入,还考虑了以往各期的可支配收入,那么同一变量的前后期之值极有可能是高度线性相关的,故可能产生多

重共线性。4、建模时由于认识的局限性,也易产生多重共线性1)数据资料的来源(如数据来源于年鉴,数据并非研究总体的全部)2)变量的选择不当例如,在分析建立某省粮食产量Y线性回归模型时,考虑引入解释变量:化肥X2、灌溉面积X3、农业生产资金投入X4

(在X2、X3和X4之间存在很强的相关性,由于化肥使用量和灌溉面积(兴修水利的结果)都受农业资金投入的影响)。(思考:是否可以去掉农业生产资金投入变量X4?)例如,做电力消费Y对收入X2、住房面积X3

的回归时(高收入的家庭一般都比低收入家庭有较大的住房面积这样一种有形的约束);有的学者认为多重共线是一个数据、样本的问题。151、参数估计值的不确定性uxxy++=3322uXXY+++=33221uxxy++=3322第二节多重共线性产生的后果一、完全多重共线性产生的后果例:二元线

性回归模型:模型的离差形式为:用普通最小二乘法,得参数估计量的正规方程为:=+=+yxxxxyxxx32333222233222ˆˆˆˆ估计量分别为:的和解方程,可得OLS3216−−=232232

23232322)())(())(())((ˆxxxxxxyxxyx23223223222233)())(())(())((ˆxxxxxxyxxyx−−=)(00)(00(不定式)分子、分母均为的、,

则例如设:关如两个解释变量完全相0ˆˆ3223xx=的数值。、则无法确定32ˆˆ量的作用)分辨各解释变量对因变的估计值(即不能独立、),而无法得到(的估计值表明只能给出综合参数)(可写为:,

实际上,在这种情形下323222323322ˆˆˆ+=+=++=++=uxuxyuxxy172、参数估计值的方差无限大的方差为:和由第三章得32ˆˆjjjcVar2)ˆ(=)列的元素。)行(的()为(不含截距项,

列的元素;行的)为(,含截距项所不同)随方程是否含截距项有中(注:11)ˆ(1112−−=−−jjXXcjjXXcjjccVarjjjjjjjjj18−−−=−22323223232232211xxxxxxxxxxXX)()因为(23xx=如

:设=−=−=−==−)()()()()(的方差等于:22322223222322322232232232223221222211ˆˆrxxxxxxxxxxxxxXXVar==

−=222222222222220)()()()ˆ(xxxxxxVaruxxy++=3322在完全多重共线性条件下:19232232222233)()ˆ(ˆxxxxxVar−=

的方差为:同理:易得)1(223232−=x=)ˆ(3Var且:20小结:完全多重共线性产生的后果1、参数估计值的不确定性的唯一解。、无法得到)(合的唯一解:只能得到系数的线性组)(如设32322323322ˆˆˆˆˆ23+=++=⎯⎯⎯→++=

=uxyuxxyxx=)ˆ(jVar2、参数估计值的方差(标准差)无限大?ˆˆ:22232332223作用对因变量来解释能否用系数)(如问题设yxuxyuxxyxx++=⎯⎯⎯→++==21(二)不完全多重共线性产生的后果1、可以估计参数,但参数估计

不稳定946.006.7958.006.041.2179.2850.1215.1516158.2729.7ˆ232=−==−+=RtseXXY)()()()()()(例:某国家分折汽车保养费用支出(元)与汽车的行程数(公

里)以及汽车拥有的时间(周)的关系。建立如下模型:;汽车每周的行程公里数—其中:2X拥有汽车的时间—3X尽管X3的t值较显著,但它的系数符号与经济意义不一致。计算出X2与X3的相关系数为0.9960,表明汽车的行程数与拥有汽车的时间呈高度的线性相关。意义相违背的情况)。难以置信或符号与经济(

甚至出现回归系数值化敏感变化大,参数估计值变),(量除一个不显著的解释变删本容量稍有增、减样本数据稍有变化或样程求解参数估计值,但可由正规方非奇异,,件下在不完全多重共线性条1)(,0||−XXXXXX22的常数)是不为(线性,有关系之间存在不完全多重共与假定023

23uxxxx+=−−−=yxyxxxxxxxxxxx322232322323223221)()不相关(与);()(为随机项,且其中:00022===iiiiuxuxuuEu22222222222

2222222222222223223223322232)(ˆxuuyxuyxxuxxxuyyxuxyxxxxxyxxxyxxii−=−++−+=−−=)()()

)(()(注:YXXX')'(1−==321ˆˆˆˆ232、估计量的方差增大23223222322)()ˆ(xxxxxVar−=)1(223222−=x由于有同样的结论。对)会增大。(,越接近的线性相关性越高,、

3222332ˆˆ1Varrxx241001021199.09.05.011223223223、、时,、、如增大而增大而增大。化,即随变量共线性的高、低变估计值的方差会随解释=−=−rrr)1()ˆ(2232222−=xVar22322222332222223322232

3232223222311ˆ0ˆ011111rxVarrxxxVarrxxrrxxxxr−===−−=)(,,存在不完全共线性时、)(,不存在共线性时,、特别:所以,因为)(由于:如:253、t检验失效检验失效)。(模型设定误差。),造成(删除重要

的接受会变小可能造成错误的统计量差增大,的影响是否显著。若方对用于检验)(统计量txHtyxESttiiii0ˆˆˆ=262RFt由于多重共线性的情况复杂之间与另外部分)部分(之间与部分)某个(之间(与全部)某个(之间与)某个(jijijijiXXXXjikjXXXX43),,,2,

121=多重共线性是一个程度问题,而不是有无问题(关注程度!)多重共线性的检验没有固定的方法第三节多重共线性的检验27方法:模型中将要引进的解释变量为,计算相关系数矩阵,观察两两之间的线性相关是否密切kXXX,,322RFtkkkkkk

323333222322一、简单相关系数矩阵法。个变量的简单相关系数个变量与第是第其中:jiij注:该方法的局限性主要在于相关系数只能测度两个解释变量之间线性相关的程度,而

不能测度三个或更多解释变量之间的线性相关程度。(点击:quick/groupstatistics/correlation/ok)28二、综合判断法重共线性。值小,说明模型存在多值大;)大,或tFRR22(注:检验不显著。独立作用不能分辨,故的量之间存在共线性,对值很小,说明各解释变提下,若各个在此

前的联合线性作用显著。释变量对是由回归解释的,各解)(假定值大,表明总离差中和这是因为:tYtYRFR95.0%9522=29三、辅助回归判定系数测度法方法:计算模型中每个解释变量对其余解释变量的辅助回归:jX;(2232),,RXXfXk=;(23423),,RXXXfXk=|21

121),,,,,,(jkjjjRXXXXXfX+−=共线性将是有害的。,表明模型之间的多重的值超过了如果性;间存在严重的多重共线的值很大,表明模型之如果222RRRjj30第四节多重共线性的补救措施一、增加样本容量建模时样本数据太少,易产生多重共线性。iiiiuXXY+++=33221

的方差分别为:和32ˆˆ)1()ˆ(2232222−=xVar)1()ˆ(2232323−=xVar如,二元线性回归模型方差减小。增大,从而使估计值的和会使通过增加样本容量,将可以看出2322:XX(复习)不完全多重共线性产生的后果:可以估计

参数,但参数估计不稳定;估计量的方差增大;t检验失效31二、利用先验信息改变参数的约束条件先验信息:在此之前的研究成果(或经济理论分析)所提供的信息(非样本)先验信息。若由先验信息知,模型中某些参数间具有某种线性关系,则可将这种线性关系作为约束条件(把有共线性的

变量组合成新的变量),将此约束条件和样本信息结合起来进行有约束最小平方估计,从而消除共线性。例:在对国民经济的总量生产函数研究中,常使用国内生产总值Y和资本投入K及劳动力投入L的时间序列资料来建立回归方程:KLAYlnlnlnln++=取对数:KALY=式

中:A表示生产的技术水平。由于劳动力投入L和资本投入K的时间序列资料通常都具有很高的线性相关关系,所以这里往往存在较严重的多重共线性。但通过经济理论分析或经验判断,认为该经济系统存在规模效益不变的特征,即有1=+上述回归模型就转变为:(投入增加多少,产出比例不变)32KLAYlnln)1(

lnln+−+=LKLnLnALYLn+=即可将Y对L和K的二元双对数线性回归模型转化为劳动生产率(资本产出率)Y/L对劳动资本装备程度(劳动对资本的投入率)K/L的一元双对数线性回归模型,避免了多重共线性的影响。LKLnXLYLn

Y==;设XAY+=则有)ln(lnlnlnlnLKALY−+=−33三、数据的结合有时在时间序列数据中多重共线性严重的变量,在截面数据中不一定有严重的共线性;若能取得其间某些截面的样本数据,在假定截面数据估计出的参数在时间序列数据中变化不大的前提下,可先用截面数

据估计出一些变量的参数,再代入原模型估计另一些变量的参数。以减轻时间序列资料中的多重共线性,提高估计的精度。例如,某种商品的需求函数:ttttXXY+++=33221性)。关关系(存在多重共线两者具有较高的线性相消费者收入—;商品的价格—ttXX32若能取到某个时期

(或时点)的家计调查资料(同一时期商品的价格不会有多大变动),则:如何处理?333ˆ的估计值可得收入弹性性模型,的截面数据建立一元线和收入利用同一时期的销售量ttXY34然后再利用时间序列资料,将上式变换成tttttuXXY++=−22133ˆ)

(ˆ*33*tttttYYXYY后的代表修正了多重共线性令−=)(或则tttttttuXXYuXY++=++=23*21221*消费者的实际收入—ttXX2335四、利用差分方程(变换模型的形式)目的:改变变量的定义形式,以克服多重共线性。ttttuXXY+++=332

21设令之间存在多重共线性,与如果ttXX321−−=tttYYY1222−−=tttXXX1333−−=tttXXXiiiiuXXY+++=33221因为经济时序数据中,做了差分

的变量,其相关性比原变量的相关性弱,即多重共线性的程度有明显的降低。则模型变化为但变化后的模型中的随机误差项可能出现序列相关(注意:该方法慎用).36四、逐步回归法(既是判断是否存在多重共线性的方法,也是解决多重共线性的方法。)首先,用因变量Y对每一个解释变量Xi分别进行回归,从中确定

一个基本回归方程。然后,逐一引入其它解释变量,重新再作回归,逐步扩大模型的规模。然后,逐一引入其它解释变量,重新再作回归,逐步扩大模型的规模。引入每个新变量之后,如果1)拟合优度得以改进(提高),而且每个参数统计检验显著,则引入的

变量保留;2R2)拟合优度无明显提高甚至下降,对其他参数无明显影响,则舍弃该变量.3)拟合优度提高,但方程内其他参数的符号和数值明显变化,可以肯定产生了严重多重共线性。注意:这时对于3),需考察变量间线性相关的形式和程度,经过经济意义的综合

权衡,在线性相关程度最高的两个变量中,略去其中对因变量影响较小,经济意义相对次要的一个,保留影响较大,经济意义相对重要的一个。此时不宜轻率舍去新引入变量,否则会造成模型设定偏误和随机项与解释变量相关的后果。37第五节解决多重共线性实例2X3X4X5X年份197498.45560

.20153.206.531.231.891975100.70603.11190.009.121.302.03…………………1987178.69828.731094.6723.5311.6823.37天津统计年鉴(1988)其

中:Y是粮食销售量(万吨);常住人口(万人);X3人均收入(元);X4肉类销售量(万吨);X5蛋类销售量(万吨);X6鱼虾销售量(万吨);Y6X38一、模型及存在的问题多元线性回归模型估计结果如下:(2.119)(1

.945)(2.130)(1.409)(-2.028)方程中可决系数和统计量很大,但t统计量较小。临界值:所有参数估计值都不能通过显著性检验。这是存在多重共线性的典型特征。65432491.4453.3678.207367.01253.0500.3ˆXXXXXY

−++++−=9704.02=R53.52=F2RF306.2)614(025.0=−t39再利用相关系数检验法,可以得到各解释变量之间的相关系数分别为可见任何两个解释变量之间都有很强的正线性相关关系。因此样本存在严重的多重共线性。8666.023=r8823.024=r8524.025=r8

213.026=r9459.034=r9648.035=r9825.036=r9405.045=r9484.046=r9820.056=r40二、模型的修正t2RFˆDW23169.092.90ˆXY+−=38147.061.99ˆXY+=4893.465.74ˆXY+=574

0.59.108ˆXY+=6081.34.113ˆXY+=方程值值12.120.9248147.77.4471.5377.5870.827557.5611.280.6398.6820.862775.3710.07

0.81396.8340.79646.8312.270.7696.0140.750936.1613.560.5936以上结果表明:任何一个解释变量与被解释变量之间的关系都是显著的。41从经济意义角度来看,人口数和人均收入应该构成影响粮食销售量的主要因素,因此建模时常住人口数和人均收

入应作为基本解释变量予以保留。包含和各种估计式如下:2X3X变量值值5.064,2.2290.9482100.71.8044.462,1.143-0.5040.949562.626.6871.7464.7

77,0.9170.1680.948448.036.6351.6224.303,0.4981.2330.955170.846.3081.6833.321,1.3620.901,1.0160.953761.236.7611

.8294.0900.48201.176-0.1960.955346.336.7501.8773.1461.4791.821,-1.4012X3X4X5X6X2X3X4X2X3X5X6X2X4X3X2X5X3X2X3X6X2X3XF2Rtˆ

DW58.746.0251.6766.4560.963142由以上各估计式可以看出,只有保留了和的估计式能通过显著性检验,而且经济意义明显,是一个相当好样本回归方程。尽管二者之间还存在多重共线性,但是由于模型的整体显著,每个估计值也显著,因此可以不考虑它们之

间的共线性问题。t=(…)(5.064)(2.229)该式可以用于区间预测,政策评价或者结构分析。3202744.02294.094.40ˆXXY++−=9482.02=R7.100=F2X3X43例如:国际旅游外汇收入是国民收入的重要组成部分,影响一个国家或地区旅游收入的

因素包括:自然、文化、社会、经济、交通等多方面的因素;《中国统计年鉴》将三产业划分为12个组成部分,分别为:X1:农林牧渔服务业X2:地质勘查水利管理业X3:交通运输仓储和邮电通讯业X4:批发零售贸易和餐食业X

5:金融保险业X6:房地产业X7:社会服务业X8:卫生体育和社会福利业X9:教育文艺和广播X10:科学研究和综合艺术X11:党政机关X12:其他行业44VariableCoefficientStd.Errort-Statisti

cProb.C-0.7162731.292377-0.5542290.5862X10.1502130.1882480.7979530.4353X2-0.0612720.022381-2.7377430.

0135X30.0064050.0134690.4755250.6401X40.0321140.0477540.6724890.5098X5-0.0192540.041675-0.4619990.6496X60.1042370.0472012.2083950.0404X7-0.1999960.

107794-1.8553420.0800X80.1161430.0918821.2640490.2223X9-0.2294520.092187-2.4889880.0228X100.1067840.0580581.8392470.0824X110.0124580.0515670.24

15840.8118X12-0.0001490.002429-0.0612420.9518R-squared0.824393AdjustedR-squared0.707322F-statistic0.04182103Prob(F-statistic)0.0001

35454647

精品优选
精品优选
该用户很懒,什么也没有留下。
  • 文档 34925
  • 被下载 0
  • 被收藏 0
相关资源
广告代码123
若发现您的权益受到侵害,请立即联系客服,我们会尽快为您处理。侵权客服QQ:395972555 (支持时间:9:00-21:00) 公众号
Powered by 太赞文库
×
确认删除?