第2讲经典线性回归分析(计量经济学-社科院,张涛)

PPT
  • 阅读 56 次
  • 下载 0 次
  • 页数 71 页
  • 大小 359.121 KB
  • 2023-08-09 上传
  • 收藏
  • 违规举报
  • © 版权认领
下载文档22.00 元 加入VIP免费下载
此文档由【精品优选】提供上传,收益归文档提供者,本网站只提供存储服务。若此文档侵犯了您的版权,欢迎进行违规举报版权认领
第2讲经典线性回归分析(计量经济学-社科院,张涛)
可在后台配置第一页与第二页中间广告代码
第2讲经典线性回归分析(计量经济学-社科院,张涛)
可在后台配置第二页与第三页中间广告代码
第2讲经典线性回归分析(计量经济学-社科院,张涛)
可在后台配置第三页与第四页中间广告代码
第2讲经典线性回归分析(计量经济学-社科院,张涛)
第2讲经典线性回归分析(计量经济学-社科院,张涛)
还剩10页未读,继续阅读
【这是免费文档,您可以免费阅读】
/ 71
  • 收藏
  • 违规举报
  • © 版权认领
下载文档22.00 元 加入VIP免费下载
文本内容

【文档说明】第2讲经典线性回归分析(计量经济学-社科院,张涛).pptx,共(71)页,359.121 KB,由精品优选上传

转载请保留链接:https://www.ichengzhen.cn/view-323141.html

以下为本文档部分文字说明:

第2讲经典线性回归分析主要内容➢预备知识:数理统计➢一元线性回归分析➢多元线性回归分析➢非线性模型的线性化结构框架一元线性回归多元线性回归线性化模型的回归多项式模型双曲函数模型对数线性模型经典线性回归模型基本假定参数估计最小二乘极大似然显著性检验基本假定参数估计显著性检

验应用应用EVIEWS使用12.1数理统计概述(1)基本概念总体和样本对总体和样本的描述密度函数与分布函数(最完全)随机变量的数字特征(综合指标)矩:期望、方差、偏度、峰度统计量与抽样分布样本平均

数、样本方差、样本K阶原点距样本K阶中心距样本总体数理统计的核心统计量(2)几种重要的分布分布2正态分布与标准正态分布t分布F分布定义形状各分布之间的关系(3)几个重要的定理定理1:样本均值定理2:“样本方差”定理3:“样本均值与方差”定理4:“不同样本”结论:

分布是样本和总体的连接点。(总体和样本之间的联系在于它们具有相同的分布)(4)统计推断点估计与区间估计点估计:区间估计:估计方法假设检验(1)基本概念:单一假设和复合假设,原假设和备择假设,两类错误(2)方法置信区间法显著性检验法(一个检验统

计量是显著的,其含义是拒绝原假设)数理统计的内在逻辑样本总体样本均值样本矩矩估计OLS估计似然估计点估计区间估计置信区间显著检验2.2一元线性回归分析),2,1(niuxayiii=++=一元线性回归模型(总体回归模型):随机项的引入导

致了被解释变量的随机性,由此引发了计量经济学对模型的研究。),2,1(ˆˆˆnixayii=+=样本回归直线:),2,1()(nixayEii=+=总体回归方程:(1)基本假定对随机项(干扰项)的假定假定1:零均值假定2:

同方差假定3:无自相关*假定4:服从正态分布对解释变量的假定(或是对数据的假定)假定1:非随机性假定2:与随机项不相关假定3:没有完全的线性关系假定4:X要有变异性。对模型设定的假定假定1:回归模型对参数而言是线性的。假定2:回归模型是正确设定的。(2)估计问题最小二乘法:残

差的平方和最小=nii12min正规方程:(简化形式)==00iiix最小二乘估计量的表达式=−=2ˆˆˆiiixyxxyxxxi−=yyyi−=最小二乘估计量的性质数值性质:OLS估计量纯粹是由可观测量

(样本)表示的。OLS估计量是点估计量。回归直线通过样本均值。残差的均值为零。数值性质与统计性质最小二乘估计量的统计性质(BLUE性质)高斯—马尔科夫定理线性:无偏性:最小方差性:+==iiiiukyk

ˆ=)ˆ(E=)ˆ(E=22)ˆ(iuxVar=222)ˆ(iiuxnxVar−=iiykxn)1()参数估计量的抽样分布*假定4:扰动项服从正态分布(1)正态分布仅涉及两个参数。(2)正

态分布的任意线性组合仍是正态分布。(3)中心极限定理作保证。))ˆ(,(~ˆVarN))ˆ(,(~ˆVarN随机扰动项的估计随机扰动项方差估计量2ˆ2222−−=−=nyxyniiiiu)结论:在正

态性假定条件下,除了满足BLUE性质以外,截距和斜率的OLS估计量服从正态分布,随机扰动项的方差服从Chi-平方分布。(3)检验回归参数的t检验检验:回归模型中是否存在线性关系?这种关系是显著的吗?0:0:10

=HH)2(~)ˆ(ˆˆ)(ˆˆ−=−=ntVVT)经验规律在实际应用中,显著水平通常取5%,在t分布表中,当样本观察值的个数大于15时,t临界值大体保持在2左右。由此我们得到一个十分简便的检验方法,t绝对值大于2时,我们就可以

得出系数是统计显著的结论。但是,如果t值接近2,这种经验判断的方法就不准确。回归方程的显著性检验和拟合优度(1)总离差平方和的分解:TSS=RSS+ESS(2)拟合优度(样本决定系数):(3)回归方程的显著性检验:方差分析表离差名称平方和自由度均方

差F值回归(解释变量)剩余(随机因素)综计(4)一元线性回归方程应用:截面数据数据来源:2000年中国各地区消费和收入数据Eviews//example1计算与分析:EVIEWS一元线性回归方程应用:时间序列检验模型的结构稳定性:Chow检验步骤1:全部样本进行回归。步骤2:不同时期

样本回归。步骤3:构造统计量。步骤4:假设检验。)2/(/2145knnSkSF−+=(5)极大似然估计方法介绍设总体Y的概率密度函数形式已知,含有参数。则总体Y的样本nYYY21,的联合概率密度为=niiyf1);(,我

们称其为似然函数:),/(21nyyyLL===niiyf1);(似然函数的概念极大似然估计设总体Y含有未知参数,并且总体分布的形式已知,nyyy,,21为Y的一组观察值。若存在的一个估计值ˆ,使得似然函数)/(2,1nyyyL

在)=时,max)/(2,1=nyyyL则称ˆ使的一个极大似然估计值。2.3多元线性回归分析三变量线性回归分析新概念偏回归系数校正的判定系数偏相关系数iiiiuXXY+++=33221原始数据(四组)Y1X1Y2

X2Y3X3Y4X48.04109.14107.46106.5886.9588.1486.7785.7687.58138.741312.74137.7188.8198.7797.1198.8488.33119.2611

7.81118.4789.96148.1148.84147.0487.2466.1366.0865.2584.2643.145.39412.51910.84129.13128.15125.5684.8277.2676.

4277.9185.6854.7455.7356.898双变量回归CoefficientStd.Errort-StatisticProb.C(1)3.0000911.1247472.6673480.0257C(2)0.5000910.1179064.241

4550.0022R-squared0.666542Meandependentvar7.500909样本1:CoefficientStd.Errort-StatisticProb.C(1)3.0009091.1253022.6667580.0258C(2)0.5000000.1179

644.2385900.0022R-squared0.666242Meandependentvar7.500909样本2:Y2=C(1)+C(2)*X2Y1=C(1)+C(2)*X1CoefficientStd.Errort-StatisticProb.C(1)3.0017271.1239

212.6707630.0256C(2)0.4999090.1178194.2430280.0022R-squared0.666707Meandependentvar7.500909样本3:Y3=C(1)+C(2)*X3样本4:Y4=C(1

)+C(2)*X4CoefficientStd.Errort-StatisticProb.C(1)3.0024551.1244812.6700800.0256C(2)0.4997270.1178784.2393720.0022R-squared0.666324Meandependent

var7.5000004681012246810121416X1Y1246810246810121416X2Y2468101214246810121416X3Y34681012145101520X4Y4最小二乘估计量的统计性质(BLUE性质)高斯—马尔科夫定理线性:无偏性:最小方差性:+

==iiiiukykˆ=)ˆ(E=)ˆ(E=22)ˆ(iuxVar=222)ˆ(iiuxnxVar−=iiykxn)1()最小方差性的几何解释参数估计量的两个特点斜率的方差与解释变量的关

系。截距的方差与样本容量的关系。参数估计量的抽样分布*假定4:扰动项服从正态分布(1)正态分布仅涉及两个参数。(2)正态分布的任意线性组合仍是正态分布。(3)中心极限定理作保证。))ˆ(,(~ˆVarN))ˆ(,(

~ˆVarN随机扰动项的估计随机扰动项方差估计量:通过可观测的变量估计2ˆ2222−−=−=nyxyniiiiu)结论:在正态性假定条件下,除了满足BLUE性质以外,截距和斜率的OLS估计量服从正态分布,随机

扰动项的方差服从Chi-平方分布。(3)检验回归参数的t检验检验:回归模型中是否存在线性关系?这种关系是显著的吗?0:0:10=HH)2(~)ˆ(ˆˆ)(ˆˆ−=−=ntVVT)经验规律在实际应用中,显著水平通常取5%,在t分布表中,当样本观察值的个数大于1

5时,t临界值大体保持在2左右。由此我们得到一个十分简便的检验方法,t绝对值大于2时,我们就可以得出系数是统计显著的结论。但是,如果t值接近2,这种经验判断的方法就不准确。回归方程的显著性检验和拟合优度(1)总离差平方和的分解:TSS=RSS+ESS(2)拟合优度(样本决定

系数):(3)回归方程的显著性检验:F检验的基本思想F检验的思路1无约束条件下的残差平方和2有约束条件下的残差平方和3统计量:相对约束成本回归方程的显著性检验:检验连等式思想:检验所有解释变量对被解释变量影响的显著性因此,F检

验实际上针对的是多元回归问题。联合假设0:210====kHkjHj,2,1,0:1=不全为F统计量)1,(~)1/(/−−−−=knkFknTSSkRSSFF值与判定系数之间的关系kkn

RkknRRF111111222−−−=−−−=方差分析表离差名称平方和自由度均方差F值回归(解释变量)剩余(随机因素)总计(4)一元线性回归方程应用:截面数据数据来源:2000年中国各地区消费和收入数据Eviews//example1计算与

分析:EVIEWS一元线性回归方程应用:时间序列检验模型的结构稳定性:Chow检验步骤1:全部样本进行回归。步骤2:不同时期样本回归。步骤3:构造统计量。步骤4:假设检验。)2/(/2145knnSkSF−+=计算结果:SAVE=C(1)+C(2)*INCOMECoefficientStd.

Errort-StatisticProb.C(1)-1.0820710.145151-7.4548200.0000C(2)0.1178450.00877413.431640.0000R-squared0.918537Sumsquaredresid0.572226总样

本(46-63)CoefficientStd.Errort-StatisticProb.C(1)-1.7501720.357560-4.8947690.0018C(2)0.1504500.0175458.5749060.0001R-square

d0.913075Sumsquaredresid0.193121样本2(55-63)CoefficientStd.Errort-StatisticProb.C(1)-0.2662490.305353-0.8719400.4121C(2)0.0470280.02

65691.7700530.1200R-squared0.309194Sumsquaredresid0.139650样本1(46-54)统计量与假设检验04.5)2/(/2145=−+=knnSkSF假设检验:两时期没有结构性变化74.3%

,514,2==F问题的延伸就题论题:重建时期的检验合法吗?8101214160.00.10.20.30.40.50.6SAVEINCOME510152025300.00.51.01.52.02.5SAVEINCOME141618202224260.51.01.52.02.

5SAVEINCOME总样本重建后重建期方法论:结构变化缘于什么?实际分析:如何划分样本?判定系数探讨2R1.什么情况下为0?2.什么情况下可能为负?3.使用条件?)ˆ(ˆˆ222222==

=yxyyTSSESSRRSSESSTSS+=12无截距的回归3样本容量相同被解释变量相同解释变量相同解释变量形式可以不同戈德伯格“危言”回归线样本点极大似然估计的思想不同的统计总体会产生不同的样本,对

于某一特定的样本,在总体未知的情况下,它来自一些形式的母体的可能性要比来自另一母体的可能性大。简言之,是样本“替代”我们选择了“总体”。X5X8X1ABX概率设总体Y的概率密度函数形式已知,),(yf,含有参数。则总体Y的样本nYYY21,的联合概率密度为=niiyf1);(,我

们称其为似然函数:),/(21nyyyLL===niiyf1);(似然函数的概念极大似然估计设总体Y含有未知参数,并且总体分布的形式已知,nyyy,,21为Y的一组观察值。若存在的一个估计值ˆ,使得似然函数)/

(2,1nyyyL在)=时,max)/(2,1=nyyyL则称ˆ使的一个极大似然估计值。计算时处理方法:通常采用似然函数的对数形式。极大似然估计一例随机变量的分布为:xe−=1nxxx21,为

一组观察值,求的极大似然估计。双变量回归模型的极大似然估计),(~2uxNy+在随机扰动项服从正态分布的条件下:2.3多元线性回归分析1.基本假定解释变量之间无线性相关。2.参数的最小二乘估计3.参数估

计量的统计性质线性无偏性方差—协方差和最小方差4.回归参数的显著性检验5.回归方程的显著性检验三变量线性回归分析新概念偏回归系数校正的判定系数复相关系数iiiiuXXY+++=33221校正的判定系数−=−=2221

1iiyTSSRSSR判定系数:校正的判定系数:TSSSS)1()1(1)1/()1/(12RknnnTSSknRSSR−−−−=−−−−=两者之间的关系:)1(1222RknkRR−−−−=偏相关系数与复相关系数相关分析与相关系数相关分析是讨论变量之间相关程度的一种统计分析方法。1.相关分析

中的变量都是随机变量。2.相关分析可以判断变量之间关联的密切程度。为回归分析寻找解释变量。3.相关分析的结果并不能表明变量之间因果关系。相关系数用以描述两个变量之间线性关系程度的数量指标。相关系数与回归系数之间的关系yxxyxy==−−−==22221

11yxyxnynxnyxSSSryxxyxySSrxyx==2ˆ相关系数与回归系数的数量关系:相关系数与判定系数之间的关系(双变量回归)2Rr=1.样本相关系数在计算上是一致的。2.判定系数是变量y与x作回归时,判

定回归方程与样本拟合程度好坏的一个数量指标。3.相关系数是对变量y与x作相关分析时,判定y与x之间线性关联程度的一个指标。偏相关(多元回归)21,xyxr一阶偏相关系数:321,xxyxr二阶偏相关系数:(k-1)阶偏相

关系数:kxxxyxr...,321偏相关与偏相关系数定义:两两关系偏相关系数的求法(三变量一例)复相关(多元回归)定义:(一对多关系)在多个变量中,其中一个变量与其他所有变量之间的相关关系2Rr=求解:多元回归一例:生产函数KLYlnlnln210++=原始模型:2

1KALY=估计模型:基本数据来源:《中国经济增长的可持续性》,王小鲁等,P63-64(注:数据经过作者的调整)年份GDP(亿元)资本(亿元)从业(万人)19803597.96837461871981377972474802

719824059.977704994919834473.784135154019845256.592395358519856058.6102985563819866531.6117145752819877104.61

32875938219887582149586128219897447.7163356270919907926.8176606390919918756.7190526516719929946.3207536624619931066

4.32282767376199411956.72530368507199513151.528199695561996145883187270770199715979.4358927188319981747140

51472611199918577.64531273347回归结果Sample:19801999Includedobservations:20LGDP=C(1)+C(2)*LLAB+C(3)*LCAPCoefficientStd.Errort-St

atisticProb.C(1)-3.8954413.344390-1.1647690.2602C(2)0.7343590.0935737.8479820.0000C(3)0.5231150.3834761.3

641400.1903R-squared0.990527Meandependentvar9.009615AdjustedR-squared0.989412S.D.dependentvar0.513611S.E.ofregr

ession0.052849Akaikeinfocriterion-2.905258Sumsquaredresid0.047482Schwarzcriterion-2.755898Loglikelihood32.05258Durbin-Wa

tsonstat0.551965LGDP=-3.895441136+0.7343587878*LLAB+0.5231148335*LCAP问题延伸DependentVariable:LGDPMethod:LeastSquaresSam

ple:19891999Includedobservations:11LGDP=C(1)+C(2)*LLAB+C(3)*LCAPCoefficientStd.Errort-StatisticProb.C

(1)-37.409625.432145-6.8867120.0001C(2)0.3212930.0871063.6885290.0061C(3)3.9098710.5665376.9013560.0001R-squared0.998373Meandependentva

r9.380837AdjustedR-squared0.997966S.D.dependentvar0.317341S.E.ofregression0.014311Akaikeinfocriterion-5.42853Sumsq

uaredresid0.001639Schwarzcriterion-5.32001Loglikelihood32.85695Durbin-Watsonstat2.451868Sample:19801989Includedobservations:10LGDP=C(1)

+C(2)*LLAB+C(3)*LCAPCoefficientStd.Errort-StatisticProb.C(1)-23.820097.993071-2.9800930.0205C(2)-0.1149600.346649-0.3316330.7499C(3)3.0701561.0217833

.0047050.0198R-squared0.978233Meandependentvar8.591876AdjustedR-squared0.972014S.D.dependentvar0.289248S.E.ofregression0.048389Akaikeinfocriterion

-2.975780Sumsquaredresid0.016390Schwarzcriterion-2.885004Loglikelihood17.87890Durbin-Watsonstat1.024699参数约束条件下的最小二乘估计KL

Ylnlnln210++=1..21=+tsLKLYlnln20+=kylnln20+=)ln(lnlnln20LKLY−+=−F检验:约束条件F统计量knRSSmRSSRSSFR−−=m线性约束的个数k无约束回归中的参数个数n观察值的

个数2.4非标准线性模型的标准化多项式函数模型双曲函数模型实例1:平均成本与产量实例2:菲利普斯曲线实例3:恩格尔支出曲线对数函数模型(1)双对数模型实例:弹性问题(2)对数—线性模型实例:增长率问题(3)线性—对数模型单方程

回归模型在预测方面的局限性税收总收入的多元回归方程TAXF=exp[1.5046+0.5998LNTAX(-1)+0.5264LGDP+0.2161SV+0.2479DV1]变量说明:TAXF税收预测值GDP国内生产总值TAX(-1

)滞后一期的税收收入SV季节虚拟变量DV1政策变量作业3:估计某个省份的生产函数1原始数据。2精练后的数据。3解释变量至少包括劳动、资本。4考虑如何将技术进步、人力资本或制度等因素引进回归方程?5输出回归结果以及检验结果。6对残差进行分析(残差分析图)。7对结果

作出合理的经济解释。

精品优选
精品优选
该用户很懒,什么也没有留下。
  • 文档 34925
  • 被下载 0
  • 被收藏 0
相关资源
广告代码123
若发现您的权益受到侵害,请立即联系客服,我们会尽快为您处理。侵权客服QQ:395972555 (支持时间:9:00-21:00) 公众号
Powered by 太赞文库
×
确认删除?