大家好,欢迎来到IT知识分享网。
谈谈自相关
第一节 什么是自相关
有时,进行简单回归后,检验结果中回归系数的标准误差非常小,t统计里量较大,同时可决系数也非常高,F统计量较大,表明模型异常的显著。但此估计结果可能是虚假的,t统计量和F统计量都被虚假地夸大,因此所得结果是不可信的,这就可能存在着自相关。
一、自相关的概念
二、自相关产生的原因
自相关关系主要存在于时间序列模型数据中,但是在横截面数据中,也可能会出现自相关,通常称为空间自相关。
三、自相关的表现形式
第二节 自相关的后果
一、一阶自回归形式的性质
表明,ut为一阶自回归形式的自相关时,随机扰动项ut依然满足零均值、同方差的假定。
因为现期的随机误差项vt并不影响回归模型中随机扰动项ut以前各期值ut-k(k>0),所以vt与ut-k不相关,即E(vtut-k)=0。可以推出:
以此类推,可得:
易知,这些自协方差均不为0,这正是存在自相关的含义。
二、自相关对参数估计的影响
因此,上式中左边括号的值通常大于1,如果仍用OSL法去计算B2估计的方差,将可能会低估存在自相关时参数估计值的真实方差。可以证明,当存在自相关时,普通最小二乘法估计量不再是最佳线性无偏估计量,即它在线性无偏估计量中不是方差最小的。
三、自相关对模型检验的影响
通过以上讨论可知,存在自相关问题时,如果忽视自相关问题,依旧用最小二乘法去估计参数及其方差,会低估真实的方差,更会低估参数估计值的方差。当参数估计值方差被低估时,其标准误差也被低估,从而过高估计t统计量的值,这就会夸大所估计参数得显著性,对本来重要的解释变量可能误认为重要而被保留。这时通常的回归系数显著性的t检验就失去了意义。
类似地,由于自相关的存在,参数得最小二乘估计量是无效的,使得F检验和R^2检验是不可靠的。
四、自相关对模型预测的影响
模型预测的精度取决于抽样误差和总体误差项的方差。抽样误差来自于参数的估计,在自相关情形下,参数的方差的最小二乘估计变得不可靠,由此必定会加大抽样误差。
同时,在自相关情形下,对随机扰动项方差的估计也会变得不可靠。由此,影响预测精度的两大因素都因自相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低了预测的精度。
第三节 自相关的检验
一、图示检验法
二、DW检验法
DW检验法是检验自相关的常用方法,DW检验法的前提条件如下:
(1)随机变量X为非随机的(这与后边滞后被解释变量相呼应)
(2)随机误差项为一阶自回归形式,即:ut=p*ut-1+vt(vt满足古典假定)
(3)线性模型的解释变量中不包含滞后的被解释变量(因为变量是非随机的),如不应该出现下列形式:Yt=B1+B2Xt+B3Yt-1+ut
(4)截距项不为零,即只适用于有常数项的回归模型。
(5)数据序列无缺失项
p的估计 | DW |
---|---|
-1 | 4 |
(-1,0) | (2,4) |
0 | 2 |
(0,1) | (0,2) |
1 | 0 |
DW值范围 | 自相关状态 |
---|---|
0=<DW<=dL | 误差项之间存在正自相关 |
dL<DW<=dU | 不能判定是否有自相关 |
dU<DW<4-dU | 误差项之间无自相关 |
4-dU=<DW<4-dL | 不能判定是否有自相关 |
4-dL=<DW<=4 | 误差项之间存在负相关 |
三、Breusch-Godfrey检验(LM检验)
该方法也称BG检验,思想主要是基于所分析模型普通最小二乘估计的残差对解释变量和一定数量滞后残差的辅助回归,如果滞后残差足以解释当前残差的编译,就拒绝误差项无自相关的原假设。
对于线性回归模型:
假设误差项ut服从正态分布,同时ut服从p阶自回归模型:
式子中,vt满足古典假定的误差项。
BG检验的原假设为H0:p1=p2=…=pp=0,即不存在自相关,检验的具体步骤如下:
(1)用OLS估计原模型式,并得到残差et
(2)然后用残差et对解释变量X及滞后残差et-i作辅助回归,即:
式中,样本容量为n,有效样本n-p。为避免由于et取滞后值而缺失有效样本,不影响LM统计量的渐进性,并使LM统计量性质更好,将样本数据X和残差et的n个样本以前的p期初始值预处理为0,辅助回归的实际样本容量为T=(n+p)-p=n.
(3)计算辅助回归的可决系数R方,并且构建统计量LM=T*R方,其中T为辅助回归实际样本容量,p为ut的自回归阶数。在大样本条件下,有
给定显著性水平,若TR方大于临界值,则拒绝原假设,式中至少有一个p在统计上显著不为0,说明存在自相关。反之,不存在自相关。
与DW检验不同,BG检验有一些特点:(1)BG检验不只限于一阶自相关,还适合于高阶自相关的检验;(2)适合检验模型的解释变量中有滞后被解释变量如Yt-1、Yt-2的情况;(3)BG检验的滞后长度p不能先验确定。实际检验中逐次向更高阶检验,并结合辅助回归中滞后项参数的显著性去帮助判断自相关的阶数。
第四节 自相关的补救
对于模型设定偏误造成的自相关,应该通过改变模型的设定去消除。对于设定正确的模型,如果随机误差项有自相关,则需采用广义差分法予于消除。
一、广义差分法
其中ut-put-1是满足古典假定的误差项(即无自相关),因此,该模型满足古典假定。
令:
对(6.30)进行普通最小二乘估计,可得到参数的最佳线性无偏估计量。因为最终模型中被解释变量与解释变量均为现期值减去前一期值的一部分,所以称为广义差分方程。如果随机误差项的自相关形式是AR§,即p阶自相关,则需使用p阶广义差分。
在进行广义差分时,由于解释变量X与被解释变量均以差分形式出现,因而样本容量减少1个,如果样本容量较大,减少一个观测值对估计影响不大。但是,如果样本容量较小,则会对估计影响较大。此时,可采用普莱斯-温斯滕变换,将第一个观测值分别变换为
补充到差分序列Yt*、Xt*中,在使用普通最小二乘估计法估计参数。
二、自相关系数p的确定
在实际应用中,自相关系数p往往是未知的,必须通过一定的方法去估计p。最简单的方法是依据DW统计量去估计p。p的估计=1-DW/2求得。
但是,这只是一个粗略的结果,这样得到的p的估计只是对p的精度不高的估计,根本原因在于对有自相关的回归模型使用了普通最小二乘法。为了得到p的更精确的估计值,可采用科克伦-奥克特迭代法或德宾两步法。
1、科克伦-奥克特迭代法
该方法的基本思想是通过逐步迭代去寻求更为满足的p的估计值,采用广义差分法,具体来说,该方法是利用残差et去估计未知的p。
对于一元线性回归模型,同样假定ut为一阶自回归形式。科克伦-奥克特迭代法估计p的步骤如下。
当不能确定p^(2)是否是p的最佳估计值时,继续迭代估计p的第三轮估计值p(3)估计。直到估计的p(k)与p(k-1)相差很小时,收敛并满足精度要求,或回归所得DW统计量说明已不存在自相关时为止。通常,经过迭代很快就能得到有较高精度的p的估计,做广义差分对自相关的修正效果也很好。
2、德宾两步法
第一步,将上式作为一个多元回归模型,使用普通最小二乘法估计其参数。把Yt-1的回归系数p的估计作为p的一个估计值,它是p的一个有偏、一致估计。
本文主要参考庞皓计量经济学第三版。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/130896.html