上QQ阅读APP看书,第一时间看更新
2.1.6 残差分析
根据线性回归模型的经典假设条件,我们可以看到对残差的分析十分重要。对于残差-因变量估计的散点图来说,其可能存在的情况如图2-15所示。
1)从左上图的分布可以看到,残差在0两边随机分布,属于正常情况。
2)右上图中横轴X值增大,残差大小呈现明显的变化趋势。就该图而言,和存在非线性关系(读者可以思考一下在什么情况下,残差会出现这种趋势)。
3)左下图中,残差的方差随着横轴的值增大而增大,这种情况称为异方差,是线性回归模型中较常见的情况。其他情况包括方差逐步减小,或者先减小后增大等。
4)右下图中,随着X值的增加,残差呈周期变化,这种情况称为残差自相关。要检验是否存在残差自相关,我们可以使用Durbin-Watson检验(DW检验)。其原假设为:前后扰动项不存在相关性。当扰动项完全不相关时,DW值为2;当扰动项完全正相关时,DW值为0;当扰动项完全负相关时,DW值为4。我们希望DW值越接近2越好。
图2-15 残差分布的几种情况
针对残差不正常的情况,我们可以采用不同的处理方法。
1)X和Y为非线性关系:加入X的高阶形式,一般加X2已经足够。
2)异方差:横截面数据经常表现出异方差现象(本章案例就是),修正的方法有很多,比如加权最小二乘法、稳健回归,但是最简单的方法是对Y取自然对数。
3)自相关:分析时间序列和空间数据时经常遇到这种情况,复杂的处理方法是使用时间序列或空间计量方法分析,简单的处理方法是加入Y的一阶滞后项进行回归。横截面数据很少会有残差自相关的情况。