多重共线性如何处理

如题所述

首先对所有变量进行标准化处理。

(1) 相关系数。通过做自变量间的散点图观察或者计算相关系数判断,看是否有一些自变量间的相关系数很高。一般来说,2个自变量的相关系数超过0.9,对模型的影响很大,将会出现共线性引起的问题。这只能做初步的判断,并不全面。

(2) 容忍度。以每个自变量作为因变量对其他自变量进行回归分析时得到的残差比例,大小用1减去决定系数来表示。该指标值越小,则说明被其他自变量预测的精度越高,共线性可能越严重。

(3) 方差膨胀因子(VIF)。方差膨胀因子是容忍度的倒数,VIF越大,显示共线性越严重。VIF>10时,提示有严重的多重共线性存在。

(4) 特征根。实际上是对自变量进行主成分分析,如果特征根为0,则提示有严重的共线性。

(5) 条件指数。当某些维度的该指标大于30时,则提示存在共线性。

扩展资料:

自变量筛选常用方法:

(1) 前进法。事先定一个选人自变量的标准。开始时,方程中只含常数项,按自变量对y的贡献大小由大到小依次选入方程。

每选入一个自变量,则要重新计算方程外各自变量(剔除已选人变量的影响后) 对y的贡献,直到方程外变量均达不到选入标准为止。变量一旦进人模型,就不会被剔除。

(2) 后退法。事先定一个剔除自变量的标准。开始时,方程中包含全部自变量,按自变量y对的贡献大小由小到大依次剔除。

每剔除一个变量,则重新计算未被剔除的各变量对y的贡献大小,直到方程中所有变量均不符合剔除标准,没有变量可被剔除为止。自变量一旦被剔除,则不考虑进入模型。

(3) 逐步回归法。本法区别于前进法的根本之处是每引人一个自变量,都会对已在方程中的变量进行检验,对符合剔除标准的变量要逐一剔除。

温馨提示:答案为网友推荐,仅供参考
相似回答