然而很多时候,被筛选的特征在模型上线的预测效果并不理想,究其原因可能是由于特征筛选的偏差. 但还有一个显著的因素,就是选取特征之间之间可能存在高度的多重共线性,导致模型对测试集预测能力不佳. 为了在筛选特征之初就避免陷入这样的误区.介绍一种VIF(方差膨胀检验)方法,来对特征之间的线性相关关系进行检验,从而选取到独立性更好的特征,增强模型的解释能力. 1.可决系数R^2 1.1什么是可决系数 可决系数,亦称测定系数.决定系数.可决指数. 与复相关系数类似的,表示一个随机变量与多个随机变量关系的数…