En annan metod för att identifiera multikollinearitet är variansinflationsfaktorn. VIF anger hur stor andel av variansen som är inflaterad för varje variabels koefficient. Med utgångspunkt i värdet 1 (ingen kollinearitet) indikerar en VIF mellan 1-5 måttlig kollinearitet medan värden över 5 indikerar hög kollinearitet. Några fall där hög VIF skulle vara acceptabel är interaktionstermer, polynomtermer eller dummyvariabler (nominella variabler med tre eller fler kategorier). Korrelationsmatriser gör det möjligt att identifiera korrelation mellan variabelpar medan VIF gör det möjligt att göra en övergripande bedömning av multikollinearitet. Korrelationsmatrisen för de flesta av de kontinuerliga variablerna presenteras nedan för att belysa de olika kollinjära variabelparen. VIF kan beräknas med hjälp av paketet statsmodels; i kodblocket nedan visas VIF-värdena med kollinjära variabler inkluderade (till vänster) och borttagna (till höger).
# Setting the predictor variables
X_o = df_wdummy]
X_r1 = df_wdummy]#
from statsmodels.stats.outliers_influence import variance_inflation_factorvif = pd.Series()], index=X_o.columns,
name='vif_full')
vif_r = pd.Series()], index=X_r1.columns,
name='vif_collinear_rvmd')
pd.concat(, axis=1)