Współczynnik inflacji wariancji (VIF) - KamilTaylan.blog
5 maja 2021 5:21

Współczynnik inflacji wariancji (VIF)

Co to jest czynnik inflacji wariancji (VIF)?

Współczynnik inflacji wariancji (VIF) jest miarą wielkości  współliniowości  w zbiorze  zmiennych regresji wielorakiej . Matematycznie VIF dla zmiennej modelu regresji jest równa stosunkowi całkowitej wariancji modelu   do wariancji modelu zawierającego tylko tę pojedynczą zmienną niezależną. Ten współczynnik jest obliczany dla każdej zmiennej niezależnej. Wysoka wartość VIF wskazuje, że powiązana zmienna niezależna jest wysoce współliniowa z innymi zmiennymi w modelu.

Kluczowe wnioski

  • Współczynnik inflacji wariancji (VIF) stanowi miarę współliniowości między zmiennymi niezależnymi w modelu regresji wielorakiej.
  • Wykrywanie współliniowości jest ważne, ponieważ podczas gdy wielokoliniowość nie zmniejsza mocy wyjaśniającej modelu, zmniejsza istotność statystyczną zmiennych niezależnych.
  • Duży współczynnik inflacji wariancji (VIF) zmiennej niezależnej wskazuje na wysoce współliniową zależność z innymi zmiennymi, które należy uwzględnić lub skorygować w strukturze modelu i doborze zmiennych niezależnych.

Zrozumienie współczynnika inflacji wariancji (VIF)

Czynnik inflacji wariancji jest narzędziem pomagającym określić stopień współliniowości. Regresja wielokrotna jest używana, gdy osoba chce przetestować wpływ wielu zmiennych na określony wynik. Zmienna zależna to wynik, na który oddziałują zmienne niezależne – dane wejściowe do modelu. Współliniowość występuje, gdy istnieje liniowa zależność lub korelacja między jedną lub większą liczbą niezależnych zmiennych lub danych wejściowych.

Współliniowość stwarza problem w regresji wielorakiej, ponieważ wszystkie dane wejściowe wpływają na siebie nawzajem. Dlatego w rzeczywistości nie są one niezależne i trudno jest sprawdzić, w jakim stopniu kombinacja zmiennych niezależnych wpływa na zmienną zależną lub wynik w modelu regresji. Pod względem statystycznym model regresji wielorakiej, w którym występuje duża współliniowość, utrudni oszacowanie związku między każdą zmienną niezależną a zmienną zależną. Niewielkie zmiany w użytych danych lub w strukturze równania modelu mogą powodować duże i nieregularne zmiany oszacowanych współczynników zmiennych niezależnych.

Aby upewnić się, że model jest poprawnie określony i działa poprawnie, istnieją testy, które można uruchomić pod kątem współliniowości. Jednym z takich narzędzi pomiarowych jest współczynnik wariancji inflacji. Korzystanie z wariancji czynników inflacji pomaga zidentyfikować powagę wszelkich problemów związanych z współliniowością, tak aby można było dostosować model. Czynnik inflacji wariancji mierzy, w jakim stopniu na zachowanie (wariancję) zmiennej niezależnej wpływa lub jest zawyżona jej interakcja / korelacja z innymi zmiennymi niezależnymi. Czynniki inflacyjne wariancji pozwalają szybko zmierzyć, w jakim stopniu zmienna przyczynia się do błędu standardowego w regresji. Gdy istnieją istotne kwestie związane z współliniowością, współczynnik wariancji inflacji będzie bardzo duży dla danych zmiennych. Po zidentyfikowaniu tych zmiennych można zastosować kilka podejść, aby wyeliminować lub połączyć zmienne współliniowe, rozwiązując problem współliniowości.

Uwagi specjalne

Współliniowość

Chociaż współliniowość nie zmniejsza ogólnej mocy predykcyjnej modelu, może generować oszacowania współczynników regresji, które nie są istotne statystycznie. W pewnym sensie można to traktować jako rodzaj podwójnego liczenia w modelu. Kiedy dwie lub więcej niezależnych zmiennych jest blisko spokrewnionych lub mierzy prawie to samo, wtedy podstawowy efekt, który mierzą, jest rozliczany dwukrotnie (lub więcej) dla zmiennych. Trudno lub niemożliwe staje się stwierdzenie, która zmienna rzeczywiście wpływa na zmienną niezależną. Jest to problem, ponieważ celem wielu modeli ekonometrycznych jest sprawdzenie dokładnie tego rodzaju statystycznej zależności między zmiennymi niezależnymi a zmienną zależną.

Załóżmy na przykład, że ekonomista chce sprawdzić, czy istnieje statystycznie istotna zależność między stopą bezrobocia (zmienna niezależna) a stopą inflacji (zmienna zależna). Włączenie dodatkowych zmiennych niezależnych związanych ze stopą bezrobocia, takich jak nowe początkowe bezrobocie, prawdopodobnie wprowadziłoby do modelu współliniowość. Ogólny model może wykazywać silną, statystycznie wystarczającą moc wyjaśniającą, ale nie może być w stanie określić, czy efekt jest głównie spowodowany stopą bezrobocia, czy nowymi początkowymi bezrobotnymi. To właśnie wykryłby VIF i sugerowałoby to ewentualnie usunięcie jednej ze zmiennych z modelu lub znalezienie sposobu na ich skonsolidowanie w celu uchwycenia ich wspólnego efektu w zależności od tego, jaką konkretną hipotezę badacz jest zainteresowany przetestowaniem.