Regresja krokowa
Co to jest regresja krokowa?
Regresja krokowa to iteracyjna konstrukcja modelu regresji krok po kroku, która obejmuje wybór niezależnych zmiennych do wykorzystania w ostatecznym modelu. Obejmuje dodawanie lub usuwanie potencjalnych zmiennych objaśniających w kolejności i testowanie pod kątem istotności statystycznej po każdej iteracji.
Dostępność pakietów oprogramowania statystycznego umożliwia stopniową regresję, nawet w modelach z setkami zmiennych.
Kluczowe wnioski
- Regresja krokowa to metoda, która iteracyjnie bada znaczenie statystyczne każdej zmiennej niezależnej w modelu regresji liniowej.
- Podejście selekcji w przód zaczyna się od zera i dodaje każdą nową zmienną w sposób przyrostowy, testując istotność statystyczną.
- Metoda eliminacji wstecznej rozpoczyna się od pełnego modelu załadowanego kilkoma zmiennymi, a następnie usuwa jedną zmienną, aby sprawdzić jej znaczenie w stosunku do ogólnych wyników.
- Regresja krokowa ma jednak swoje wady, ponieważ jest to podejście, które dopasowuje dane do modelu w celu osiągnięcia pożądanego rezultatu.
Typy regresji krokowej
Podstawowym celem regresji krokowej jest, poprzez serię testów (np. Testy F, testy t ), znalezienie zestawu zmiennych niezależnych, które znacząco wpływają na zmienną zależną. Odbywa się to za pomocą komputerów w drodze iteracji, która jest procesem uzyskiwania wyników lub decyzji poprzez powtarzane rundy lub cykle analizy. Zaletą automatycznego przeprowadzania testów z pomocą pakietów oprogramowania statystycznego jest oszczędność czasu i ograniczenie błędów.
Regresję krokową można osiągnąć albo przez wypróbowanie jednej zmiennej niezależnej na raz i włączenie jej do modelu regresji, jeśli jest ona statystycznie istotna, lub przez uwzględnienie w modelu wszystkich potencjalnych zmiennych niezależnych i wyeliminowanie tych, które nie są istotne statystycznie. Niektórzy używają kombinacji obu metod i dlatego istnieją trzy podejścia do regresji krokowej:
- Selekcja w przód rozpoczyna się bez żadnych zmiennych w modelu, testuje każdą zmienną w miarę jej dodawania do modelu, a następnie zachowuje te, które są uznane za najbardziej istotne statystycznie – powtarzając proces do momentu uzyskania optymalnych wyników.
- Eliminacja wsteczna rozpoczyna się od zestawu niezależnych zmiennych, usuwając pojedynczo, a następnie testując, czy usunięta zmienna jest statystycznie istotna.
- Eliminacja dwukierunkowa to połączenie dwóch pierwszych metod, które sprawdzają, które zmienne należy uwzględnić, a które wykluczyć.
Przykład
Przykładem regresji krokowej z wykorzystaniem metody eliminacji wstecznej byłaby próba zrozumienia zużycia energii w fabryce przy użyciu takich zmiennych, jak czas pracy sprzętu, wiek sprzętu, wielkość personelu, temperatury na zewnątrz i pora roku. Model obejmuje wszystkie zmienne – następnie każdą z nich usuwa się pojedynczo, aby określić, która jest najmniej istotna statystycznie. W końcu model może pokazać, że pora roku i temperatury są najbardziej znaczące, co może sugerować, że szczytowe zużycie energii w fabryce występuje wtedy, gdy zużycie klimatyzatora jest największe.
Ograniczenia regresji krokowej
Analiza regresji, zarówno ceny do zysków i zwrotów z akcji na przestrzeni wielu lat, aby określić, czy akcje o niskich wskaźnikach P / E (zmienna niezależna) oferują wyższe zyski (zmienna zależna). Problem z tym podejściem polega na tym, że warunki rynkowe często się zmieniają, a relacje, które utrzymywały się w przeszłości, niekoniecznie muszą odnosić się do teraźniejszości lub przyszłości.
Tymczasem proces regresji krokowej ma wielu krytyków, a nawet są wezwania do całkowitego zaprzestania stosowania tej metody. Statystycy zauważają kilka wad tego podejścia, w tym nieprawidłowe wyniki, nieodłączną stronniczość samego procesu oraz konieczność posiadania znacznej mocy obliczeniowej w celu opracowania złożonych modeli regresji poprzez iterację.