Wielokrotna regresja liniowa (MLR) - KamilTaylan.blog
4 maja 2021 23:37

Wielokrotna regresja liniowa (MLR)

Co to jest regresja wielokrotna liniowa (MLR)?

Wielokrotna regresja liniowa (MLR), znana również po prostu jako regresja wielokrotna, jest techniką statystyczną, która wykorzystuje kilka zmiennych objaśniających do przewidywania wyniku zmiennej odpowiedzi. Celem wielokrotnej regresji liniowej (MLR) jest modelowanie liniowej zależności między zmiennymi objaśniającymi (niezależnymi) a zmienną odpowiedzi (zależną).

W istocie, regresja wielokrotna jest rozszerzenie zwykłych najmniejszych kwadratów (OLS) regresja ponieważ wymaga więcej niż jedną zmienną objaśniającą.

Kluczowe wnioski

  • Wielokrotna regresja liniowa (MLR), znana również po prostu jako regresja wielokrotna, jest techniką statystyczną, która wykorzystuje kilka zmiennych objaśniających do przewidywania wyniku zmiennej odpowiedzi.
  • Regresja wieloraka to rozszerzenie regresji liniowej (OLS), które wykorzystuje tylko jedną zmienną objaśniającą.
  • MLR jest szeroko stosowany w ekonometrii i wnioskach finansowych.

Wzór i obliczanie wielokrotnej regresji liniowej

Co może powiedzieć wielokrotna regresja liniowa

Prosta regresja liniowa to funkcja, która umożliwia analitykowi lub statystykowi prognozowanie jednej zmiennej na podstawie informacji o innej zmiennej. Regresja liniowa może być używana tylko wtedy, gdy jedna ma dwie zmienne ciągłe – zmienną niezależną i zmienną zależną. Zmienna niezależna to parametr używany do obliczania zmiennej zależnej lub wyniku. Model regresji wielorakiej obejmuje kilka zmiennych objaśniających.

Model regresji wielorakiej opiera się na następujących założeniach:

Współczynnik determinacji (R-kwadrat) jest metryka statystyczny, który jest używany do mierzenia ile zmienności w wynikach mogą być wyjaśnione przez różnice w zmiennych niezależnych. R 2 zawsze zwiększa się więcej predykcyjne dodaje się do modelu MLR, chociaż predykcyjne nie mogą być związane ze zmiennej wynik.

SamR2 nie może zatem służyć do określenia, które predyktory powinny zostać uwzględnione w modelu, a które należy wykluczyć. R2 może mieścić się tylko w przedziale od 0 do 1, gdzie 0 oznacza, że ​​wyniku nie można przewidzieć na podstawie żadnej ze zmiennych niezależnych, a 1 oznacza, że ​​wyniku można przewidzieć bez błędów na podstawie zmiennych niezależnych.

Podczas interpretacji wyników regresji wielorakiej współczynniki beta są ważne, podczas gdy wszystkie inne zmienne są stałe („wszystko inne równe”). Wynik regresji wielokrotnej można wyświetlić poziomo jako równanie lub pionowo w formie tabeli.

Przykład użycia wielokrotnej regresji liniowej

Na przykład analityk może chcieć wiedzieć, jak ruchy na rynku wpływają na cenę ExxonMobil (XOM). W takim przypadku ich równanie liniowe będzie miało wartość indeksu S&P 500 jako zmienną niezależną lub predyktorem, a cenę XOM jako zmienną zależną.

W rzeczywistości istnieje wiele czynników, które przewidują wynik zdarzenia. Na przykład ruch cenowy ExxonMobil zależy nie tylko od wyników całego rynku. Inne predyktory, takie jak cena ropy, stopy procentowe i zmiany cen kontraktów terminowych na ropę, mogą wpływać na cenę XOM i ceny akcji innych spółek naftowych. Aby zrozumieć związek, w którym obecne są więcej niż dwie zmienne, stosuje się wielokrotną regresję liniową.

Wielokrotna regresja liniowa (MLR) służy do określenia matematycznej zależności między wieloma zmiennymi losowymi. Innymi słowy, MLR bada, w jaki sposób wiele zmiennych niezależnych jest powiązanych z jedną zmienną zależną. Po określeniu każdego z niezależnych czynników do przewidywania zmiennej zależnej, informacje o wielu zmiennych można wykorzystać do stworzenia dokładnej prognozy poziomu wpływu, jaki wywierają na zmienną wynikową. Model tworzy zależność w postaci linii prostej (liniowej), która najlepiej przybliża wszystkie poszczególne punkty danych.

Nawiązując do powyższego równania MLR, w naszym przykładzie:

  • y i = zmienna zależna – cena XOM
  • x i1 = stopy procentowe
  • x i2 = cena ropy
  • x i3 = wartość indeksu S&P 500
  • x i4 = cena kontraktów terminowych na ropę
  • B 0 = punkt przecięcia z osią y w czasie zero
  • B 1 = współczynnik regresji, który mierzy jednostkową zmianę zmiennej zależnej, gdy zmienia się x i1 – zmiana ceny XOM, gdy zmieniają się stopy procentowe
  • B 2 = wartość współczynnika, który mierzy jednostkową zmianę zmiennej zależnej, gdy zmienia się x i2 – zmiana ceny XOM, gdy zmieniają się ceny ropy

Oszacowania metodą najmniejszych kwadratów, B 0, B 1, B 2 … B p, są zwykle obliczane przez oprogramowanie statystyczne. Tyle zmiennych można włączyć do modelu regresji, w którym każda zmienna niezależna jest zróżnicowana liczbą — 1, 2, 3, 4… p. Model regresji wielorakiej pozwala analitykowi przewidzieć wynik na podstawie informacji dostarczonych na temat wielu zmiennych objaśniających.

Mimo to model nie zawsze jest idealnie dokładny, ponieważ każdy punkt danych może nieznacznie różnić się od wyniku przewidywanego przez model. Wartość rezydualna E, która jest różnicą między wynikiem rzeczywistym a wynikiem przewidywanym, jest uwzględniona w modelu w celu uwzględnienia takich niewielkich odchyleń.

Zakładając, że uruchomimy nasz model regresji cen XOM za pomocą oprogramowania do obliczeń statystycznych, które zwraca następujące dane wyjściowe:

Analityk zinterpretowałby ten wynik w taki sposób, że jeśli inne zmienne zostaną utrzymane na stałym poziomie, cena XOM wzrośnie o 7,8%, jeśli cena ropy naftowej na rynkach wzrośnie o 1%. Model pokazuje również, że cena XOM spadnie o 1,5% po wzroście stóp procentowych o 1%. R 2 wskazuje, że 86,5% wahań kursu akcji Exxon Mobil można wyjaśnić zmianami stopy procentowej, cen ropy naftowej, kontraktów terminowych na ropę oraz indeksu S&P 500.

Różnica między regresją liniową a wielokrotną

Regresja zwykłych liniowych kwadratów (OLS) porównuje odpowiedź zmiennej zależnej przy zmianie niektórych zmiennych objaśniających. Jednak rzadko zdarza się, że zmienną zależną wyjaśnia tylko jedna zmienna. W tym przypadku analityk stosuje regresję wielokrotną, która próbuje wyjaśnić zmienną zależną za pomocą więcej niż jednej zmiennej niezależnej. Regresje wielokrotne mogą być liniowe i nieliniowe.

Regresje wielokrotne opierają się na założeniu, że istnieje liniowa zależność między zmiennymi zależnymi i niezależnymi. Zakłada również brak większej korelacji między zmiennymi niezależnymi.

Często Zadawane Pytania

Co sprawia, że ​​regresja wielokrotna jest „wielokrotna”?

Regresja wielokrotna uwzględnia wpływ więcej niż jednej zmiennej objaśniającej na pewien wynik będący przedmiotem zainteresowania. Ocenia względny wpływ tych objaśniających lub niezależnych zmiennych na zmienną zależną, gdy wszystkie inne zmienne są utrzymywane w stałej modelu.

Dlaczego miałoby się stosować regresję wielokrotną zamiast prostej regresji OLS?

Rzadko kiedy zmienną zależną można wyjaśnić tylko jedną zmienną. W takich przypadkach analityk stosuje regresję wielokrotną, która próbuje wyjaśnić zmienną zależną za pomocą więcej niż jednej zmiennej niezależnej. Model zakłada jednak, że nie ma większych korelacji między zmiennymi niezależnymi.

Czy mogę ręcznie wykonać regresję wielokrotną?

Prawdopodobnie nie. Modele regresji wielorakiej są złożone i stają się jeszcze bardziej złożone, gdy w modelu jest więcej zmiennych lub gdy rośnie ilość danych do analizy. Aby przeprowadzić regresję wielokrotną, prawdopodobnie będziesz musiał użyć specjalistycznego oprogramowania statystycznego lub funkcji w programach biznesowych, takich jak Excel.

Co to znaczy, że regresja wielokrotna jest „liniowa”?

W przypadku wielokrotnej regresji liniowej model oblicza linię najlepszego dopasowania, która minimalizuje wariancje każdej z uwzględnionych zmiennych w odniesieniu do zmiennej zależnej. Ponieważ pasuje do linii, jest to model liniowy. Istnieją również modele regresji nieliniowej obejmujące wiele zmiennych, takie jak regresja logistyczna, regresja kwadratowa i modele probitowe.

W jaki sposób modele regresji wielorakiej są wykorzystywane w finansach?

Każdy model ekonometryczny uwzględniający więcej niż jedną zmienną może być regresją wielokrotną. Na przykład modele czynnikowe porównują dwa lub więcej czynników, aby przeanalizować relacje między zmiennymi a wynikową wydajnością. Fama i francuski Trzy-Factor Mod jest taki model, który rozszerza się na tym modelu wyceny aktywów kapitałowych (CAPM) przez dodanie czynników ryzyka, wielkości i ryzyka wartość współczynnika ryzyka rynkowego w CAPM (która sama w sobie jest model regresji). Uwzględniając te dwa dodatkowe czynniki, model dostosowuje się do tej przewyższającej wyniki tendencji, co, jak się uważa, czyni go lepszym narzędziem do oceny wydajności menedżera.