Podstawy regresji w analizie biznesowej - KamilTaylan.blog
5 maja 2021 1:56

Podstawy regresji w analizie biznesowej

Jeśli kiedykolwiek zastanawiałeś się, w jaki sposób dwie lub więcej części danych są ze sobą powiązane (np. Jak na PKB wpływają zmiany bezrobocia i inflacji) lub jeśli kiedykolwiek szef poprosił Cię o utworzenie prognozy lub przeanalizowanie prognoz na podstawie na relacjach między zmiennymi, wtedy nauka analizy regresji byłaby warta twojego czasu.

W tym artykule poznasz podstawy prostej regresji liniowej, czasami nazywanej „zwykłą metodą najmniejszych kwadratów” lub regresją OLS – narzędzia powszechnie używanego w prognozowaniu i analizie finansowej. Zaczniemy od poznania podstawowych zasad regresji, najpierw poznając kowariancję i korelację, a następnie przejdziemy do tworzenia i interpretowania wyników regresji. Popularne oprogramowanie biznesowe, takie jak Microsoft Excel, może wykonać wszystkie obliczenia regresji i dane wyjściowe za Ciebie, ale nadal ważne jest, aby nauczyć się podstawowych mechanizmów.

kluczowe wnioski

  • Prosta regresja liniowa jest powszechnie stosowana w prognozowaniu i analizie finansowej – na przykład w przypadku przedsiębiorstwa, aby stwierdzić, jak zmiana PKB może wpłynąć na sprzedaż.
  • Microsoft Excel i inne oprogramowanie mogą wykonać wszystkie obliczenia, ale dobrze jest wiedzieć, jak działa mechanika prostej regresji liniowej.

Zmienne

Sercem modelu regresji jest związek między dwiema różnymi zmiennymi, zwanymi zmiennymi zależnymi i niezależnymi. Załóżmy na przykład, że chcesz prognozować sprzedaż dla swojej firmy i doszedłeś do wniosku, że sprzedaż Twojej firmy rośnie lub maleje w zależności od zmian PKB.

Prognozowana sprzedaż byłaby zmienną zależną, ponieważ ich wartość „zależy” od wartości PKB, a PKB byłby zmienną niezależną. Następnie, aby prognozować sprzedaż, należałoby określić siłę związku między tymi dwiema zmiennymi. Jeśli PKB wzrośnie / spadnie o 1%, o ile wzrośnie lub spadnie Twoja sprzedaż?

Kowariancja

Wzór na obliczenie związku między dwiema zmiennymi nazywa się kowariancją. To obliczenie pokazuje kierunek relacji. Jeśli jedna zmienna rośnie, a druga również ma tendencję do wzrostu, kowariancja byłaby dodatnia. Jeśli jedna zmienna rośnie, a druga maleje, kowariancja będzie ujemna.

Rzeczywista liczba otrzymana z obliczeń może być trudna do zinterpretowania, ponieważ nie jest znormalizowana. Na przykład kowariancja pięciu może być interpretowana jako pozytywny związek, ale siłę tego związku można tylko powiedzieć, że jest silniejsza niż w przypadku liczby cztery lub słabszej niż w przypadku liczby sześć.

Współczynnik korelacji

doorrmilzatjaon=ρxy=doovxysxsy\ begin {aligned} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {aligned}WcześniejszeCorrelation=ρxyWcześniejsze=sxWcześniejszesyWcześniejsze

Musimy ustandaryzować kowariancję, aby umożliwić lepszą interpretację i wykorzystanie jej w prognozowaniu, a wynikiem jest obliczenie korelacji. Obliczenie korelacji po prostu bierze kowariancję i dzieli ją przez iloczyn odchylenia standardowego dwóch zmiennych. Spowoduje to powiązanie korelacji między wartością od -1 do +1.

Korelację +1 można zinterpretować jako sugestię, że obie zmienne poruszają się ze sobą idealnie pozytywnie, a -1 oznacza, że ​​są one doskonale ujemnie skorelowane. W naszym poprzednim przykładzie, jeśli korelacja wynosi +1, a PKB wzrośnie o 1%, sprzedaż wzrośnie o 1%. Jeśli korelacja wynosi -1, wzrost PKB o 1% spowodowałby spadek sprzedaży o 1% – dokładnie odwrotnie.

Równanie regresji

Teraz, gdy wiemy, jak obliczana jest relacja względna między dwiema zmiennymi, możemy opracować równanie regresji, aby przewidzieć lub przewidzieć pożądaną zmienną. Poniżej znajduje się wzór na prostą regresję liniową. „Y” to wartość, którą próbujemy prognozować, „b” to nachylenie linii regresji, „x” jest wartością naszej niezależnej wartości, a „a” reprezentuje punkt przecięcia z osią y. Równanie regresji po prostu opisuje związek między zmienną zależną (y) a zmienną niezależną (x).

Punkt przecięcia z osią lub „a” jest wartością y (zmienna zależna), jeśli wartość x (zmienna niezależna) wynosi zero, dlatego czasami jest po prostu nazywana „stałą”. Więc gdyby nie było zmian w PKB, Twoja firma nadal osiągałaby pewną sprzedaż. Ta wartość, gdy zmiana PKB wynosi zero, jest punktem przecięcia. Spójrz na poniższy wykres, aby zobaczyć graficzne przedstawienie równania regresji. Na tym wykresie jest tylko pięć punktów danych reprezentowanych przez pięć kropek na wykresie. Regresja liniowa próbuje oszacować linię, która najlepiej pasuje do danych ( linia o najlepszym dopasowaniu ), a równanie tej linii daje w wyniku równanie regresji.

Regresje w Excelu

Teraz, gdy rozumiesz już część kontekstu analizy regresji, zróbmy prosty przykład przy użyciu narzędzi regresji programu Excel. Będziemy się opierać na poprzednim przykładzie, próbując prognozować przyszłoroczną sprzedaż na podstawie zmian PKB. W następnej tabeli wymieniono niektóre sztuczne punkty danych, ale liczby te mogą być łatwo dostępne w prawdziwym życiu.

Wystarczy spojrzeć na tabelę, aby zobaczyć, że będzie dodatnia korelacja między sprzedażą a PKB. Oba zwykle idą w górę razem. Korzystając z programu Excel, wystarczy kliknąć menu rozwijane Narzędzia, wybrać opcję Analiza danych,  a następnie wybrać opcję Regresja. Stamtąd można łatwo wypełnić wyskakujące okienko; Twój Zakres wejściowy Y to kolumna „Sprzedaż”, a zakres wejściowy X to zmiana w kolumnie PKB; wybierz zakres wyjściowy, dla którego chcesz, aby dane pojawiały się w arkuszu kalkulacyjnym i naciśnij OK. Powinieneś zobaczyć coś podobnego do tego, co podano w poniższej tabeli:

                                            Współczynniki statystyk regresji

Interpretacja

Główne wyniki, o które należy się martwić w przypadku prostej regresji liniowej, to R-kwadrat, punkt przecięcia z osią (stała) i współczynnik beta (b) PKB. Liczba R-kwadrat w tym przykładzie wynosi 68,7%. Pokazuje to, jak dobrze nasz model przewiduje lub prognozuje przyszłą sprzedaż, sugerując, że zmienne objaśniające w modelu przewidywały 68,7% zmienności zmiennej zależnej. Następnie mamy punkt przecięcia z osią 34,58, który mówi nam, że gdyby prognozowano zerową zmianę PKB, nasza sprzedaż wyniosłaby około 35 jednostek. I wreszcie, współczynnik beta PKB lub współczynnik korelacji 88,15 mówi nam, że jeśli PKB wzrośnie o 1%, sprzedaż prawdopodobnie wzrośnie o około 88 jednostek.

Podsumowanie

Jak więc wykorzystałbyś ten prosty model w swojej firmie? Cóż, jeśli twoje badania prowadzą do przekonania, że ​​następna zmiana PKB będzie miała określony procent, możesz podłączyć ten procent do modelu i wygenerować prognozę sprzedaży. Może to pomóc w opracowaniu bardziej obiektywnego planu i budżetu na nadchodzący rok.

Oczywiście jest to tylko prosta regresja i istnieją wielokrotnymi regresjami liniowymi. Jednak wielokrotne regresje liniowe są bardziej skomplikowane i wiążą się z kilkoma problemami, które wymagają omówienia w innym artykule.