Linia najlepszego dopasowania
Jaka jest linia najlepszego dopasowania
Linia najlepszego dopasowania odnosi się do linii przechodzącej przez wykres punktowy punktów danych, która najlepiej wyraża związek między tymi punktami. Statystycy zazwyczaj używają metody najmniejszych kwadratów, aby uzyskać równanie geometryczne dla prostej, korzystając z ręcznych obliczeń lub oprogramowania do analizy regresji. Linia prosta będzie wynikiem prostej analizy regresji liniowej dwóch lub więcej zmiennych niezależnych. Regresja obejmująca wiele powiązanych zmiennych może w niektórych przypadkach doprowadzić do powstania krzywej linii.
Podstawy linii najlepszego dopasowania
Linia najlepszego dopasowania jest jednym z najważniejszych wyników analizy regresji. Regresja odnosi się do ilościowej miary związku między jedną lub większą liczbą zmiennych niezależnych a wynikową zmienną zależną. Regresja jest przydatna dla profesjonalistów z wielu dziedzin, od nauki i usług publicznych po analizę finansową.
Aby przeprowadzić analizę regresji, statystyk zbiera zestaw punktów danych, z których każdy zawiera pełny zestaw zmiennych zależnych i niezależnych. Na przykład zmienną zależną może być cena akcji firmy, a zmiennymi niezależnymi mogą być indeks Standard and Poor’s 500 oraz krajowa stopa bezrobocia, przy założeniu, że akcje nie są wymienione w indeksie S&P 500. Zbiór próbek może być każdym z nich trzy zbiory danych z ostatnich 20 lat.
Na wykresie te punkty danych pojawią się jako wykres punktowy, zbiór punktów, które mogą, ale nie muszą, wyglądać na zorganizowane wzdłuż dowolnej linii. Jeśli widoczny jest wzór liniowy, można narysować linię najlepszego dopasowania, która minimalizuje odległość tych punktów od tej linii. Jeśli żadna oś organizująca nie jest widoczna wizualnie, analiza regresji może wygenerować linię w oparciu o metodę najmniejszych kwadratów. Ta metoda tworzy linię, która minimalizuje kwadratową odległość każdego punktu od linii najlepszego dopasowania.
Aby określić wzór dla tej linii, statystyk wprowadza te trzy wyniki z ostatnich 20 lat do aplikacji oprogramowania do regresji. Oprogramowanie tworzy liniową formułę, która wyraża związek przyczynowy między indeksem S&P 500, stopą bezrobocia i ceną akcji danej firmy. To równanie jest wzorem dla linii najlepszego dopasowania. Jest to narzędzie predykcyjne, zapewniające analitykom i handlowcom mechanizm prognozowania przyszłej ceny akcji firmy na podstawie tych dwóch niezależnych zmiennych.
Linia równania najlepszego dopasowania i jej składniki
Regresja z dwiema zmiennymi niezależnymi, takimi jak omówiony powyżej przykład, da formułę o następującej podstawowej strukturze:
y = c + b 1 (x 1 ) + b 2 (x 2 )
W tym równaniu y jest zmienną zależną, c jest stałą, b 1 jest pierwszym współczynnikiem regresji, a x 1 jest pierwszą zmienną niezależną. Drugi współczynnik i druga zmienna niezależna to b 2 i x 2. Opierając się na powyższym przykładzie, cena akcji wyniosłaby y, indeks S&P 500 wynosiłby x 1, a stopa bezrobocia wyniosłaby x 2. Współczynnik każdej zmiennej niezależnej reprezentuje stopień zmiany y dla każdej dodatkowej jednostki tej zmiennej. Jeśli S&P 500 wzrośnie o jeden, wynikająca z tego cena y lub akcji wzrośnie o wartość współczynnika. To samo dotyczy drugiej zmiennej niezależnej, stopy bezrobocia. W prostej regresji z jedną zmienną niezależną współczynnik ten jest nachyleniem linii najlepszego dopasowania. W tym przykładzie lub dowolnej regresji z dwiema niezależnymi zmiennymi nachylenie jest połączeniem dwóch współczynników. Stała c jest punktem przecięcia z osią y linii najlepszego dopasowania.
Kluczowe wnioski
- Linia najlepszego dopasowania służy do wyrażania relacji na wykresie punktowym różnych punktów danych.
- Jest to wynik analizy regresji i może być używany jako narzędzie przewidywania wskaźników i ruchów cen.