Definiowanie regresji nieliniowej
Regresja nieliniowa to forma analizy regresji, w której dane są dopasowywane do modelu, a następnie wyrażane w postaci funkcji matematycznej. Prosta regresja liniowa wiąże dwie zmienne (X i Y) linią prostą (y = mx + b), podczas gdy regresja nieliniowa wiąże dwie zmienne w nieliniowej (zakrzywionej) relacji.
Celem modelu jest maksymalne zmniejszenie sumy kwadratów. Suma kwadratów to miara, która śledzi, jak daleko obserwacje Y różnią się od funkcji nieliniowej (zakrzywionej) używanej do przewidywania Y.
Oblicza się go, najpierw znajdując różnicę między dopasowaną funkcją nieliniową a każdym punktem Y danych w zbiorze. Następnie każda z tych różnic jest podnoszona do kwadratu. Na koniec wszystkie kwadraty są sumowane. Im mniejsza suma tych kwadratów liczb, tym lepiej funkcja dopasowuje się do punktów danych w zestawie. Regresja nieliniowa wykorzystuje funkcje logarytmiczne, trygonometryczne, wykładnicze, potęgowe, krzywe Lorenza, funkcje Gaussa i inne metody dopasowania.
Kluczowe wnioski
- Zarówno regresja liniowa, jak i nieliniowa przewidują odpowiedzi Y ze zmiennej (lub zmiennych) X.
- Regresja nieliniowa to zakrzywiona funkcja zmiennej X (lub zmiennych), która jest używana do przewidywania zmiennej Y.
- Regresja nieliniowa może przewidywać wzrost liczby ludności w czasie.
Modelowanie regresji nieliniowej jest podobne do modelowania regresji liniowej, ponieważ oba starają się śledzić określoną odpowiedź na podstawie zestawu zmiennych w sposób graficzny. Modele nieliniowe są bardziej skomplikowane niż modele liniowe, ponieważ funkcja jest tworzona poprzez serię przybliżeń (iteracji), które mogą wynikać z metody prób i błędów. Matematycy używają kilku uznanych metod, takich jak metoda Gaussa-Newtona i metoda Levenberga-Marquardta.
Często modele regresji, które na pierwszy rzut oka wydają się nieliniowe, są w rzeczywistości liniowe. Procedura estymacji krzywej może być wykorzystana do określenia charakteru zależności funkcjonalnych występujących w danych, dzięki czemu można wybrać prawidłowy model regresji, liniowy lub nieliniowy. Modele regresji liniowej, chociaż zazwyczaj tworzą linię prostą, mogą również tworzyć krzywe, w zależności od postaci równania regresji liniowej. Podobnie, możliwe jest użycie algebry do przekształcenia równania nieliniowego tak, aby naśladowało równanie liniowe – takie równanie nieliniowe jest określane jako „samoistnie liniowe”.
Regresja liniowa wiąże dwie zmienne linią prostą; regresja nieliniowa wiąże zmienne za pomocą krzywej.
Przykład regresji nieliniowej
Jednym z przykładów wykorzystania regresji nieliniowej jest przewidywanie wzrostu populacji w czasie. Wykres rozrzutu zmieniających się danych dotyczących populacji w czasie pokazuje, że wydaje się istnieć związek między czasem a wzrostem populacji, ale jest to zależność nieliniowa, wymagająca zastosowania nieliniowego modelu regresji. Logistyczny model wzrostu populacji może zapewnić szacunki populacji dla okresów, które nie były mierzone, oraz przewidywania dotyczące przyszłego wzrostu populacji.
Zmienne niezależne i zależne stosowane w regresji nieliniowej powinny mieć charakter ilościowy. Zmienne kategorialne, takie jak region zamieszkania lub religia, powinny być kodowane jako zmienne binarne lub inne rodzaje zmiennych ilościowych.
Aby uzyskać dokładne wyniki z modelu regresji nieliniowej, należy upewnić się, że określona funkcja dokładnie opisuje zależność między zmiennymi niezależnymi i zależnymi. Niezbędne są również dobre wartości początkowe. Słabe wartości początkowe mogą skutkować brakiem zbieżności modelu lub rozwiązaniem, które jest optymalne tylko lokalnie, a nie globalnie, nawet jeśli określono odpowiednią formę funkcjonalną dla modelu.