Wprowadzenie do procesów stacjonarnych i niestacjonarnych
Instytucje finansowe i korporacje, a także inwestorzy indywidualni i badacze, często wykorzystują dane finansowe szeregów czasowych (takie jak ceny aktywów, kursy wymiany, PKB, inflacja i inne wskaźniki makroekonomiczne) w prognozach gospodarczych, analizach giełdowych lub badaniach danych samo.
Jednak dopracowanie danych jest kluczem do możliwości zastosowania ich w analizie zapasów. W tym artykule pokażemy, jak wyodrębnić punkty danych, które są istotne dla raportów giełdowych.
Gotowanie surowych danych
Punkty danych są często niestacjonarne lub mają środki, wariancje i kowariancje, które zmieniają się w czasie. Zachowania niestacjonarne mogą być trendami, cyklami, przypadkowymi spacerami lub kombinacjami tych trzech.
Dane niestacjonarne z reguły są nieprzewidywalne i nie można ich modelować ani prognozować. Wyniki uzyskane przy użyciu niestacjonarnych szeregów czasowych mogą być fałszywe, ponieważ mogą wskazywać na związek między dwiema zmiennymi, gdy jedna nie istnieje. Aby otrzymać spójne, wiarygodne wyniki, dane niestacjonarne muszą zostać przekształcone w dane stacjonarne. W przeciwieństwie do procesu niestacjonarnego, który ma zmienną wariancję i średnią, która nie pozostaje blisko lub powraca do długoterminowej średniej w czasie, proces stacjonarny powraca do stałej długoterminowej średniej i ma stałą niezależną od wariancji czasu.
Rodzaje procesów niestacjonarnych
Zanim przejdziemy do punktu transformacji danych niestacjonarnych finansowych szeregów czasowych, powinniśmy rozróżnić różne typy procesów niestacjonarnych. Zapewni nam to lepsze zrozumienie procesów i pozwoli zastosować właściwą transformację. Przykładami procesów niestacjonarnych są błądzenie losowe z dryfem lub bez niego (powolna, stała zmiana) oraz trendy deterministyczne (trendy, które są stałe, dodatnie lub ujemne, niezależne od czasu przez całe życie szeregu).
- Czysty spacer losowy (Y t = Y t-1 + ε t ) Spacer losowy przewiduje, że wartość w czasie „t” będzie równa wartości ostatniego okresu plus składnik stochastyczny (niesystematyczny), którym jest biały szum, który oznacza ε t jest niezależne i identycznie rozłożone ze średnią „0” i wariancją „σ²”. Spacer losowy można również nazwać procesem zintegrowanym w pewnym porządku, procesem z pierwiastkiem jednostkowym lub procesem z trendem stochastycznym. Jest to proces bez odwracania średniej, który może oddalać się od średniej w kierunku pozytywnym lub negatywnym. Inną cechą losowego spaceru jest to, że wariancja ewoluuje w czasie i dąży do nieskończoności, gdy czas zmierza do nieskończoności; dlatego nie można przewidzieć przypadkowego spaceru.
- Losowy spacer z dryfem (Y t = α + Y t-1 + ε t ) Jeśli model spaceru losowego przewiduje, że wartość w czasie „t” będzie równa wartości ostatniego okresu plus stała lub dryf (α), a biały szum (ε t ), to proces jest błądzeniem losowym z dryfem. Nie powraca również do średniej długoterminowej i ma wariancję zależną od czasu.
- Trend deterministyczny (Y t = α + βt + ε t ) Często spacer losowy z dryfem jest mylony z trendem deterministycznym. Oba zawierają składową dryftu i szumu białego, ale wartość w czasie „t” w przypadku błądzenia losowego jest regresowana do wartości ostatniego okresu (Y t-1 ), natomiast w przypadku trendu deterministycznego jest regresowana na trendzie czasowym (βt). Niestacjonarny proces z deterministycznym trendem ma średnią, która rośnie wokół stałego trendu, który jest stały i niezależny od czasu.
- Spacer losowy z dryfem i trendem deterministycznym (Y t = α + Y t-1 + βt + ε t ) Innym przykładem jest proces niestacjonarny, który łączy spacer losowy ze składową dryfu (α) i trendem deterministycznym (βt). Określa wartość w czasie „t” przez wartość ostatniego okresu, dryf, trend i składnik stochastyczny.
Trend i różnica stacjonarne
Spacer losowy z lub bez dryftu można przekształcić w proces stacjonarny poprzez różnicowanie (odejmując Y t-1 od Y t, biorąc różnicę Y t – Y t-1 ) odpowiednio do Y t – Y t-1 = ε t lub Y t – Y t-1 = α + ε t i wtedy proces staje się różnicowo-stacjonarny. Wadą różnicowania jest to, że za każdym razem, gdy różnica jest brana, proces traci jedną obserwację.
Niestacjonarny proces z deterministycznym trendem staje się stacjonarny po usunięciu trendu lub po jego odreagowaniu. Na przykład Yt = α + βt + εt jest przekształcane w proces stacjonarny przez odjęcie trendu βt: Yt – βt = α + εt, jak pokazano na poniższym rysunku. Żadna obserwacja nie zostaje utracona, gdy detrending jest używany do przekształcenia procesu niestacjonarnego w stacjonarny.
W przypadku przypadkowego spaceru z dryfem i deterministycznym trendem, odejście może usunąć deterministyczny trend i dryf, ale wariancja będzie nadal dążyć do nieskończoności. W rezultacie należy również zastosować różnicowanie, aby usunąć trend stochastyczny.
Podsumowanie
Używanie niestacjonarnych danych szeregów czasowych w modelach finansowych daje niewiarygodne i fałszywe wyniki oraz prowadzi do słabego zrozumienia i prognozowania. Rozwiązaniem problemu jest przekształcenie danych szeregów czasowych tak, aby stały się one stacjonarne. Jeśli proces niestacjonarny jest chodzeniem losowym z dryfem lub bez, jest przekształcany w proces stacjonarny przez różnicowanie. Z drugiej strony, jeśli analizowane dane szeregów czasowych wykazują tendencję deterministyczną, można uniknąć fałszywych wyników poprzez odejście od trendu.
Czasami szereg niestacjonarny może łączyć trend stochastyczny i deterministyczny w tym samym czasie i aby uniknąć uzyskania mylących wyników, należy stosować zarówno różnicowanie, jak i odtrącanie, ponieważ różnicowanie usunie trend w wariancji, a detrending usunie trend deterministyczny.