Definicja statystyki Durbin Watson
Co to jest statystyka Durbina Watsona?
Statystyka Durbin Watson (DW) jest testem autokorelacji reszt z analizy regresji statystycznej. Statystyka Durbina-Watsona zawsze będzie miała wartość między 0 a 4. Wartość 2,0 oznacza, że w próbce nie wykryto autokorelacji. Wartości od 0 do mniej niż 2 wskazują na dodatnią autokorelację, a wartości od 2 do 4 wskazują na ujemną autokorelację.
Cena akcji wykazująca dodatnią autokorelację wskazywałaby, że wczorajsza cena ma dodatnią korelację z ceną dzisiejszą – więc jeśli cena akcji spadła wczoraj, jest również prawdopodobne, że spadnie dzisiaj. Z drugiej strony, papier wartościowy, który ma negatywną autokorelację, ma z czasem negatywny wpływ na siebie – więc jeśli wczoraj spadł, to jest większe prawdopodobieństwo, że dziś wzrośnie.
Kluczowe wnioski
- Statystyka Durbina Watsona jest testem autokorelacji w zbiorze danych.
- Statystyka DW zawsze ma wartość od zera do 4,0.
- Wartość 2,0 oznacza, że w próbce nie wykryto autokorelacji. Wartości od zera do 2,0 wskazują na dodatnią autokorelację, a wartości od 2,0 do 4,0 wskazują na ujemną autokorelację.
- Autokorelacja może być przydatna w analizie technicznej, która jest najbardziej zainteresowana trendami cen papierów wartościowych przy użyciu technik tworzenia wykresów zamiast kondycji finansowej lub zarządzania firmą.
Podstawy statystyki Durbina Watsona
Autokorelacja, znana również jako korelacja szeregowa, może stanowić poważny problem w analizie danych historycznych, jeśli nie wie się, jak ich szukać. Na przykład, ponieważ ceny akcji zwykle nie zmieniają się zbyt radykalnie z dnia na dzień, ceny z dnia na dzień mogą być potencjalnie silnie skorelowane, mimo że w tej obserwacji jest mało przydatnych informacji. Aby uniknąć problemów z autokorelacją, najłatwiejszym rozwiązaniem w finansach jest po prostu przeliczenie serii cen historycznych na serię zmian cen procentowych z dnia na dzień.
Autokorelacja może być przydatna w analizie technicznej, która jest najbardziej zainteresowana trendami i związkami między cenami papierów wartościowych przy użyciu technik wykresów zamiast kondycji finansowej lub zarządzania firmą. Analitycy techniczni mogą skorzystać z autokorelacji, aby zobaczyć, jaki wpływ przeszłe ceny papieru wartościowego mają na jego przyszłą cenę.
Statystyka Durbin Watson została nazwana na cześć statystyk Jamesa Durbina i Geoffreya Watsona.
Autokorelacja może pokazać, czy istnieje czynnik pędu powiązany z akcją. Na przykład, jeśli wiesz, że akcje mają historycznie wysoką dodatnią wartość autokorelacji i byłeś świadkiem, że akcje notowały solidne zyski w ciągu ostatnich kilku dni, możesz rozsądnie oczekiwać, że ruchy w ciągu najbliższych kilku dni (wiodące szeregi czasowe) będą się zgadzać. te z opóźnionych szeregów czasowych i przesunąć się w górę.
Przykład statystyki Durbin Watson
Wzór na statystykę Durbina Watsona jest dość złożony, ale obejmuje reszty ze zwykłej regresji metodą najmniejszych kwadratów na zestawie danych. Poniższy przykład ilustruje sposób obliczania tej statystyki.
Załóżmy następujące (x, y) punkty danych:
Korzystając z metod regresji najmniejszych kwadratów, aby znaleźć „ linię najlepszego dopasowania ”, równanie dla najlepiej dopasowanej linii tych danych wygląda następująco:
Y=-2.6268x+1,129.2Y = { – 2,6268} x + {1129,2}Y=-2.6268 x+1,129.2
Pierwszym krokiem w obliczaniu statystyki Durbina Watsona jest obliczenie oczekiwanych wartości „y” przy użyciu linii równania najlepszego dopasowania. W przypadku tego zestawu danych oczekiwane wartości „y” to:
Następnie obliczane są różnice między rzeczywistymi wartościami „y” a oczekiwanymi wartościami „y”, czyli błędy:
Error(1)=(1,100−1,102.9)=−2.9Error(2)=(1,200−1,076.7)=123.3Error(3)=(985−1,037.3)=−52.3Error(4)=(750−1,024.1)=−274.1Error(5)=(1,215−997.9)=217.1Error(6)=(1,000−1,011)=−11\begin{aligned} &\text{Error}\left({1}\right)=\left( {1,100}-{1,102.9} \right )={ -2.9}\\ &\text{Error}\left({2}\right)=\left( {1,200}-{1,076.7} \right )={123.3}\\ &\text{Error}\left({3}\right)=\left( {985}-{1,037.3} \right )={ -52.3}\\ &\text{Error}\left({4}\right)=\left( {750}-{1,024.1} \right )={ -274.1}\\ &\text{Error}\left({5}\right)=\left( {1,215}-{997.9} \right )={217.1}\\ &\text{Error}\left({6}\right)=\left( {1,000}-{1,011} \right )={ -11}\\ \end{aligned}Error(1)=(1,100−1,102.9)=−2.9Error(2)=(1,200−1,076.7)=123.3Error(3)=(985−1,037.3)=−52.3Error(4)=(750−1,024.1)=−274.1Error(5)=(1,215−997.9)=217.1Error(6)=(1,000−1,011)=−11
Następnie te błędy należy podnieść do kwadratu i zsumować :
Następnie wartość błędu pomniejszona o poprzedni błąd jest obliczana i podnoszona do kwadratu:
Difference(1)=(123.3−(−2.9))=126.2Difference(2)=(−52.3−123.3)=−175.6Difference(3)=(−274.1−(−52.3))=−221.9Difference(4)=(217.1−(−274.1))=491.3Difference(5)=(−11−217.1)=−228.1Sum of Differences Square=389,406.71\begin{aligned} &\text{Difference}\left({1}\right)=\left( {123.3}-\left({ -2.9}\right) \right )={126.2}\\ &\text{Difference}\left({2}\right)=\left( { -52.3}-{123.3} \right )={ -175.6}\\ &\text{Difference}\left({3}\right)=\left( { -274.1}-\left({ -52.3}\right) \right )={ -221.9}\\ &\text{Difference}\left({4}\right)=\left( {217.1}-\left({ -274.1}\right) \right )={491.3}\\ &\text{Difference}\left({5}\right)=\left( { -11}-{217.1} \right )={ -228.1}\\ &\text{Sum of Differences Square}={389,406.71}\\ \end{aligned}Difference(1)=(123.3−(−2.9))=126.2Difference(2)=(−52.3−123.3)=−175.6Difference(3)=(−274.1−(−52.3))=−221.9Difference(4)=(217.1−(−274.1))=491.3Difference(5)=(−11−217.1)=−228.1Sum of Differences Square=389,406.71
Wreszcie, statystyka Durbina Watsona jest ilorazem kwadratów wartości:
Durbin Watson=389,406.71/140,330.81=2.77\text{Durbin Watson}={389,406.71}/{140,330.81}={2.77}Durbin Watson=389,406.71/140,330.81=2.77
Ogólna zasada jest taka, że wartości statystyki testowej w zakresie od 1,5 do 2,5 są względnie normalne. Każda wartość poza tym zakresem może być powodem do niepokoju. Statystyka Durbina – Watsona, chociaż wyświetlana przez wiele programów do analizy regresji, nie ma zastosowania w niektórych sytuacjach. Na przykład, gdy zmienne zależne z opóźnieniem są zawarte w zmiennych objaśniających, stosowanie tego testu jest niewłaściwe.