Heteroskedastyczność
Co to jest heteroskedastyczność?
W statystyce heteroskedastyczność (lub heteroskedastyczność) ma miejsce, gdy odchylenia standardowe zmiennej przewidywanej, monitorowane dla różnych wartości zmiennej niezależnej lub w odniesieniu do poprzednich okresów, nie są stałe. W przypadku heteroskedastyczności znakiem ostrzegawczym po oględzinach pozostałych błędów jest to, że będą one miały tendencję do rozszerzania się w miarę upływu czasu, jak pokazano na poniższym obrazku.
Heteroskedastyczność często pojawia się w dwóch formach: warunkowej i bezwarunkowej. Warunkowa heteroskedastyczność identyfikuje niestałą zmienność związaną ze zmiennością z poprzedniego okresu (np. Dzienną). Bezwarunkowa heteroskedastyczność odnosi się do ogólnych zmian strukturalnych w zmienności, które nie są związane ze zmiennością z poprzedniego okresu. Bezwarunkowa heteroskedastyczność jest stosowana, gdy można zidentyfikować przyszłe okresy wysokiej i niskiej zmienności.
Kluczowe wnioski
- W statystyce heteroskedastyczność (lub heteroskedastyczność) ma miejsce, gdy standardowe błędy zmiennej, monitorowane przez określony czas, nie są stałe.
- W przypadku heteroskedastyczności, znakiem ostrzegawczym po oględzinach pozostałych błędów jest to, że będą one miały tendencję do rozszerzania się w miarę upływu czasu, jak pokazano na powyższym obrazku.
- Heteroskedastyczność jest naruszeniem założeń modelowania regresji liniowej, a więc może wpływać na ważność analizy ekonometrycznej lub modeli finansowych, takich jak CAPM.
Chociaż heteroskedastyczność nie powoduje stronniczości oszacowań współczynników, czyni je mniej precyzyjnymi; niższa precyzja zwiększa prawdopodobieństwo, że oszacowania współczynników są dalej od prawidłowej wartości populacji.
Podstawy heteroskedastyczności
W finansach warunkowa heteroskedastyczność jest często widoczna w cenach akcji i obligacji. Poziomu zmienności tych akcji nie można przewidzieć w żadnym okresie. Bezwarunkową heteroskedastyczność można wykorzystać podczas omawiania zmiennych, które mają możliwą do zidentyfikowania zmienność sezonową, takich jak zużycie energii elektrycznej.
W odniesieniu do statystyki heteroskedastyczność (również ortoskedastyczność ortograficzna ) odnosi się do wariancji błędu lub zależności rozpraszania w ramach co najmniej jednej zmiennej niezależnej w określonej próbie. Te odchylenia można wykorzystać do obliczenia marginesu błędu między zestawami danych, takimi jak oczekiwane wyniki i rzeczywiste wyniki, ponieważ zapewniają miarę odchylenia punktów danych od wartości średniej.
Aby zbiór danych został uznany za istotny, większość punktów danych musi mieścić się w określonej liczbie odchyleń standardowych od średniej, zgodnie z twierdzeniem Czebyszewa, znanym również jako nierówność Czebyszewa. Daje to wytyczne dotyczące prawdopodobieństwa wystąpienia zmiennej losowej różniącej się od średniej.
Na podstawie liczby określonych odchyleń standardowych zmienna losowa ma określone prawdopodobieństwo zaistnienia w tych punktach. Na przykład może być wymagane, aby zakres dwóch odchyleń standardowych zawierał co najmniej 75% punktów danych, które należy uznać za ważne. Częstą przyczyną rozbieżności wykraczających poza minimalne wymagania są często problemy z jakością danych.
Przeciwieństwem heteroskedastycznego jest homoskedastyczny. Homoskedastyczność odnosi się do stanu, w którym wariancja składnika resztkowego jest stała lub prawie taka sama. Homoskedastyczność jest jednym z założeń modelowania regresji liniowej. Konieczne jest zapewnienie, że oszacowania są dokładne, że granice predykcji dla zmiennej zależnej są prawidłowe oraz że przedziały ufności i wartości p dla parametrów są prawidłowe.
Rodzaje heteroskedastyczności
Bezwarunkowy
Bezwarunkowa heteroskedastyczność jest przewidywalna i może odnosić się do zmiennych z natury cyklicznych. Może to obejmować wyższą sprzedaż detaliczną odnotowaną podczas tradycyjnego okresu zakupów świątecznych lub wzrost liczby wezwań do naprawy klimatyzatora w cieplejszych miesiącach.
Zmiany w wariancji można bezpośrednio powiązać z wystąpieniem określonych zdarzeń lub predykcyjnych markerów, jeśli zmiany nie są tradycyjnie sezonowe. Może to być związane ze wzrostem sprzedaży smartfonów wraz z premierą nowego modelu, ponieważ aktywność jest cykliczna w oparciu o wydarzenie, ale niekoniecznie determinowana sezonem.
Heteroskedastyczność może również odnosić się do przypadków, w których dane zbliżają się do granicy – gdzie wariancja musi być koniecznie mniejsza, ponieważ granica ogranicza zakres danych.
Warunkowy
Warunkowa heteroskedastyczność nie jest z natury przewidywalna. Nic nie wskazuje na to, by analitycy wierzyli, że dane w dowolnym momencie zostaną mniej lub bardziej rozproszone. Często uważa się, że produkty finansowe podlegają warunkowej heteroskedastyczności, ponieważ nie wszystkie zmiany można przypisać określonym zdarzeniom lub zmianom sezonowym.
Powszechnym zastosowaniem warunkowej heteroskedastyczności są giełdy, na których dzisiejsza zmienność jest silnie powiązana z wczorajszą. Model ten wyjaśnia okresy utrzymującej się wysokiej i niskiej zmienności.
Uwagi specjalne
Heteroskedastyczność i modelowanie finansowe
Heteroskedastyczność jest ważną koncepcją w modelowaniu regresji, aw świecie inwestycji modele regresji są wykorzystywane do wyjaśniania wyników papierów wartościowych i portfeli inwestycyjnych. Najbardziej znanym z nich jest model wyceny aktywów kapitałowych (CAPM), który wyjaśnia wyniki akcji pod względem ich zmienności w stosunku do rynku jako całości. Rozszerzenia tego modelu dodały inne zmienne predykcyjne, takie jak rozmiar, pęd, jakość i styl (wartość a wzrost).
Te zmienne predykcyjne zostały dodane, ponieważ wyjaśniają lub wyjaśniają wariancję zmiennej zależnej. Wyniki portfela są wyjaśnione przez CAPM. Na przykład twórcy modelu CAPM byli świadomi, że ich model nie wyjaśnił interesującej anomalii: akcje wysokiej jakości, które były mniej zmienne niż akcje niskiej jakości, miały tendencję do osiągania lepszych wyników niż przewidywany model CAPM. CAPM twierdzi, że akcje o wyższym ryzyku powinny osiągać lepsze wyniki niż akcje o niższym ryzyku.
Innymi słowy, akcje o wysokiej zmienności powinny pokonać akcje o niższej zmienności. Jednak akcje wysokiej jakości, które są mniej niestabilne, zwykle osiągały lepsze wyniki niż przewidywała CAPM.
Później inni badacze rozszerzyli model CAPM (który już został rozszerzony o inne zmienne predykcyjne, takie jak rozmiar, styl i moment), aby uwzględnić jakość jako dodatkową zmienną predykcyjną, znaną również jako „czynnik”. Po uwzględnieniu tego czynnika w modelu uwzględniono anomalię wyników akcji spółek o niskiej zmienności. Modele te, znane jako modele wieloczynnikowe, stanowią podstawę inwestowania w czynniki produkcji i inteligentnej wersji beta.