Definicja dystrybucji T
Co to jest dystrybucja T?
Rozkład T, znany również jako rozkład t-Studenta, jest rodzajem rozkładu prawdopodobieństwa, który jest podobny do rozkładu normalnego z kształtem dzwonu, ale ma cięższe ogony. Rozkłady T mają większe szanse na wartości ekstremalne niż rozkłady normalne, stąd grubsze ogony.
Kluczowe wnioski
- Rozkład T jest ciągłym rozkładem prawdopodobieństwa wyniku z, gdy w mianowniku zamiast prawdziwego odchylenia standardowego zastosowano szacunkowe odchylenie standardowe.
- Rozkład T, podobnie jak rozkład normalny, ma kształt dzwonu i jest symetryczny, ale ma cięższe ogony, co oznacza, że ma tendencję do wytwarzania wartości znacznie odbiegających od średniej.
- Testy T są używane w statystykach do szacowania istotności.
Co mówi dystrybucja T?
Ciężkość ogona jest określana przez parametr rozkładu T zwany stopniami swobody, przy czym mniejsze wartości dają cięższe ogony, a przy wyższych wartościach rozkład T przypomina standardowy rozkład normalny ze średnią równą 0 i odchyleniem standardowym równym 1. Dystrybucja T jest również znana jako „Dystrybucja T Studenta”.
Gdy próbka n obserwacji jest pobierana z populacji o rozkładzie normalnym o średniej M i odchyleniu standardowym D, średnia z próby m i odchylenie standardowe próbki d będą różnić się od M i D ze względu na losowość próby.
Wynik-z można obliczyć z odchyleniem standardowym populacji jako Z = (x – M) / D, a ta wartość ma rozkład normalny ze średnią 0 i odchyleniem standardowym 1. Jednak przy użyciu szacowanego odchylenia standardowego wynik t jest obliczana jako T = (m – M) / {d / sqrt (n)}, różnica między d i D sprawia, że rozkład jest rozkładem T z (n – 1) stopniami swobody, a nie rozkładem normalnym ze średnią 0 i odchylenie standardowe 1.
Przykład korzystania z rozkładu T.
Weźmy następujący przykład, jak rozkłady t są wykorzystywane w analizie statystycznej. Po pierwsze, należy pamiętać, że przedział ufności dla średniej to zakres wartości, obliczonych na podstawie danych, mających na celu uchwycenie średniej „populacji”. Ten przedział to m + – t * d / sqrt (n), gdzie t jest wartością krytyczną z rozkładu T.
Na przykład 95% przedział ufności dla średniego zwrotu Dow Jones Industrial Average z 27 dni handlowych poprzedzających 9/11/2001 wynosi -0,33% (+/- 2,055) * 1,07 / sqrt (27), dając (trwały) średni zwrot jako pewną liczbę między -0,75% a + 0,09%. Liczba 2,055, czyli ilość błędów standardowych do skorygowania, znajduje się w rozkładzie T.
Ponieważ rozkład T ma grubsze ogony niż rozkład normalny, może być stosowany jako model dla zwrotów finansowych wykazujących nadmierną kurtoozę, co pozwoli na bardziej realistyczne obliczenie wartości zagrożonej ( VaR ) w takich przypadkach.
Różnica między rozkładem T a rozkładem normalnym
Rozkłady normalne są używane, gdy zakłada się, że rozkład populacji jest normalny. Rozkład T jest podobny do rozkładu normalnego, tylko z grubszymi ogonami. Obie zakładają populację o rozkładzie normalnym. Rozkłady T mają wyższą kurtoozę niż rozkłady normalne. Prawdopodobieństwo uzyskania wartości bardzo odległych od średniej jest większe w przypadku rozkładu T niż w przypadku rozkładu normalnego.
Ograniczenia stosowania rozkładu T.
Rozkład T może wypaczyć dokładność w stosunku do rozkładu normalnego. Jego wada pojawia się tylko wtedy, gdy istnieje potrzeba doskonałej normalności. Jednak różnica między zastosowaniem rozkładu normalnego a rozkładem T. jest stosunkowo niewielka.