5 maja 2021 0:41

Wartość p

Co to jest wartość p?

W statystyce wartość p to prawdopodobieństwo uzyskania wyników co najmniej tak skrajnych, jak obserwowane wyniki testu hipotezy statystycznej , przy założeniu, że hipoteza zerowa jest poprawna. Wartość p jest używana jako alternatywa dla punktów odrzucenia, aby zapewnić najmniejszy poziom istotności, przy którym  hipoteza zerowa została odrzucona. Mniejsza wartość p oznacza, że ​​istnieją silniejsze dowody przemawiające za hipotezą alternatywną.

Kluczowe wnioski

  • Wartość p jest miarą prawdopodobieństwa, że ​​zaobserwowana różnica mogła wystąpić tylko przez przypadek.
  • Im niższa wartość p, tym większe znaczenie statystyczne obserwowanej różnicy.
  • Wartość p może być stosowana jako alternatywa lub dodatek do wstępnie wybranych poziomów ufności do testowania hipotez.

Jak oblicza się wartość p?

Wartości p są zwykle określane za pomocą tabel wartości p lub arkuszy kalkulacyjnych / oprogramowania statystycznego. Obliczenia te są oparte na założonym lub znanym rozkładzie prawdopodobieństwa testowanej statystyki. Wartości p oblicza się z odchylenia między wartością obserwowaną a wybraną wartością odniesienia, biorąc pod uwagę rozkład prawdopodobieństwa statystyki, z większą różnicą między dwiema wartościami odpowiadającą niższej wartości p.

Matematycznie, wartość p jest obliczana za pomocą rachunku całkowego z obszaru pod krzywą rozkładu prawdopodobieństwa dla wszystkich wartości statystyk, które są co najmniej tak daleko od wartości odniesienia, jak wartość obserwowana, w odniesieniu do całkowitego obszaru pod krzywą rozkładu prawdopodobieństwa. Krótko mówiąc, im większa różnica między dwiema obserwowanymi wartościami, tym mniej prawdopodobne jest, że różnica wynika z prostej przypadkowej szansy, co znajduje odzwierciedlenie w niższej wartości p.

Podejście do testowania hipotez w oparciu o wartość p

Podejście oparte na wartości p do testowania hipotez wykorzystuje obliczone prawdopodobieństwo do określenia, czy istnieją dowody na odrzucenie hipotezy zerowej. Hipoteza zerowa, znana również jako przypuszczenie, jest początkowym twierdzeniem dotyczącym populacji (lub procesu generowania danych). Hipoteza alternatywna stwierdza, czy parametr populacji różni się od wartości parametru populacji podanego w przypuszczeniu.

W praktyce poziom istotności jest określany z góry, aby określić, jak mała musi być wartość p, aby odrzucić hipotezę zerową. Ponieważ różni badacze stosują różne poziomy istotności podczas badania pytania, czytelnik może czasami mieć trudności z porównaniem wyników z dwóch różnych testów. Wartości p stanowią rozwiązanie tego problemu.

Na przykład załóżmy, że badanie porównujące zwroty z dwóch konkretnych aktywów zostało przeprowadzone przez różnych badaczy, którzy korzystali z tych samych danych, ale różnych poziomów istotności. Badacze mogą dojść do przeciwnych wniosków, jeśli chodzi o różnice między aktywami. Jeśli jeden badacz zastosował poziom ufności 90%, a drugi wymagał poziomu ufności 95%, aby odrzucić hipotezę zerową, a wartość p zaobserwowanej różnicy między dwoma zwrotami wyniosła 0,08 (co odpowiada poziomowi ufności 92%), wtedy pierwszy badacz stwierdziłby, że te dwa aktywa mają różnicę istotną statystycznie, podczas gdy drugi nie znalazłby żadnej statystycznie istotnej różnicy między zwrotami.

Aby uniknąć tego problemu, badacze mogli podać wartość p testu hipotezy i pozwolić czytelnikowi na samodzielną interpretację  istotności statystycznej  . Nazywa się to podejściem wartości p do testowania hipotez. Niezależny obserwator może zanotować wartość p i samodzielnie zdecydować, czy reprezentuje to statystycznie istotną różnicę, czy nie.

Przykład wartości p w świecie rzeczywistym

Załóżmy, że inwestor twierdzi, że wyniki jego portfela inwestycyjnego są równoważne wynikom indeksu Standard & Poor’s (S&P) 500. Aby to ustalić, inwestor przeprowadza dwustronny test. Hipoteza zerowa stwierdza, że ​​zwroty z portfela są równoważne zwrotom z indeksu S&P 500 w określonym okresie, podczas gdy hipoteza alternatywna stwierdza, że ​​zwroty z portfela i zwroty z indeksu S&P 500 nie są równoważne. (Gdyby inwestor przeprowadził jednostronny test, hipoteza alternatywna wskazywałaby, że zwroty z portfela są mniejsze lub większe niż zwroty z indeksu S&P 500).

Test hipotezy wartości P niekoniecznie wykorzystuje wcześniej wybrany poziom ufności, przy którym inwestor powinien zresetować hipotezę zerową, że zwroty są równoważne. Zamiast tego dostarcza miary tego, ile jest dowodów na odrzucenie hipotezy zerowej. Im mniejsza wartość p, tym większy dowód przeciwko hipotezie zerowej. Tak więc, jeśli inwestor stwierdzi, że wartość p wynosi 0,001, istnieją mocne dowody przeciwko hipotezie zerowej, a inwestor może z całą pewnością stwierdzić, że zwroty z portfela i zwroty z indeksu S&P 500 nie są równoważne.

Chociaż nie zapewnia to dokładnego progu, kiedy inwestor powinien zaakceptować lub odrzucić hipotezę zerową, ma jeszcze jedną bardzo praktyczną zaletę. Testowanie hipotezy wartości P umożliwia bezpośrednie porównanie względnej pewności, jaką inwestor może mieć, dokonując wyboru spośród wielu różnych typów inwestycji lub portfeli, w porównaniu z punktem odniesienia, takim jak S&P 500.

Na przykład w przypadku dwóch portfeli, A i B, których wyniki różnią się od S&P 500 z wartościami p odpowiednio 0,10 i 0,01, inwestor może być znacznie bardziej przekonany, że portfel B o niższej wartości p będzie faktycznie wykazywał konsekwentnie różne wartości wyniki.