4 maja 2021 21:35

Testowanie hipotez w finansach: koncepcja i przykłady

Twój doradca inwestycyjny proponuje miesięczny plan inwestycyjny, który obiecuje zmienny zwrot każdego miesiąca. Będziesz w nią inwestować tylko wtedy, gdy masz gwarancję średniego miesięcznego dochodu wynoszącego 180 USD. Twój doradca poinformuje Cię również, że przez ostatnie 300 miesięcy program miał zwroty z inwestycji o średniej wartości 190 USD i odchyleniu standardowym 75 USD. Czy powinieneś zainwestować w ten program? W podejmowaniu takich decyzji z pomocą przychodzi testowanie hipotez.

Kluczowe wnioski

  • Testowanie hipotez jest narzędziem matematycznym służącym do potwierdzania roszczenia lub pomysłu finansowego lub biznesowego.
  • Testowanie hipotez jest przydatne dla inwestorów próbujących zdecydować, w co zainwestować i czy dany instrument może zapewnić satysfakcjonujący zwrot.
  • Pomimo istnienia różnych metodologii testowania hipotez stosuje się te same cztery kroki: zdefiniowanie hipotezy, ustalenie kryteriów, obliczenie statystyki i wyciągnięcie wniosków.
  • Ten model matematyczny, podobnie jak większość narzędzi i modeli statystycznych, ma ograniczenia i jest podatny na pewne błędy, co zmusza inwestorów do rozważenia również innych modeli w połączeniu z tym.

Co to jest testowanie hipotez?

Testowanie hipotez lub istotności to model matematyczny służący do testowania twierdzenia, pomysłu lub hipotezy na temat parametru będącego przedmiotem zainteresowania w danym zbiorze populacji, przy użyciu danych mierzonych w zbiorze prób. Obliczenia są wykonywane na wybranych próbach w celu zebrania bardziej decydujących informacji o cechach całej populacji, co umożliwia systematyczne testowanie twierdzeń lub pomysłów dotyczących całego zbioru danych.

Oto prosty przykład: Dyrektor szkoły informuje, że uczniowie w ich szkole uzyskują średnio 7 punktów na 10 z egzaminów. Aby przetestować tę „hipotezę”, rejestrujemy oceny powiedzmy 30 uczniów (próba) z całej populacji uczniów szkoły (powiedzmy 300) i obliczamy średnią z tej próby. Następnie możemy porównać (obliczoną) średnią z próby z (zgłoszoną) średnią populacji i spróbować potwierdzić hipotezę.

Aby posłużyć się innym przykładem, roczna stopa zwrotu z danego funduszu wspólnego inwestowania wynosi 8%. Załóżmy, że fundusz inwestycyjny istnieje od 20 lat. Bierzemy losową próbę rocznych zwrotów funduszu powierniczego za, powiedzmy, pięć lat (próba) i obliczamy jej średnią. Następnie porównujemy (obliczoną) średnią z próby z (deklarowaną) średnią populacji, aby zweryfikować hipotezę.



W artykule założono znajomość przez czytelników pojęć tabeli rozkładu normalnego, wzoru, wartości p i powiązanych podstaw statystyki.

Istnieją różne metodologie testowania hipotez, ale wymagane są te same cztery podstawowe kroki:

Krok 1: Zdefiniuj hipotezę

Zwykle zgłaszana wartość (lub statystyki roszczenia) jest określana jako hipoteza i zakłada się, że jest prawdziwa. W przypadku powyższych przykładów hipoteza będzie wyglądać następująco:

  • Przykład A: Uczniowie w szkole uzyskują średnio 7 punktów na 10 z egzaminów.
  • Przykład B: Roczny zwrot funduszu wspólnego inwestowania wynosi 8% rocznie.

Ten przedstawiony opis stanowi „ Hipotezę zerową (H 0 ) ” i  przyjmuje się,  że jest prawdziwy – sposób, w jaki oskarżony w procesie przysięgłym jest uznawany za niewinnego do czasu udowodnienia winy na podstawie dowodów przedstawionych w sądzie. Podobnie, testowanie hipotez rozpoczyna się od stwierdzenia i przyjęcia „ hipotezy zerowej ”, a następnie proces określa, czy założenie to może być prawdziwe, czy fałszywe.

Ważną kwestią, na którą należy zwrócić uwagę, jest to, że testujemy hipotezę zerową, ponieważ istnieje element wątpliwości co do jej słuszności. Wszelkie informacje, które są sprzeczne z podaną hipotezą zerową, są ujmowane w  hipotezie alternatywnej (H 1 ). W przypadku powyższych przykładów hipotezą alternatywną będzie:

  • Studenci uzyskują średnią, która nie jest równa 7.
  • Roczny zwrot funduszu inwestycyjnego nie jest równy 8% rocznie.

Innymi słowy, hipoteza alternatywna jest bezpośrednią zaprzeczeniem hipotezy zerowej.

Podobnie jak w procesie, ława przysięgłych zakłada niewinność oskarżonego (hipoteza zerowa). Prokurator musi udowodnić, że jest inaczej (hipoteza alternatywna). Podobnie badacz musi udowodnić, że hipoteza zerowa jest prawdziwa lub fałszywa. Jeżeli prokurator nie udowodni alternatywnej hipotezy, ława przysięgłych musi pozwolić oskarżonemu odejść (opierając decyzję na hipotezie zerowej). Podobnie, jeśli badacz nie udowodni alternatywnej hipotezy (lub po prostu nic nie zrobi), wówczas przyjmuje się, że hipoteza zerowa jest prawdziwa.



Kryteria podejmowania decyzji muszą opierać się na określonych parametrach zbiorów danych.

Krok 2: Ustaw kryteria

Kryteria decyzyjne muszą opierać się na pewnych parametrach zbiorów danych i w tym miejscu pojawia się połączenie z rozkładem normalnym.

Zgodnie ze standardowymi danymi statystycznymi  dotyczącymi rozkładu próbkowania: „Dla dowolnej wielkości próby n rozkład próbkowania X̅ jest normalny, jeśli populacja X, z której pobierana jest próbka, ma rozkład normalny”. Stąd prawdopodobieństwa wszystkich innych możliwych próbek oznaczają, że można wybrać, mają rozkład normalny.

Na przykład ustalić, czy średnia dzienna powrót, o dowolnej akcji notowanej na XYZ giełdzie, wokół dzień Nowego Roku jest większa niż 2%.

H 0 : Hipoteza zerowa: średnia = 2%

H 1 : Hipoteza alternatywna: średnia> 2% (to chcemy udowodnić)

Weź próbkę (powiedzmy z 50 zasobów z łącznej liczby 500) i oblicz średnią z próby.

W przypadku rozkładu normalnego 95% wartości mieści się w granicach dwóch odchyleń standardowych średniej populacji. W związku z tym ten rozkład normalny i założenie centralnego limitu dla przykładowego zbioru danych pozwalają nam ustalić 5% jako poziom istotności. Ma to sens, ponieważ przy takim założeniu prawdopodobieństwo wystąpienia wartości odstających przekraczających dwa odchylenia standardowe od średniej populacji jest mniejsze niż 5% (100–95). W zależności od charakteru zbiorów danych można przyjąć inne poziomy istotności na poziomie 1%, 5% lub 10%. W przypadku obliczeń finansowych (w tym finansów behawioralnych) 5% to ogólnie przyjęty limit. Jeśli znajdziemy jakiekolwiek obliczenia, które wykraczają poza zwykłe dwa odchylenia standardowe, mamy silny przypadek wartości odstających, aby odrzucić hipotezę zerową. 

Graficznie przedstawia się to następująco:

W powyższym przykładzie, jeśli średnia z próby jest znacznie większa niż 2% (powiedzmy 3,5%), odrzucamy hipotezę zerową. Przyjmuje się hipotezę alternatywną (średnia> 2%), która potwierdza, że ​​średni dzienny zwrot z akcji rzeczywiście przekracza 2%.

Jeśli jednak średnia z próby prawdopodobnie nie będzie znacznie większa niż 2% (i pozostanie na poziomie, powiedzmy, około 2,2%), NIE MOŻEMY odrzucić hipotezy zerowej. Wyzwanie polega na podjęciu decyzji w takich przypadkach z bliskiej odległości. Aby wyciągnąć wnioski z wybranych próbek i wyników, należy określić poziom istotności, który umożliwi wyciągnięcie wniosku o hipotezie zerowej. Hipoteza alternatywna umożliwia ustalenie poziomu istotności lub koncepcji „wartości krytycznej” przy podejmowaniu decyzji w tak bliskich przypadkach.

Zgodnie zdefinicją zawartą w podręczniku„Wartość krytyczna to wartość odcięcia, która określa granice, po przekroczeniu których można uzyskać mniej niż 5% średnich z próby, jeśli hipoteza zerowa jest prawdziwa. Przykładowe średnie uzyskane poza wartością krytyczną spowodują decyzję o odrzuceniu hipotezy zerowej. ” W powyższym przykładzie, jeśli zdefiniowaliśmy wartość krytyczną jako 2,1%, a obliczona średnia wynosi 2,2%, to odrzucamy hipoteza zerowa Wartość krytyczna wyznacza wyraźny podział na akceptację lub odrzucenie.

Krok 3: Oblicz statystyki

Ten krok obejmuje obliczenie wymaganych liczb, znanych jako statystyki testowe (takie jak średnia, wynik z, wartość p itp.) Dla wybranej próbki. (Dojdziemy do nich w dalszej części).

Krok 4: Wyciągnij wnioski

Mając obliczone wartości, zdecyduj się na hipotezę zerową. Jeśli prawdopodobieństwo uzyskania średniej z próby jest mniejsze niż 5%, wniosek jest taki, że należy odrzucić hipotezę zerową. W przeciwnym razie zaakceptuj i zachowaj hipotezę zerową.

Rodzaje błędów

Mogą istnieć cztery możliwe wyniki podejmowania decyzji na podstawie próby, w odniesieniu do prawidłowego zastosowania do całej populacji:

Przypadki „prawidłowe” to te, w których decyzje podjęte na próbach mają rzeczywiście zastosowanie do całej populacji. Przypadki błędów pojawiają się, gdy zdecyduje się zachować (lub odrzucić) hipotezę zerową na podstawie obliczeń próby, ale ta decyzja tak naprawdę nie ma zastosowania do całej populacji. Przypadki te stanowią błędy typu 1 ( alfa ) i 2 ( beta ), jak wskazano w powyższej tabeli.

Wybór prawidłowej wartości krytycznej pozwala wyeliminować błędy alfa typu 1 lub ograniczyć je do dopuszczalnego zakresu.

Alfa oznacza błąd na poziomie istotności i jest określany przez badacza. Aby utrzymać standardowy poziom istotności lub ufności na poziomie 5% dla obliczeń prawdopodobieństwa, pozostaje on na poziomie 5%.

Zgodnie z obowiązującymi wzorcami decyzyjnymi i definicjami:

  • „To (alfa) kryterium jest zwykle ustalane na 0,05 (a = 0,05) i porównujemy poziom alfa z wartością p. Gdy prawdopodobieństwo błędu typu I jest mniejsze niż 5% (p <0,05), decydujemy się odrzucić hipotezę zerową;w przeciwnym razie zachowamy hipotezę zerową ”.
  • Terminem technicznym używanym do określenia tego prawdopodobieństwa jest wartośćp. Definiuje się je jako „prawdopodobieństwo uzyskania wyniku próby, przy założeniu, że wartość podana w hipotezie zerowej jest prawdziwa. Wartość p dla uzyskania wyniku próby porównuje się z poziomem istotności. ”
  • Błąd typu II lub błąd beta definiuje się jako prawdopodobieństwo nieprawidłowego utrzymania hipotezy zerowej, podczas gdy w rzeczywistości nie ma ona zastosowania do całej populacji.

Kilka innych przykładów zademonstruje to i inne obliczenia.

Przykład 1

Istnieje program inwestycji w miesięczne dochody, który obiecuje zmienne miesięczne zwroty. Inwestor będzie w nią inwestował tylko wtedy, gdy będzie miał gwarancję średniego miesięcznego dochodu wynoszącego 180 USD. Inwestor ma próbkę zwrotów z 300 miesięcy, która ma średnią 190 USD i odchylenie standardowe 75 USD. Czy powinni zainwestować w ten program?

Skonfigurujmy problem. Inwestor zainwestuje w program, jeśli ma pewność, że pożądany przez niego średni zwrot wynosi 180 USD.

H 0 : Hipoteza zerowa: średnia = 180

H 1 : Hipoteza alternatywna: średnia> 180

Metoda 1: Podejście do wartości krytycznej

Zidentyfikuj wartość krytyczną X L dla średniej próbki, która jest wystarczająco duża, aby odrzucić hipotezę zerową – tj. Odrzucić hipotezę zerową, jeśli średnia próbki> = wartość krytyczna X L

P (zidentyfikuj błąd alfa typu I) = P (odrzuć H 0,  biorąc pod uwagę, że H 0  jest prawdziwe),

Można to osiągnąć, gdy średnia próbki przekroczy krytyczne limity.

= P (zakładając, że H 0  jest prawdą) = alfa

Graficznie wygląda to następująco:

Przyjmując alfa = 0,05 (tj. Poziom istotności 5%), Z 0,05  = 1,645 (z tabeli Z lub tabeli rozkładu normalnego)

=> X L  = 180 + 1,645 * (75 / sqrt (300)) = 187,12

Ponieważ średnia z próby (190) jest większa niż wartość krytyczna (187,12), hipoteza zerowa zostaje odrzucona, a wniosek jest taki, że średni miesięczny zwrot jest rzeczywiście większy niż 180 USD, więc inwestor może rozważyć zainwestowanie w ten schemat.

Metoda 2: Korzystanie ze standardowych statystyk testowych

Można również użyć znormalizowanej wartości z.

Statystyka testowa, Z = (średnia próbki – średnia populacji) / (odchylenie std / sqrt (liczba próbek).

Następnie region odrzucenia staje się następujący:

Z = (190 – 180) / (75 / sqrt (300)) = 2,309

Nasz region odrzucenia na poziomie istotności 5% to Z> Z 0,05  = 1,645.

Ponieważ Z = 2,309 jest większe niż 1,645, hipoteza zerowa może zostać odrzucona z podobnym wnioskiem wymienionym powyżej.

Metoda 3: Obliczanie wartości P.

Naszym celem jest zidentyfikowanie P (średnia próbki> = 190, gdy średnia = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2,309) = 0,0084 = 0,84%

Poniższa tabela, aby wywnioskować obliczenia wartości p, stwierdza, że ​​istnieją potwierdzone dowody na to, że średnie miesięczne zwroty są wyższe niż 180:

Przykład 2

Nowy makler giełdowy (XYZ) twierdzi, że jego prowizje maklerskie są niższe niż opłaty obecnego maklera giełdowego (ABC). Dane dostępne od niezależnej firmy badawczej wskazują, że średnia i odchylenie standardowe wszystkich klientów brokera ABC wynosi odpowiednio 18 USD i 6 USD.

Pobierana jest próbka 100 klientów ABC i obliczane są opłaty maklerskie według nowych stawek brokera XYZ. Jeśli średnia z próby wynosi 18,75 USD, a std-dev jest takie samo (6 USD), czy można wyciągnąć jakiekolwiek wnioski na temat różnicy w średnim rachunku maklerskim między brokerem ABC a XYZ?

H 0 : Hipoteza zerowa: średnia = 18

H 1 : Hipoteza alternatywna: średnia 18 (To jest to, co chcemy udowodnić.)

Region odrzucenia: Z = Z 2,5  (przy założeniu 5% poziomu istotności, podział po 2,5 po każdej stronie).

Z = (średnia próbki – średnia) / (odchylenie std / sqrt (liczba próbek))

= (18,75 – 18) / (6 / (sqrt (100)) = 1,25

Ta obliczona wartość Z mieści się w dwóch granicach określonych przez:

– Z 2,5  = -1,96 i Z 2,5  = 1,96.

Z tego wynika, że ​​nie ma wystarczających dowodów, aby wywnioskować, że istnieje jakakolwiek różnica między kursami obecnego i nowego brokera.

Alternatywnie, wartość p = P (Z 1,25)

= 2 * 0,1056 = 0,2112 = 21,12%, czyli więcej niż 0,05 lub 5%, co prowadzi do tego samego wniosku.

Graficznie jest reprezentowany przez:

Punkty krytyczne dla hipotetycznej metody testowania:

  • Metoda statystyczna oparta na założeniach
  • Podatny na błędy, jak opisano szczegółowo w zakresie błędów alfa i beta
  • Interpretacja wartości p może być niejednoznaczna, co prowadzi do mylących wyników

Podsumowanie

Testowanie hipotez umożliwia modelowi matematycznemu walidację twierdzenia lub pomysłu na określonym poziomie ufności. Jednak, podobnie jak większość narzędzi i modeli statystycznych, wiąże się to z kilkoma ograniczeniami. Zastosowanie tego modelu do podejmowania decyzji finansowych należy rozpatrywać krytycznie, mając na uwadze wszystkie zależności. W celu przeprowadzenia podobnej analizy warto również zbadać metody alternatywne, takie jak  wnioskowanie bayesowskie.