5 maja 2021 2:32

Błąd wyboru próbki

Co to jest błąd wyboru próbki?

Błąd wyboru próby to rodzaj błędu spowodowanego wybraniem danych nielosowych do analizy statystycznej. Ten błąd wynika z błędu w procesie doboru próby, w którym podzbiór danych jest systematycznie wykluczany ze względu na określony atrybut. Wyłączenie podzbioru może wpływać na istotność statystyczną testu i może wpływać na oszacowania parametrów modelu statystycznego.

Zrozumienie błędu wyboru próbki

Błąd przeżycia jest powszechnym typem błędu doboru próby. Na przykład, podczas testowania historycznego strategii inwestycyjnej na dużej grupie akcji, wygodnie może być poszukanie papierów wartościowych, które mają dane z całego okresu próbnego. Gdybyśmy mieli przetestować strategię na podstawie danych giełdowych z 15 lat, moglibyśmy być skłonni do poszukiwania spółek, które mają pełne informacje za cały 15-letni okres. Jednak wyeliminowanie akcji, które przestały handlować lub wkrótce opuściły rynek, spowodowałoby odchylenie w naszej próbce danych. Ponieważ uwzględniamy tylko akcje, które przetrwały 15 lat, nasze ostateczne wyniki byłyby błędne, ponieważ osiągały one wystarczająco dobre wyniki, aby przetrwać na rynku.

Indeksy wyników funduszy hedgingowych są jednym z przykładów błędu selekcji próby, w przypadku którego występuje błąd przeżywalności. Ponieważ fundusze hedgingowe, które nie przetrwały, przestają zgłaszać swoje wyniki agregatorom indeksów, wynikające z nich indeksy są w naturalny sposób przechylane na fundusze i strategie, które pozostają, a zatem „przetrwają”. Może to stanowić problem również w przypadku popularnych usług raportowania funduszy wspólnego inwestowania.

Analitycy mogą dostosować się, aby uwzględnić te uprzedzenia, ale mogą wprowadzić nowe uprzedzenia w procesie.