Jakiego procentu populacji potrzebujesz w reprezentatywnej próbie?
Z technicznego punktu widzenia reprezentatywna próbka wymaga tylko takiego odsetka populacji statystycznej, jaki jest niezbędny do możliwie najdokładniejszego odtworzenia badanej lub analizowanej jakości lub cechy. Na przykład w populacji 1000, która składa się z 600 mężczyzn i 400 kobiet, wykorzystywanej do analizy trendów zakupowych według płci, reprezentatywna próba może składać się z zaledwie pięciu członków, trzech mężczyzn i dwóch kobiet, lub 0,5% populacja. Jednakże, chociaż ta próba jest nominalnie reprezentatywna dla większej populacji, prawdopodobnie spowoduje wysoki stopień błędu próbkowania podczas wnioskowania dotyczącego większej populacji, ponieważ jest ona tak mała.
Błąd próbkowania jest nieuniknioną konsekwencją wykorzystania próbek do analizy większej grupy. Pozyskiwanie od nich danych jest procesem, który z natury rzeczy jest ograniczony i niekompletny. Ale ponieważ jest to tak często konieczne, biorąc pod uwagę ograniczoną dostępność zasobów, analitycy ekonomiczni stosują metody, które mogą zredukować błąd próbkowania do statystycznie nieistotnych poziomów. Podczas gdy reprezentatywne pobieranie próbek jest jedną z najskuteczniejszych metod stosowanych w celu zmniejszenia błędu, często nie wystarcza samo w sobie.
Jedną ze strategii stosowanych w połączeniu z próbkowaniem reprezentatywnym jest upewnienie się, że próbka jest wystarczająco duża, aby optymalnie zmniejszyć błąd. I chociaż ogólnie rzecz biorąc, im większa podgrupa, tym bardziej prawdopodobne jest, że błąd zostanie zmniejszony, w pewnym momencie redukcja staje się tak minimalna, że nie uzasadnia dodatkowego kosztu niezbędnego do powiększenia próbki.
Tak jak użycie reprezentatywnej technicznie, ale niewielkiej próbki nie wystarczy do zmniejszenia błędu próby samo w sobie, tak samo wybranie dużej grupy bez uwzględnienia reprezentacji może prowadzić do jeszcze bardziej błędnych wyników niż użycie małej reprezentatywnej próby. Wracając do powyższego przykładu, grupa 600 mężczyzn jest sama w sobie statystycznie bezużyteczna przy analizie różnic w trendach zakupowych ze względu na płeć.
Zaskakujące jest, że frakcja próbkowania ma bardzo niewiele wspólnego z błędem wyników, gdy stosuje się próbkowanie losowe. Głównym wyznacznikiem błędu jest bezwzględna wielkość próby, a nie wielkość próby w stosunku do liczebności populacji.