Stratyfikowane losowe próbkowanie
Co to jest losowe próbkowanie warstwowe?
Warstwowe losowe pobieranie próbek to metoda próbkowania polegająca na podziale populacji na mniejsze podgrupy zwane warstwami. W warstwowym losowaniu losowym lub stratyfikacji warstwy są tworzone na podstawie wspólnych atrybutów lub cech członków, takich jak dochód lub poziom wykształcenia.
Warstwowe pobieranie próbek losowych jest również nazywane proporcjonalnym próbkowaniem losowym lub kwotowym próbkowaniem losowym.
Kluczowe wnioski
- Warstwowe losowe pobieranie próbek umożliwia badaczom uzyskanie populacji próbek, która najlepiej reprezentuje całą badaną populację.
- Warstwowe losowe pobieranie próbek polega na podzieleniu całej populacji na jednorodne grupy zwane warstwami.
- Warstwowe losowe pobieranie próbek różni się od prostego losowego pobierania próbek, które polega na losowym doborze danych z całej populacji, tak więc każda możliwa próba jest równie prawdopodobna.
Jak działa Stratified Random Sampling
Kończąc analizę lub badanie grupy podmiotów o podobnych cechach, badacz może stwierdzić, że liczebność populacji jest zbyt duża, aby przeprowadzić badanie. Aby zaoszczędzić czas i pieniądze, analityk może przyjąć bardziej wykonalne podejście, wybierając małą grupę z populacji. Mała grupa jest określana jako wielkość próby, która jest podzbiorem populacji używanym do reprezentowania całej populacji. Próbkę można wybrać z populacji na wiele sposobów, z których jednym jest losowa metoda warstwowego doboru próby.
Warstwowe losowe pobieranie próbek polega na podzieleniu całej populacji na jednorodne grupy zwane warstwami (liczba mnoga dla warstwy). Następnie losowe próbki są wybierane z każdej warstwy. Weźmy na przykład badacza akademickiego, który chciałby poznać liczbę studentów MBA w 2007 roku, którzy otrzymali ofertę pracy w ciągu trzech miesięcy od ukończenia studiów.
Wkrótce okaże się, że w tym roku było prawie 200 000 absolwentów MBA. Mógł zdecydować się zwykłej próby losowej 50.000 absolwentów i prowadzić badania. Co więcej, mógłby podzielić populację na warstwy i pobrać z nich losową próbkę. W tym celu utworzyłby grupy ludności w oparciu o płeć, przedział wiekowy, rasę, kraj narodowości i karierę zawodową. Z każdej warstwy pobierana jest losowa próbka w liczbie proporcjonalnej do jej wielkości w porównaniu z populacją. Te podzbiory warstw są następnie łączone, aby utworzyć losową próbkę.
[Ważne: próbkowanie warstwowe służy do uwydatnienia różnic między grupami w populacji, w przeciwieństwie do prostego próbkowania losowego, które traktuje wszystkich członków populacji jako równych, z jednakowym prawdopodobieństwem brania próby.]
Przykład losowego próbkowania warstwowego
Załóżmy, że zespół badawczy chce określić średnią ocen studentów w całych Stanach Zjednoczonych. Zespół badawczy ma trudności ze zbieraniem danych od wszystkich 21 milionów studentów; decyduje się na losową próbę populacji, wykorzystując 4000 uczniów.
Teraz załóżmy, że zespół przygląda się różnym atrybutom uczestników próby i zastanawia się, czy istnieją jakieś różnice w GPA i kierunkach studiów. Załóżmy, że okaże się, że 560 studentów to kierunki angielskie, 1135 to kierunki ścisłe, 800 to kierunki informatyczne, 1090 to kierunki inżynierskie, a 415 to kierunki matematyczne. Zespół chce użyć proporcjonalnej losowej próby warstwowej, w której warstwa próby jest proporcjonalna do próby losowej w populacji.
Załóżmy, że zespół bada dane demograficzne studentów szkół wyższych w USA i znajduje procent studentów na kierunkach: 12% kierunek angielski, 28% nauki ścisłe, 24% informatyka, 21% inżynieria i 15% kierunek matematyka. W ten sposób powstaje pięć warstw z procesu losowego losowania warstwowego.
Zespół musi następnie potwierdzić, że warstwa populacji jest proporcjonalna do warstwy w próbie; jednak stwierdzają, że proporcje nie są równe. Następnie zespół musi ponownie zbadać 4000 uczniów z populacji i losowo wybrać 480 studentów języka angielskiego, 1120 przedmiotów ścisłych, 960 informatyków, 840 inżynierów i 600 studentów matematyki.
Dzięki temu ma proporcjonalną, warstwową próbę losową studentów, co zapewnia lepszą reprezentację kierunków studiów studentów w Stanach Zjednoczonych..
Proste losowe i warstwowe próbki losowe
Proste próby losowe i warstwowe próby losowe są narzędziami do pomiaru statystycznego. Do reprezentacji całej populacji danych używana jest prosta próba losowa. Warstwowa próba losowa dzieli populację na mniejsze grupy lub warstwy na podstawie wspólnych cech.
Prosta próba losowa jest często używana, gdy dostępnych jest bardzo mało informacji na temat populacji danych, gdy populacja danych ma zbyt wiele różnic, aby można ją było podzielić na różne podzbiory lub gdy w populacji danych występuje tylko jedna odrębna cecha.
Na przykład firma cukiernicza może chcieć zbadać zwyczaje zakupowe swoich klientów, aby określić przyszłość swojej linii produktów. Jeśli jest 10 000 klientów, może wybrać 100 z nich jako próbę losową. Następnie może zastosować to, co znajdzie od tych 100 klientów, do pozostałej części swojej bazy. W przeciwieństwie do stratyfikacji, będzie wybierać 100 członków wyłącznie losowo, bez względu na ich indywidualne cechy.
Proporcjonalna i nieproporcjonalna stratyfikacja
Warstwowe losowe pobieranie próbek zapewnia, że każda podgrupa danej populacji jest odpowiednio reprezentowana w całej populacji próbnej badania badawczego. Stratyfikacja może być proporcjonalna lub nieproporcjonalna. W metodzie warstwowej proporcjonalnej wielkość próby w każdej warstwie jest proporcjonalna do wielkości populacji tej warstwy.
Na przykład, jeśli badacz chciał mieć próbę 50 000 absolwentów z uwzględnieniem przedziału wiekowego, proporcjonalna losowa próba warstwowa zostanie uzyskana przy użyciu następującego wzoru: (wielkość próby / wielkość populacji) x wielkość warstwy. Poniższa tabela zakłada wielkość populacji 180 000 absolwentów MBA rocznie.
Wielkość próby warstw dla absolwentów MBA w wieku od 24 do 28 lat oblicza się jako (50 000/180 000) x 90 000 = 25 000. Ta sama metoda jest stosowana w przypadku innych grup wiekowych. Teraz, gdy znana jest wielkość próby warstw, badacz może przeprowadzić proste losowanie próby w każdej warstwie, aby wybrać uczestników badania. Innymi słowy, 25 000 absolwentów z grupy wiekowej 24-28 lat zostanie wybranych losowo z całej populacji, 16 667 absolwentów w przedziale wiekowym 29-33 zostanie losowo wybranych z populacji i tak dalej.
W nieproporcjonalnie wielowarstwowej próbie wielkość każdej warstwy nie jest proporcjonalna do jej wielkości w populacji. Badacz może zdecydować się na wybranie próby 1/2 absolwentów w grupie wiekowej 34-37 lat i 1/3 absolwentów w grupie wiekowej 29-33 lata.
Należy zauważyć, że jedna osoba nie może zmieścić się w wielu warstwach. Każdy podmiot musi mieścić się tylko w jednej warstwie. Nakładanie się podgrup oznacza, że niektóre osoby będą miały większe szanse na wybranie do badania, co całkowicie neguje koncepcję losowania warstwowego jako rodzaju próbkowania według prawdopodobieństwa.
Zarządzający portfelami mogą korzystać z losowego próbkowania warstwowego do tworzenia portfeli poprzez replikację indeksu, takiego jak indeks obligacji.
Zalety losowego próbkowania warstwowego
Główną zaletą losowego próbkowania warstwowego jest to, że wychwytuje kluczowe cechy populacji w próbie. Podobnie jak w przypadku średniej ważonej, ta metoda pobierania próbek daje cechy w próbie, które są proporcjonalne do całej populacji. Losowe próbkowanie warstwowe działa dobrze w przypadku populacji o różnych cechach, ale poza tym jest nieskuteczne, jeśli nie można utworzyć podgrup.
Stratyfikacja daje mniejszy błąd w szacowaniu i większą precyzję niż prosta metoda losowego pobierania próbek. Im większe różnice między warstwami, tym większy przyrost precyzji.
Wady losowego próbkowania warstwowego
Niestety, ta metoda badań nie może być stosowana w każdym badaniu. Wadą tej metody jest to, że musi być spełnionych kilka warunków, aby mogła być prawidłowo stosowana. Badacze muszą zidentyfikować każdego członka badanej populacji i zaklasyfikować każdego z nich do jednej i tylko jednej subpopulacji. W rezultacie losowe próbkowanie warstwowe jest niekorzystne, gdy naukowcy nie mogą z całą pewnością zaklasyfikować każdego członka populacji do podgrupy. Również znalezienie wyczerpującej i ostatecznej listy całej populacji może być trudne.
Nakładanie się może stanowić problem, jeśli istnieją przedmioty należące do wielu podgrup. Kiedy przeprowadza się proste losowe pobieranie próbek, istnieje większe prawdopodobieństwo, że zostaną wybrani ci, którzy należą do wielu podgrup. Rezultatem może być błędne przedstawienie lub niedokładne odzwierciedlenie populacji.
Powyższe przykłady ułatwiają: studia licencjackie, magisterskie, mężczyźni i kobiety to jasno zdefiniowane grupy. W innych sytuacjach może to być jednak znacznie trudniejsze. Wyobraź sobie, że łączysz takie cechy, jak rasa, pochodzenie etniczne lub religia. Proces sortowania staje się trudniejszy, co sprawia, że losowe próbkowanie warstwowe jest metodą nieefektywną i mniej niż idealną.