Próbkowanie systematyczne a próbkowanie klastrowe: jaka jest różnica? - KamilTaylan.blog
5 maja 2021 6:18

Próbkowanie systematyczne a próbkowanie klastrowe: jaka jest różnica?

Systematyczne próbkowanie a próbkowanie klastrowe: przegląd

Systematyczne próbkowanie i próbkowanie klastrów to dwa różne rodzaje miar statystycznych używanych przez badaczy, analityków i sprzedawców do badania próbek populacji.

Sposób, w jaki zarówno systematyczne, jak i próbkowanie grupowe pobierają punkty próbkowania z populacji, jest różny. Podczas gdy systematyczne pobieranie próbek wykorzystuje stałe interwały z większej populacji do tworzenia próby, próbkowanie grupowe dzieli populację na różne skupienia.

Systematyczne pobieranie próbek wybiera losowy punkt wyjścia z populacji, a następnie próbkę pobiera się z regularnych stałych przedziałów populacji w zależności od jej wielkości. Próbkowanie klastrowe dzieli populację na klastry, a następnie pobiera prostą próbę losową z każdego skupienia.1 W tym artykule omówimy różnice między tymi typami próbkowania, ich zalety i wady, kiedy najlepiej jest ich używać, a także przykłady każdego z nich.

Kluczowe wnioski

  • Systematyczne próbkowanie i próbkowanie klastrów są miarami statystycznymi używanymi przez badaczy, analityków i sprzedawców do badania próbek populacji.
  • Systematyczne pobieranie próbek obejmuje wybieranie stałych odstępów czasu z większej populacji w celu utworzenia próbki.
  • Próbkowanie klastrowe dzieli populację na grupy, a następnie pobiera losową próbkę z każdego skupienia.
  • Zarówno systematyczne próbkowanie, jak i próbkowanie klastrów są formami próbkowania losowego, znanego jako próbkowanie według prawdopodobieństwa, które jest przeciwieństwem próbkowania bez prawdopodobieństwa.
  • Systematyczne pobieranie próbek i próbkowanie grupowe mają swoje zalety i wady, ale oba mogą być oszczędne pod względem czasu i kosztów.

Systematyczne pobieranie próbek

Systematyczne pobieranie próbek jest metodą losowego doboru próby. To jedna z najpopularniejszych i najpopularniejszych metod stosowanych przez badaczy i analityków. Ta metoda polega na wybieraniu próbek z większej grupy. Chociaż punkt wyjścia może być losowy, pobieranie próbek obejmuje ustalone odstępy czasu między każdym elementem.

Oto jak to działa. Badacz zaczyna od wybrania punktu wyjścia z większej populacji. Zwykle ma postać liczby całkowitej, która musi być mniejsza niż liczba badanych w większej populacji. Następnie analityk wybiera odstęp między poszczególnymi członkami; że jest to konsekwentna różnica między każdym członkiem. Oto hipotetyczny przykład. Powiedzmy, że w badaniu uczestniczy 100 osób. Badacz zaczyna od osoby na 10. miejscu. Następnie decydują się na wybór co siódmej osoby. Oznacza to, że w losowaniu wybierane są osoby z następujących miejsc: 10, 17, 24, 31, 38, 45 i tak dalej.

Zalety i wady systematycznego pobierania próbek

Ten rodzaj statystycznego próbkowania jest dość prosty, dlatego jest generalnie preferowany przez badaczy. Jest również bardzo przydatny do pewnych celów w finansach. Ci, którzy używają tej metody, zakładają, że wyniki reprezentują większość normalnych populacji. Ten proces gwarantuje również równomierne próbkowanie całej populacji. Ale mogą wystąpić problemy z tego rodzaju próbkowaniem. Na przykład ryzyko manipulacji danymi może być większe, ponieważ osoby stosujące tę metodę mogą wybierać podmioty i przedziały czasowe na podstawie pożądanego wyniku.

Systematyczne pobieranie próbek jest proste do przeprowadzenia i łatwe do zrozumienia. Statystycy, którzy mogą mieć ograniczenia budżetowe lub czasowe, uważają, że systematyczne pobieranie próbek jest korzystne pod względem tworzenia, porównywania i rozumienia swoich próbek. Ponadto systematyczne pobieranie próbek zapewnia wyższy stopień kontroli w porównaniu z innymi metodami pobierania próbek ze względu na jego proces.

Systematyczne pobieranie próbek eliminuje również selekcję klastrową, w której losowo wybrane próbki w populacji są nienaturalnie blisko siebie. Próbki losowe, w przeciwieństwie do systematycznych, są w stanie usunąć to zjawisko jedynie poprzez przeprowadzenie wielu badań lub zwiększenie liczby próbek; z których oba mogą być czasochłonne i kosztowne. Systematyczne pobieranie próbek wiąże się również z czynnikiem niskiego ryzyka, ponieważ istnieje niewielkie prawdopodobieństwo, że dane mogą zostać zanieczyszczone.

Pomimo wielu zalet systematyczne pobieranie próbek ma wady. Podstawowym ograniczeniem systematycznego pobierania próbek jest to, że potrzebna jest wielkość populacji. Bez określonej liczby uczestników w populacji systematyczne pobieranie próbek nie działa dobrze. Na przykład, jeśli statystyk chciałby zbadać wiek osób bezdomnych w określonym regionie, ale nie może dokładnie określić, ile jest osób bezdomnych, wówczas nie będzie miał liczebności populacji ani punktu wyjścia.

Inną wadą jest to, że populacja musi mieć naturalną ilość losowości. Jeśli tak się nie stanie, zwiększa się ryzyko wyboru podobnych instancji, co jest sprzeczne z celem próby.

Przykład systematycznego pobierania próbek

Celem systematycznego pobierania próbek jest uzyskanie nieobciążonej próbki. Metodą, w której można to osiągnąć, jest przypisanie liczby każdemu uczestnikowi populacji, a następnie wybranie tego samego wyznaczonego przedziału w populacji w celu utworzenia próbki.

Na przykład, możesz wybrać co piątego uczestnika lub co dwudziestego, ale musisz wybrać tego samego w każdej populacji. Proces wybierania tej n-tej liczby jest systematycznym próbkowaniem.

Na przykład firma produkująca pasty do zębów tworzy nowy smak pasty do zębów i chciałaby przetestować ją na próbnej populacji przed sprzedażą jej opinii publicznej. Test ma na celu określenie, czy próbka dobrze odbiera nowy aromat, czy nie. Firma gromadzi populację 50 osób i decyduje się na systematyczne pobieranie próbek, aby utworzyć próbę 10 osób, których opinie na temat pasty do zębów będą brane pod uwagę.

Najpierw zespół marketingowy przypisuje numer każdemu uczestnikowi populacji. W tym przypadku ma populację 50 osób w grupie, więc każdemu uczestnikowi przypisze liczbę od 1 do 50. Następnie musi określić, jak dużą próbę chce mieć i wyznaczył wielkość próby 10. Dlatego 50/10 = 5. Pięć będzie cyfrą próbkowania; co oznacza, że ​​wybierze co piątego uczestnika populacji, aby dotrzeć do swojej próby. Przedstawiono to w poniższej tabeli, w której co piąty uczestnik jest pogrubiony i jest to osoba wybrana do próby.

Próbkowanie klastrów

Próbkowanie klastrów to kolejny rodzaj losowej miary statystycznej. Ta metoda jest stosowana, gdy w większej populacji występują różne podzbiory grup. Grupy te są znane jako klastry. Próbkowanie klastrów jest powszechnie stosowane przez grupy marketingowe i profesjonalistów.



Próbując zbadać demografię miasta, miejscowości lub dzielnicy, najlepiej jest skorzystać z próbkowania klastrów, ze względu na dużą liczebność populacji.

Próbkowanie klastrów jest procedurą dwuetapową. Najpierw cała populacja jest wybierana i rozdzielana na różne klastry. Następnie z tych podgrup wybiera się losowe próbki. Na przykład badaczowi może być trudno przeprowadzić wywiad z całą populacją klientów sklepu spożywczego. Mogą jednak być w stanie utworzyć losowy podzbiór sklepów; stanowi to pierwszy krok w procesie. Drugim krokiem jest wywiady z losową próbą klientów tych sklepów.

Rodzaje próbkowania klastrów

Istnieją dwa rodzaje próbkowania skupień: jednostopniowe próbkowanie skupień i dwustopniowe próbkowanie klastrów.

Jednostopniowe próbkowanie klastrów obejmuje wybranie losowej próby klastrów i zebranie danych od każdego podmiotu w tym klastrze. Dwuetapowe próbkowanie klastrów polega na losowym wybieraniu wielu klastrów i losowym wybieraniu określonych przedmiotów w każdym klastrze, aby utworzyć ostateczną próbę. Próbkowanie dwuetapowe można postrzegać jako podzbiór próbkowania jednostopniowego: pobieranie próbek niektórych elementów z utworzonych klastrów.

Zalety i wady próbkowania klastrów

Ta metoda pobierania próbek może być stosowana, gdy wypełnienie listy całej populacji jest trudne, jak pokazano w powyższym przykładzie. Jest to prosty, ręczny proces, który pozwala zaoszczędzić czas i pieniądze.

W rzeczywistości korzystanie z próbkowania klastrów może być dość tanie w porównaniu z innymi metodami. Dzieje się tak, ponieważ generalnie wiąże się to z mniejszymi kosztami i wydatkami, ponieważ próbkowanie klastrów wymaga losowego wyboru wybranych klastrów, a nie oceny całych populacji. Ten sam proces pozwala również na zwiększenie wielkości próby. Ponieważ statystyka wybiera tylko z wybranej grupy klastrów, może zwiększyć liczbę podmiotów do próby z tego skupienia.

Podstawową wadą próbkowania klastrów jest to, że wiąże się z nim większy błąd próbkowania, co czyni go mniej precyzyjnym niż inne metody próbkowania. Dzieje się tak, ponieważ podmioty w klastrze mają zwykle podobne cechy, co oznacza, że ​​próbkowanie klastrów nie obejmuje zróżnicowanych danych demograficznych populacji. Często prowadzi to do nadreprezentacji lub niedoreprezentacji w klastrze, a zatem może być próbą tendencyjną.

Przykład próbkowania klastra

Załóżmy na przykład, że prowadzone jest badanie akademickie w celu ustalenia, ilu pracowników banków inwestycyjnych posiada tytuły MBA, a spośród tych MBA, ilu pochodzi ze szkół Ivy League. Statystyk miałby trudności z udaniem się do każdego banku inwestycyjnego i zapytaniem każdego pracownika o jego wykształcenie. Aby osiągnąć ten cel, statystyk może zastosować próbkowanie klastrów.

Pierwszym krokiem byłoby utworzenie klastra banków inwestycyjnych. Zamiast badać każdy bank inwestycyjny, statystyk może zdecydować się na zbadanie trzech największych banków inwestycyjnych na podstawie przychodów, tworząc pierwszy klaster. Stamtąd, zamiast przeprowadzać wywiady z każdym pracownikiem we wszystkich trzech bankach inwestycyjnych, statystyk mógłby utworzyć inny klaster, który obejmowałby pracowników tylko z niektórych działów, na przykład sprzedaży i handlu lub fuzji i przejęć.

Ta metoda umożliwia statystykowi zawężenie rozmiaru próby, czyniąc ją bardziej wydajną i opłacalną, a jednocześnie mając wystarczająco zróżnicowaną próbkę, aby ocenić poszukiwane informacje.

Uwagi specjalne

Chociaż zarówno systematyczne pobieranie próbek, jak i próbkowanie klastrów są formami próbkowania losowego, dochodzą do wielkości próby na zupełnie inne sposoby. Systematyczne próbkowanie wybiera próbkę na podstawie stałych odstępów w populacji, podczas gdy próbkowanie klastrów tworzy klaster z populacji.

Próbkowanie klastrów jest lepiej dostosowane do sytuacji, gdy w określonej populacji istnieją różne podzbiory, podczas gdy systematyczne pobieranie próbek jest lepiej stosowane, gdy znana jest cała lista lub liczba populacji. Obaj jednak dzielą populację na mniejsze jednostki do próby.

W przypadku systematycznego próbkowania ważne jest, aby upewnić się, że w grupie nie ma żadnych wzorców, w przeciwnym razie ryzykujesz wybranie podobnych pacjentów bez reprezentowania całej populacji. W przypadku próbkowania klastrów ważne jest, aby upewnić się, że każdy klaster ma podobne cechy do całej próbki.

Często zadawane pytania dotyczące próbkowania klastrów

Co oznacza próbkowanie klastrów?

Próbkowanie klastrów to forma losowego próbkowania, która dzieli populację na klastry w celu utworzenia próby. Kolejne klastry można również utworzyć z początkowych klastrów, aby zawęzić próbę.

Dlaczego miałbyś używać próbkowania klastrowego?

Próbkowanie klastrowe najlepiej sprawdza się przy badaniu dużych, rozproszonych populacji, gdzie próba przesłuchania każdego podmiotu byłaby kosztowna, czasochłonna i być może niemożliwa. Próbkowanie klastrów pozwala na tworzenie klastrów, które są mniejszą reprezentacją ocenianej populacji i mają podobne cechy.

Jak działa próbkowanie klastrów?

Próbkowanie klastrów polega po prostu na podzieleniu badanej populacji na mniejsze grupy. Te podgrupy można badać lub dalej losowo podzielić na inne podgrupy.

Jaka jest różnica między próbkowaniem klastrowym a próbkowaniem warstwowym?

Podstawowa różnica między próbkowaniem klastrów a próbkowaniem warstwowym polega na tym, że klastry utworzone w próbkowaniu klastrów są niejednorodne, podczas gdy grupy do próbkowania warstwowego są jednorodne.

Podsumowanie

Istnieje wiele metod próbkowania dostępnych dla statystyków, którzy chcą badać informacje w grupach. Ponieważ grupy lub populacje są zwykle duże, bardzo trudno jest uzyskać dane od każdego osobnika. Aby przezwyciężyć ten problem, statystycy używają próbkowania, tworząc mniejsze grupy, które mają być reprezentatywne dla większej populacji.

Ważnym aspektem tworzenia tych mniejszych próbek jest upewnienie się, że są wybierane losowo i stanowią prawdziwą reprezentację większej populacji. Systematyczne pobieranie próbek i próbkowanie klastrów to dwie metody, których statystycy mogą używać do badania populacji.

Obie są formami losowego pobierania próbek, które mogą być oszczędne pod względem czasu i kosztów, dzieląc populacje na mniejsze grupy w celu łatwiejszej analizy. Systematyczne pobieranie próbek działa najlepiej, gdy znana jest cała populacja, podczas gdy próbkowanie grupowe działa najlepiej, gdy cała populacja jest trudna do zmierzenia.