Kiedy lepiej jest używać prostego próbkowania losowego, a kiedy systematycznego? - KamilTaylan.blog
5 maja 2021 6:47

Kiedy lepiej jest używać prostego próbkowania losowego, a kiedy systematycznego?

W ramach prostego losowego próbkowania próbka pozycji jest wybierana losowo z populacji, a każda pozycja ma równe prawdopodobieństwo wyboru. Proste losowe pobieranie próbek wykorzystuje tabelę liczb losowych lub elektroniczny generator liczb losowych do wybierania elementów do próby. Na przykład loteria działa w oparciu o proste losowanie losowe, przy czym wszystkie liczby mają równe prawdopodobieństwo, że zostaną wybrane. Tymczasem systematyczne próbkowanie obejmuje wybieranie pozycji z uporządkowanej populacji przy użyciu pomijania lub interwału próbkowania. Oznacza to, że każda „ n- ta” próbka danych jest wybierana z dużego zbioru danych. Stosowanie systematycznego pobierania próbek jest bardziej odpowiednie niż zwykłe losowe pobieranie próbek, gdy budżet projektu jest napięty i wymaga prostoty wykonania i zrozumienia wyników badania. Systematyczne pobieranie próbek jest lepsze niż losowe pobieranie próbek, gdy dane nie wykazują wzorców i istnieje niskie ryzyko manipulacji danymi przez badacza, ponieważ jest to często tańsza i prostsza metoda pobierania próbek.

Kluczowe wnioski

  • W prostym losowym próbkowaniu każdy punkt danych ma równe prawdopodobieństwo wyboru. W międzyczasie systematyczne próbkowanie wybiera punkt danych na każdy z góry określony interwał.
  • Chociaż systematyczne próbkowanie jest łatwiejsze do wykonania niż proste próbkowanie losowe, może dawać wypaczone wyniki, jeśli zestaw danych wykazuje wzorce. Jest też łatwiejszy w manipulowaniu.
  • Wręcz przeciwnie, proste losowe pobieranie próbek jest najlepsze w przypadku mniejszych zestawów danych i może dać bardziej reprezentatywne wyniki.

Prostota wykonania

Proste losowe pobieranie próbek wymaga, aby każdy element populacji był oddzielnie identyfikowany i wybierany, podczas gdy systematyczne pobieranie próbek opiera się na zasadzie interwału próbkowania w celu wybrania wszystkich osobników. Jeśli wielkość populacji jest niewielka lub wielkość poszczególnych prób i ich liczba jest stosunkowo niewielka, próbkowanie losowe zapewnia najlepsze wyniki, ponieważ wszyscy kandydaci mają równe szanse na wybranie. Jednak wraz ze wzrostem wymaganej wielkości próby i konieczności utworzenia przez badacza wielu próbek z populacji może to być bardzo czasochłonne i kosztowne. W rezultacie systematyczne pobieranie próbek staje się metodą preferowaną w takich okolicznościach.

Obecność wzoru

Systematyczne pobieranie próbek jest lepsze niż proste pobieranie próbek losowych, gdy w danych nie ma żadnego wzoru. Jeśli jednak populacja nie jest przypadkowa, badacz naraża się na dobór elementów do próby, które mają te same cechy. Na przykład, jeśli co ósmy widżet w fabryce został uszkodzony z powodu pewnej niesprawnej maszyny, badacz jest bardziej skłonny wybrać te zepsute widżety za pomocą systematycznego próbkowania niż w przypadku prostego próbkowania losowego, co skutkuje błędną próbką.

Manipulacja danymi

Decydując, kiedy zastosować systematyczne pobieranie próbek, należy wziąć pod uwagę, że zawsze istnieje ryzyko manipulacji, która stanowi zagrożenie dla przeprowadzenia pouczającego i przejrzystego badania. W tym duchu, w przypadkach, gdy ryzyko manipulacji danymi jest niskie, systematyczne pobieranie próbek jest lepsze niż proste pobieranie losowe ze względu na łatwość użycia. Jeśli jednak takie ryzyko jest wysokie, gdy badacz może manipulować długością interwału, aby uzyskać pożądane wyniki – na przykład, będąc w stanie zmienić każdą setną liczbę pobieraną w systematycznej próbie – bardziej odpowiednia byłaby prosta technika losowego pobierania próbek.