Dobroć dopasowania - KamilTaylan.blog
4 maja 2021 19:58

Dobroć dopasowania

Co to jest dobroć dopasowania?

Test zgodności jest testem hipotezy statystycznej służącym do sprawdzenia, jak dobrze dane próbki pasują do rozkładu z populacji o rozkładzie normalnym. Inaczej mówiąc, ten test pokazuje, czy dane próbki reprezentują dane, których można się spodziewać w rzeczywistej populacji, czy też są w jakiś sposób wypaczone. Dobroć dopasowania ustala rozbieżność między wartościami obserwowanymi a tymi, których można by oczekiwać od modelu w przypadku rozkładu normalnego.

Istnieje wiele metod określania dobroci dopasowania. Niektóre z najpopularniejszych metod stosowanych w statystykach obejmują chi-kwadrat, test Kołmogorowa-Smirnowa, test Andersona-Darlinga i test Shipiro-Wilka.

Kluczowe wnioski

  • Testy zgodności to testy statystyczne, których celem jest określenie, czy zbiór obserwowanych wartości jest zgodny z oczekiwanymi w ramach obowiązującego modelu.
  • Istnieje wiele typów testów zgodności, ale najczęściej stosowany jest test chi-kwadrat.
  • Chi-kwadrat określa, czy istnieje związek między danymi jakościowymi.
  • Test Kołmogorowa-Smirnowa – stosowany w przypadku dużych próbek – określa, czy próbka pochodzi z określonego rozkładu populacji.
  • Testy zgodności mogą pokazać, czy dane próbki pasują do oczekiwanego zestawu danych z populacji o rozkładzie normalnym.

Zrozumienie dobroci dopasowania

Testy zgodności są metodami statystycznymi często używanymi do wnioskowania o obserwowanych wartościach. Testy te określają, w jakim stopniu rzeczywiste wartości są powiązane z wartościami przewidywanymi w modelu, a gdy są stosowane w procesie decyzyjnym, testy zgodności mogą pomóc w przewidywaniu przyszłych trendów i wzorców.

Najpowszechniejszym testem zgodności jest test chi-kwadrat, zwykle używany w przypadku rozkładów dyskretnych. Test chi-kwadrat jest używany wyłącznie do danych umieszczonych w klasach (przedziałach) i wymaga wystarczającej wielkości próby, aby uzyskać dokładne wyniki.



Testy zgodności są powszechnie stosowane do testowania normalności reszt lub określania, czy dwie próbki są zbierane z identycznych rozkładów.

Rodzaje testów zgodności

Test chi-kwadrat

Test chi-kwadrat, znany również jako test niezależności chi-kwadrat, jest metodą statystyki wnioskowania, która sprawdza ważność twierdzenia dotyczącego populacji na podstawie próby losowej. Nie wskazuje jednak na rodzaj ani intensywność związku. Na przykład nie stwierdza, czy związek jest pozytywny, czy negatywny.



Aby kwalifikować się do testu niezależności chi-kwadrat, zmienne muszą się wzajemnie wykluczać.

Aby obliczyć dobroć dopasowania chi-kwadrat, konieczne jest ustawienie pożądanego poziomu istotności alfa (np. Jeśli poziom ufności wynosi 95% lub 0,95, wówczas alfa wynosi 0,05), zidentyfikuj zmienne jakościowe na przetestować i zdefiniować hipotezy dotyczące relacji między nimi. Hipoteza zapewnia, że nie istnieje żadna zależność od zmiennych i hipoteza alternatywna zakłada się, że istnieje związek. Częstotliwość obserwowanych wartości jest mierzona, a następnie używana z wartościami oczekiwanymi i stopniami swobody do obliczenia chi-kwadrat. Jeśli wynik jest niższy niż alfa, hipoteza zerowa jest nieprawidłowa, co wskazuje na związek między zmiennymi.

Test Kołmogorowa-Smirnowa

re=max⁡1≤ja≤N(fa(Yja)-ja-1N,jaN-fa(Yja))D = \ max \ limits_ {1 \ leq i \ leq N} \ bigg (F (Y_i) – \ frac {i-1} {N}, \ frac {i} {N} -F (Y_i) \ bigg)re=1≤i≤N.maxWcześniejsze( F(YjaWcześniejsze)-N

Nazwany na cześć rosyjskich matematyków Andrieja Kołmogorowa i Nikołaja Smirnowa, test Kołmogorowa-Smirnowa (znany również jako test KS) jest metodą statystyczną, która określa, czy próbka pochodzi z określonego rozkładu w populacji. Test Kołmogorowa-Smirnowa – zalecany dla dużych próbek (np. Ponad 2000) – jest nieparametryczny, co oznacza, że ​​nie wymaga żadnego rozkładu, aby był poprawny. Koncentruje się Celem jest udowodnienie hipotezy zerowej, która jest próbką rozkładu normalnego.

W przeciwieństwie do testu chi-kwadrat, test Kołmogorowa-Smirnowa ma zastosowanie do rozkładów ciągłych. Podobnie jak chi-kwadrat, wykorzystuje hipotezę zerową i alternatywną oraz poziom istotności alfa. Null wskazuje, że dane są zgodne z określonym rozkładem w populacji, a alternatywa wskazuje, że dane nie były zgodne z określonym rozkładem w populacji. Alfa służy do określenia wartości krytycznej używanej w teście.

Obliczona statystyka testowa, często oznaczana jako D, określa, czy hipoteza zerowa jest akceptowana, czy odrzucana. Jeśli D jest większe niż wartość krytyczna w alfa, hipoteza zerowa jest odrzucana. Jeśli D jest mniejsze niż wartość krytyczna, hipoteza zerowa jest akceptowana, wskazując

Test Shipiro-Wilka

Test Shipiro-Wilka określa, czy próbka ma rozkład normalny. Używając próbki z jedną zmienną danych ciągłych, test Shipiro-Wilka sprawdza tylko normalność. Jest zalecany dla małych próbek do 2000. Podobnie jak inne, wykorzystuje alfa i formułuje dwie hipotezy: zerową i alternatywną. Hipoteza zerowa stwierdza, że ​​próbka pochodzi z rozkładu normalnego, podczas gdy hipoteza alternatywna stwierdza, że ​​próbka nie pochodzi z rozkładu normalnego.

Test Shipiro-Wilka wykorzystuje wykres prawdopodobieństwa zwany wykresem QQ. Ten wykres rozrzutu wizualnie przedstawia dwa zestawy kwantyli na osi y, ułożone od najmniejszego do największego. Jeśli każdy kwantyl pochodzi z tego samego rozkładu, wykres rozrzutu wyświetli liniową serię wykresów. Test Shipiro-Wilka wykorzystuje wykres QQ do oszacowania wariancji. Korzystając z wariancji wykresu QQ wraz z oszacowaną wariancją populacji, można określić, czy próbka należy do rozkładu normalnego. Jeżeli iloraz obu wariancji jest równy lub bliski 1, wówczas hipoteza zerowa może zostać przyjęta. Jeśli jest znacznie niższa niż 1, może zostać odrzucona.

Przykład testu dopasowania

Na przykład mała społeczna siłownia może działać przy założeniu, że ma największą frekwencję w poniedziałki, wtorki i soboty, średnią frekwencję w środy i czwartki, a najniższą w piątki i niedziele. Opierając się na tych założeniach, siłownia zatrudnia każdego dnia pewną liczbę pracowników, którzy przyjmują członków, sprzątają pomieszczenia, oferują usługi szkoleniowe i prowadzą zajęcia.

Jednak siłownia nie radzi sobie dobrze finansowo i właściciel chce wiedzieć, czy te założenia dotyczące frekwencji i poziomu zatrudnienia są prawidłowe. Właściciel decyduje się codziennie przez sześć tygodni liczyć liczbę osób uczęszczających na siłownię. Następnie może porównać zakładaną frekwencję na siłowni z obserwowaną frekwencją, używając na przykład testu zgodności chi-kwadrat. Dzięki nowym danym może określić, jak najlepiej zarządzać siłownią i poprawiać rentowność.

Często zadawane pytania dotyczące dobroci dopasowania

Co oznacza dobroć dopasowania?

Dobroć dopasowania to statystyczny test hipotezy używany do sprawdzania, jak dokładnie obserwowane dane odzwierciedlają oczekiwane dane. Testy dobroci dopasowania mogą pomóc określić, czy próbka ma rozkład normalny, czy zmienne kategorialne są ze sobą powiązane, czy też próbki losowe pochodzą z tego samego rozkładu.

Dlaczego dobroć dopasowania jest ważna?

Testy dopasowania pomagają określić, czy obserwowane dane są zgodne z oczekiwaniami. Decyzje można podjąć na podstawie wyniku przeprowadzonego testu hipotez. Na przykład sprzedawca chce wiedzieć, jaki produkt podoba się młodym ludziom. Sprzedawca bada losowo wybraną próbę osób starszych i młodych, aby określić, który produkt jest preferowany. Korzystając z chi-kwadrat, stwierdzili, że z 95% pewnością istnieje związek między produktem A a młodymi ludźmi. Na podstawie tych wyników można było stwierdzić, że ta próbka reprezentuje populację młodych dorosłych. Sprzedawcy detaliczni mogą to wykorzystać do zreformowania swoich kampanii.

Czym jest dobroć dopasowania w teście Chi-kwadrat?

Test chi-kwadrat, czy istnieją zależności między zmiennymi kategorialnymi i czy próbka reprezentuje całość. Szacuje, jak dokładnie obserwowane dane odzwierciedlają oczekiwane dane lub jak dobrze pasują.

Jak przeprowadzasz test dopasowania?

Test dobroci FIt składa się z różnych metod testowania. Cel testu pomoże określić, której metody użyć. Na przykład, jeśli celem jest sprawdzenie normalności na stosunkowo małej próbce, odpowiedni może być test Shipiro-Wilka. Jeśli chcesz ustalić, czy próbka pochodzi z określonego rozkładu w populacji, zostanie użyty test Kołmogorowa-Smirnowa. Każdy test wykorzystuje własną, unikalną formułę. Mają jednak cechy wspólne, takie jak hipoteza zerowa i poziom istotności.

Podsumowanie

Testy zgodności określają, jak dobrze dane próbki pasują do tego, czego oczekuje się od populacji. Z danych próbki, obserwowana wartość jest zbierana i porównywana z obliczoną wartością oczekiwaną za pomocą miary rozbieżności. W zależności od tego, jakiego wyniku szukasz, dostępne są różne testy hipotez zgodności.

Wybór odpowiedniego testu zgodności w dużej mierze zależy od tego, co chcesz wiedzieć o próbce i jak duża jest próbka. Na przykład, jeśli chcesz wiedzieć, czy obserwowane wartości dla danych jakościowych odpowiadają oczekiwanym wartościom dla danych jakościowych, użyj chi-kwadrat. Jeśli chcesz wiedzieć, czy mała próbka ma rozkład normalny, test Shipiro-Wilka może być korzystny. Dostępnych jest wiele testów pozwalających określić dopasowanie.