Analiza wariancji (ANOVA)
Co to jest analiza wariancji (ANOVA)?
Analiza wariancji (ANOVA) to narzędzie analityczne używane w statystykach, które dzieli obserwowaną zagregowaną zmienność znalezioną w zestawie danych na dwie części: czynniki systematyczne i czynniki losowe. Czynniki systematyczne mają statystyczny wpływ na dany zbiór danych, natomiast czynniki losowe nie. Analitycy używają testu ANOVA do określenia wpływu, jaki mają zmienne niezależne na zmienną zależną w badaniu regresji.
Opracowane w XX wieku metody testów t i z były wykorzystywane do analizy statystycznej do 1918 r., Kiedy to Ronald Fisher stworzył metodę analizy wariancji.1 ANOVA nazywana jest również analizą wariancji Fishera i stanowi rozszerzenie testów t i z. Termin stał się dobrze znany w 1925 r., Po ukazaniu się w książce Fishera „Statystyczne metody dla pracowników naukowych”. Został zastosowany w psychologii eksperymentalnej, a później rozszerzony na tematy, które były bardziej złożone.
Wzór na ANOVA to:
Co ujawnia analiza wariancji?
Test ANOVA jest pierwszym krokiem w analizie czynników, które wpływają na dany zbiór danych. Po zakończeniu testu analityk przeprowadza dodatkowe testy na czynnikach metodycznych, które w wymierny sposób przyczyniają się do niespójności zbioru danych. Analityk wykorzystuje wyniki testu ANOVA w teście f, aby wygenerować dodatkowe dane, które są zgodne z proponowanymi modelami regresji.
Test ANOVA pozwala na porównanie więcej niż dwóch grup w tym samym czasie, aby określić, czy istnieje między nimi związek. Wynik formuły ANOVA, statystyka F (zwana również współczynnikiem F), pozwala na analizę wielu grup danych w celu określenia zmienności między próbkami i wewnątrz próbek.
Jeśli między badanymi grupami nie ma rzeczywistej różnicy, co nazywa się hipotezą zerową, wynik współczynnika F ANOVA będzie bliski 1. Rozkład wszystkich możliwych wartości statystyki F jest rozkładem F. W rzeczywistości jest to grupa funkcji rozkładu z dwiema charakterystycznymi liczbami, nazywanymi licznikami stopni swobody i mianownikami stopni swobody.
Kluczowe wnioski
- Analiza wariancji lub ANOVA to metoda statystyczna, która rozdziela dane dotyczące obserwowanej wariancji na różne komponenty, które mają być użyte w dodatkowych testach.
- Jednokierunkowa ANOVA jest używana dla trzech lub więcej grup danych w celu uzyskania informacji o związku między zmiennymi zależnymi i niezależnymi.
- Jeśli nie ma prawdziwej wariancji między grupami, współczynnik F ANOVA powinien być bliski 1.
Przykład użycia ANOVA
Badacz może na przykład przetestować studentów z wielu uczelni, aby sprawdzić, czy studenci z jednej uczelni konsekwentnie osiągają lepsze wyniki niż studentów z innych uczelni. W aplikacji biznesowej badacz zajmujący się badaniami i rozwojem może przetestować dwa różne procesy tworzenia produktu, aby sprawdzić, czy jeden proces jest lepszy od drugiego pod względem efektywności kosztowej.
Rodzaj zastosowanego testu ANOVA zależy od wielu czynników. Jest stosowany, gdy dane muszą być eksperymentalne. Analiza wariancji jest stosowana, jeśli nie ma dostępu do oprogramowania statystycznego, co skutkuje ręcznym obliczeniem ANOVA. Jest prosty w użyciu i najlepiej nadaje się do małych próbek. W przypadku wielu projektów eksperymentalnych rozmiary próbek muszą być takie same dla różnych kombinacji poziomów czynników.
ANOVA jest pomocna przy testowaniu trzech lub więcej zmiennych. Jest podobny do wielokrotnych testów t dla dwóch próbek. Jednak powoduje to mniej błędów typu I i jest odpowiedni dla szeregu problemów. ANOVA grupuje różnice, porównując średnie z każdej grupy i obejmuje rozłożenie wariancji na różne źródła. Jest stosowany z przedmiotami, grupami testowymi, między grupami i wewnątrz grup.
Jednokierunkowa ANOVA a dwukierunkowa ANOVA
Istnieją dwa główne typy ANOVA: jednokierunkowa (lub jednokierunkowa) i dwukierunkowa. Istnieją również odmiany ANOVA. Na przykład MANOVA (wielowymiarowa ANOVA) różni się od ANOVA, ponieważ pierwsza testuje jednocześnie wiele zmiennych zależnych, podczas gdy druga ocenia tylko jedną zmienną zależną naraz. Jednostronne lub dwukierunkowe odnosi się do liczby zmiennych niezależnych w analizie testu wariancji. Jednokierunkowa ANOVA ocenia wpływ jedynego czynnika na jedyną zmienną odpowiedzi. Określa, czy wszystkie próbki są takie same. Jednokierunkowa ANOVA służy do określenia, czy istnieją jakiekolwiek statystycznie istotne różnice między średnimi trzech lub większej liczby niezależnych (niepowiązanych) grup.
Dwukierunkowa ANOVA jest rozszerzeniem jednokierunkowej ANOVA. W przypadku jednokierunkowej mamy jedną zmienną niezależną wpływającą na zmienną zależną. W dwukierunkowej ANOVA istnieją dwie niezależne. Na przykład dwukierunkowa ANOVA pozwala firmie porównać produktywność pracowników na podstawie dwóch niezależnych zmiennych, takich jak wynagrodzenie i zestaw umiejętności. Służy do obserwowania interakcji między dwoma czynnikami i testowania wpływu dwóch czynników w tym samym czasie.