Jakie założenia przyjmujemy przy przeprowadzaniu testu t-Studenta?
Testy T są powszechnie stosowane w statystyce i ekonometrii do ustalenia, czy wartości dwóch wyników lub zmiennych różnią się od siebie.
Typowe założenia poczynione podczas wykonywania testu t obejmują te dotyczące skali pomiaru, losowego doboru próby, normalności rozkładu danych, adekwatności wielkości próby i równości wariancji odchylenia standardowego.
Kluczowe wnioski
- Test t – metoda statystyczna używana do określenia, czy istnieje znacząca różnica między średnimi dwóch grup na podstawie próby danych.
- Test opiera się na zestawie założeń, aby można go było zinterpretować poprawnie i trafnie.
- Wśród tych założeń dane muszą być losowo próbkowane z populacji będącej przedmiotem zainteresowania, a zmienne danych mają rozkład normalny.
Test T
Test t został opracowany przez chemika pracującego dla browaru Guinness jako prosty sposób pomiaru stałej jakości stouta. Został on dalej rozwinięty i dostosowany, a teraz odnosi się do dowolnego testu hipotezy statystycznej, w którym statystyka, której dotyczy test, ma odpowiadać rozkładowi t-Studenta, jeśli hipoteza zerowa jest potwierdzona.
Test t to analiza dwóch średnich populacji za pomocą badania statystycznego; test t z dwiema próbkami jest powszechnie stosowany w przypadku małych próbek, testując różnicę między próbkami, gdy wariancje dwóch rozkładów normalnych nie są znane.
Rozkład T to w zasadzie każdy ciągły rozkład prawdopodobieństwa, który wynika z oszacowania średniej populacji o rozkładzie normalnym przy użyciu małej wielkości próby i nieznanego odchylenia standardowego dla populacji. Hipoteza zerowa jest domyślnym założeniem, że nie ma związku między dwoma różnymi mierzonymi zjawiskami. (Powiązane informacje można znaleźć w artykule: Co oznacza silna hipoteza zerowa? )
Założenia testu T.
- Pierwsze założenie przyjęte w odniesieniu do testów t dotyczy skali pomiaru. Założenie dla testu t jest takie, że skala pomiaru zastosowana do zebranych danych jest zgodna ze skalą ciągłą lub porządkową, taką jak wyniki testu IQ.
- Drugie założenie dotyczy prostej próby losowej, że dane są zbierane z reprezentatywnej, losowo wybranej części całej populacji.
- Trzecie założenie jest takie, że dane na wykresie dają rozkład normalny, krzywą rozkładu w kształcie dzwonu. Przyjmując rozkład normalny, można określić poziom prawdopodobieństwa (poziom alfa, poziom istotności, p ) jako kryterium akceptacji. W większości przypadków można przyjąć wartość 5%.
- Czwarte założenie jest to, że zastosowano dość dużą próbę. Większy rozmiar próbki oznacza, że rozkład wyników powinien zbliżać się do normalnej krzywej dzwonowej.
- Ostatnim założeniem jest jednorodność wariancji. Wariancja jednorodna lub równa istnieje, gdy odchylenia standardowe próbek są w przybliżeniu równe.