5 maja 2021 3:53

Test T

Co to jest test T?

Test t jest rodzajem statystyki inferencyjnej używanej do określenia, czy istnieje istotna różnica między średnimi dwóch grup, która może być powiązana w pewnych cechach. Jest najczęściej używany, gdy zbiory danych, takie jak zestaw danych zarejestrowany jako wynik 100-krotnego rzutu monetą, miałyby rozkład normalny i mogą mieć nieznane wariancje. Test t jest używany jako narzędzie do testowania hipotez, które umożliwia testowanie założeń mających zastosowanie do populacji.

Test t analizuje statystykę t, wartości rozkładu t i stopnie swobody w celu określenia istotności statystycznej. Aby przeprowadzić test z trzema lub więcej średnimi, należy skorzystać z  analizy wariancji.

Kluczowe wnioski

  • Test t jest rodzajem statystyki inferencyjnej używanej do określenia, czy istnieje istotna różnica między średnimi dwóch grup, która może być powiązana w pewnych cechach.
  • Test t jest jednym z wielu testów używanych do testowania hipotez w statystyce.
  • Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między średnimi wartościami z każdego zestawu danych (zwanymi średnią różnicą), odchyleniem standardowym każdej grupy i liczbą wartości danych w każdej grupie.
  • Istnieje kilka różnych typów testów t, które można przeprowadzić w zależności od danych i rodzaju wymaganej analizy.

Wyjaśnienie testu T.

Zasadniczo test t pozwala nam porównać średnie wartości dwóch zestawów danych i określić, czy pochodzą one z tej samej populacji. W powyższych przykładach, gdybyśmy mieli wziąć próbę uczniów z klasy A i inną próbę uczniów z klasy B, nie spodziewalibyśmy się, że będą mieli dokładnie taką samą średnią i odchylenie standardowe. Podobnie próbki pobrane z grupy kontrolnej karmionej placebo i te pobrane z grupy, w której przepisano lek, powinny mieć nieco inną średnią i odchylenie standardowe.

Matematycznie test t pobiera próbkę z każdego z dwóch zbiorów i ustala stwierdzenie problemu, przyjmując hipotezę zerową, że te dwie średnie są równe. W oparciu o obowiązujące wzory, określone wartości są obliczane i porównywane z wartościami standardowymi, a przyjęta hipoteza zerowa jest odpowiednio akceptowana lub odrzucana.

Jeśli hipoteza zerowa kwalifikuje się do odrzucenia, oznacza to, że odczyty danych są mocne i prawdopodobnie nie są dziełem przypadku. Test t jest tylko jednym z wielu testów stosowanych w tym celu. Statystycy muszą dodatkowo stosować testy inne niż test t, aby zbadać więcej zmiennych i testy z większymi próbami. W przypadku dużej próby statystycy używają  testu z. Inne opcje testowania obejmują test chi-kwadrat i test F.

Istnieją trzy rodzaje testów t, które są klasyfikowane jako zależne i niezależne testy t.

Niejednoznaczne wyniki testu

Weź pod uwagę, że producent leków chce przetestować nowo wynaleziony lek. Jest to standardowa procedura polegająca na wypróbowaniu leku na jednej grupie pacjentów i podaniu placebo innej grupie, zwanej grupą kontrolną. Placebo podane grupie kontrolnej jest substancją bez zamierzonej wartości terapeutycznej i służy jako punkt odniesienia do pomiaru reakcji drugiej grupy, której podano faktyczny lek.

Po próbie narkotykowej członkowie grupy kontrolnej otrzymującej placebo zgłosili wzrost średniej długości życia o trzy lata, podczas gdy członkowie grupy, którym przepisano nowy lek, odnotowali wzrost średniej długości życia o cztery lata. Natychmiastowa obserwacja może wskazywać, że lek rzeczywiście działa, ponieważ wyniki są lepsze dla grupy stosującej lek. Jednak możliwe jest również, że obserwacja może być wynikiem przypadku, zwłaszcza zaskakującego szczęścia. Test t jest przydatny do stwierdzenia, czy wyniki są rzeczywiście prawidłowe i mają zastosowanie do całej populacji.

W szkole 100 uczniów z klasy A uzyskało średnio 85% wyników przy odchyleniu standardowym 3%. Kolejnych 100 uczniów z klasy B uzyskało średnio 87% przy odchyleniu standardowym 4%. Chociaż średnia dla klasy B jest lepsza niż dla klasy A, wyciągnięcie pochopnego wniosku, że ogólne wyniki uczniów w klasie B są lepsze niż uczniów w klasie A, może nie być poprawne. Wynika to z naturalnej zmienności. w wynikach testów w obu klasach, więc różnica może wynikać wyłącznie z przypadku. Test t może pomóc w ustaleniu, czy jedna klasa wypadła lepiej niż druga.

Założenia testu T.

  1. Pierwsze założenie przyjęte w odniesieniu do testów t dotyczy skali pomiaru. Założenie dla testu t jest takie, że skala pomiaru zastosowana do zebranych danych jest zgodna ze skalą ciągłą lub porządkową, taką jak wyniki testu IQ.
  2. Drugie założenie dotyczy prostej próby losowej, że dane są zbierane z reprezentatywnej, losowo wybranej części całej populacji.
  3. Trzecie założenie jest takie, że dane, gdy są wykreślane, dają w wyniku rozkład normalny, krzywą rozkładu w kształcie dzwonu.
  4. Ostatnim założeniem jest jednorodność wariancji. Wariancja jednorodna lub równa istnieje, gdy odchylenia standardowe próbek są w przybliżeniu równe.

Obliczanie testów T.

Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między średnimi wartościami z każdego zestawu danych (zwanymi średnią różnicą), odchyleniem standardowym każdej grupy i liczbą wartości danych w każdej grupie.

Wynik testu t daje wartość t. Ta obliczona wartość t jest następnie porównywana z wartością uzyskaną z tabeli wartości krytycznych (zwanej tabelą rozkładu T ). To porównanie pomaga określić wpływ samego przypadku na różnicę i czy różnica jest poza tym zakresem szansy. Test t stawia pytanie, czy różnica między grupami reprezentuje prawdziwą różnicę w badaniu, czy też jest to prawdopodobnie bezsensowna różnica losowa.

T-Distribution Tables

Tabela dystrybucji T jest dostępna w formatach jedno i dwu-ogonowych. Pierwsza służy do oceny przypadków, które mają stałą wartość lub zakres z wyraźnym kierunkiem (dodatnim lub ujemnym). Na przykład, jakie jest prawdopodobieństwo, że wartość wyjściowa pozostanie poniżej -3 lub więcej niż siedem, gdy rzucisz parą kości? Ta ostatnia jest używana do analizy zakresu, na przykład pytania, czy współrzędne mieszczą się w zakresie od -2 do +2.

Obliczenia można wykonywać za pomocą standardowych programów obsługujących niezbędne funkcje statystyczne, np. MS Excel.

Wartości T i stopnie swobody

Wynik testu t daje dwie wartości: wartość t i stopnie swobody. Wartość t jest stosunkiem różnicy między średnią z dwóch zestawów próbek a zmiennością istniejącą w zestawach próbek. Podczas gdy wartość licznika (różnica między średnią z dwóch zestawów próbek) jest łatwa do obliczenia, mianownik (zmienność występująca w zestawach próbek) może stać się nieco skomplikowana w zależności od rodzaju danych, których to dotyczy. Mianownikiem stosunku jest miara dyspersji lub zmienności. Wyższe wartości wartości t, zwane również wynikiem t, wskazują, że istnieje duża różnica między dwoma zestawami próbek. Im mniejsza wartość t, tym większe podobieństwo istnieje między dwoma zestawami próbek.

  • Duży wynik t wskazuje, że grupy są różne.
  • Mały wynik t wskazuje, że grupy są podobne.

Stopnie swobody odnoszą się do wartości w badaniu, które może się zmieniać i jest niezbędne do oceny ważności i słuszności hipotezy zerowej. Obliczenie tych wartości zwykle zależy od liczby rekordów danych dostępnych w zestawie próbek.

Skorelowany (lub sparowany) test T.

Skorelowany test t jest wykonywany, gdy próbki zazwyczaj składają się z dopasowanych par podobnych jednostek lub gdy występują przypadki powtarzania pomiarów. Na przykład mogą zdarzyć się przypadki wielokrotnego badania tych samych pacjentów – przed i po otrzymaniu określonego leczenia. W takich przypadkach każdy pacjent jest używany jako próbka kontrolna przeciwko sobie.

Ta metoda ma również zastosowanie w przypadkach, gdy próbki są w jakiś sposób powiązane lub mają pasujące cechy, jak analiza porównawcza z udziałem dzieci, rodziców lub rodzeństwa. Skorelowane lub sparowane testy t są zależne, ponieważ obejmują przypadki, w których dwa zestawy próbek są powiązane.

Wzór na obliczenie wartości t i stopni swobody dla sparowanego testu t jest następujący:

Pozostałe dwa typy należą do niezależnych testów t. Próbki tego typu są wybierane niezależnie od siebie – to znaczy zestawy danych w dwóch grupach nie odnoszą się do tych samych wartości. Obejmują one takie przypadki, jak grupa 100 pacjentów podzielona na dwa zestawy po 50 pacjentów każdy. Jedna z grup staje się grupą kontrolną i otrzymuje placebo, podczas gdy druga grupa otrzymuje przepisane leczenie. Stanowi to dwie niezależne grupy prób, które nie są ze sobą sparowane.

Test t-równej wariancji (lub zbiorczy)

Test t równej wariancji jest stosowany, gdy liczba próbek w każdej grupie jest taka sama lub wariancja dwóch zestawów danych jest podobna. Poniższy wzór służy do obliczania wartości t i stopni swobody dla testu t o równej wariancji:

T-value=mmizan1-mmizan2(n1-1)