Kwartyl
Co to jest kwartyl?
Kwartyl to termin statystyczny opisujący podział obserwacji na cztery zdefiniowane przedziały na podstawie wartości danych i ich porównania z całym zestawem obserwacji.
Zrozumienie kwartyli
Aby zrozumieć kwartyl, ważne jest, aby zrozumieć medianę jako miarę centralnej tendencji. Mediana w statystykach to środkowa wartość zbioru liczb. Jest to punkt, w którym dokładnie połowa danych znajduje się poniżej i powyżej wartości centralnej.
Tak więc, biorąc pod uwagę zbiór 13 liczb, mediana byłaby siódmą liczbą. Sześć liczb poprzedzających tę wartość to najniższe liczby w danych, a sześć liczb po medianie to najwyższe liczby w podanym zbiorze danych. Ponieważ na medianę nie wpływają wartości ekstremalne ani wartości odstające w rozkładzie, czasami jest ona preferowana w stosunku do średniej.
Mediana jest solidnym estymatorem lokalizacji, ale nie mówi nic o tym, jak dane po obu stronach jej wartości są rozproszone lub rozproszone. Tutaj wkracza kwartyl. Kwartyl mierzy rozrzut wartości powyżej i poniżej średniej, dzieląc rozkład na cztery grupy.
Kluczowe wnioski
- Kwartyl mierzy rozrzut wartości powyżej i poniżej średniej, dzieląc rozkład na cztery grupy.
- Kwartyl dzieli dane na trzy punkty – dolny kwartyl, medianę i górny kwartyl – tworząc cztery grupy zbioru danych.
- Kwartyle służą do obliczania rozstępu międzykwartylowego, który jest miarą zmienności wokół mediany.
Jak działają kwartyle
Tak jak mediana dzieli dane na połowę, tak że 50% pomiaru leży poniżej mediany, a 50% powyżej niej, tak kwartyl dzieli dane na ćwiartki, tak że 25% pomiarów jest mniejszych niż dolny kwartyl, 50 % jest mniejszych niż mediana, a 75% mniej niż górny kwartyl.
Kwartyl dzieli dane na trzy punkty – dolny kwartyl, medianę i górny kwartyl – tworząc cztery grupy zbioru danych. Dolny kwartyl lub pierwszy kwartyl jest oznaczony jako Q1 i jest środkową liczbą mieszczącą się między najmniejszą wartością zbioru danych a medianą. Drugi kwartyl, Q2, jest również medianą. Górny lub trzeci kwartyl, oznaczony jako Q3, jest centralnym punktem leżącym między medianą a najwyższym numerem rozkładu.
Teraz możemy zmapować cztery grupy utworzone z kwartyli. Pierwsza grupa wartości zawiera najmniejszą liczbę do Q1; druga grupa obejmuje Q1 do mediany; trzeci zestaw to mediana do Q3; czwarta kategoria obejmuje Q3 do najwyższego punktu danych z całego zestawu.
Każdy kwartyl zawiera 25% wszystkich obserwacji. Ogólnie dane są uporządkowane od najmniejszych do największych:
- Pierwszy kwartyl: najmniejsze 25% liczb
- Drugi kwartyl : od 25,1% do 50% (do mediany)
- Trzeci kwartyl: od 50,1% do 75% (powyżej mediany)
- Czwarty kwartyl: najwyższe 25% liczb
Przykład kwartylu
Załóżmy, że rozkład wyników matematycznych w klasie 19 uczniów w porządku rosnącym jest następujący:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Po pierwsze, znak dół środkowej, Q2, który w tym przypadku jest 10 th wartość: 75.
Q1 to centralny punkt między najniższym wynikiem a medianą. W tym przypadku Q1 wypada między pierwszym a piątym wynikiem: 68. [Należy zauważyć, że medianę można również uwzględnić przy obliczaniu Q1 lub Q3 dla nieparzystego zestawu wartości. Jeśli miało to medianę po obu stronach od punktu środkowego, a Q1 jest środkowa wartość pomiędzy pierwszym a 10 th wynik, który jest średnią z piątym i szóstym score- (V + VI) / 2 = ( 68 + 69) / 2 = 68,5].
Q3 to środkowa wartość między Q2 a najwyższym wynikiem: 84. [Lub jeśli uwzględnisz medianę, Q3 = (82 + 84) / 2 = 83].
Teraz, gdy mamy kwartyle, zinterpretujmy ich liczby. Wynik równy 68 (Q1) oznacza pierwszy kwartyl i 25 p -ty centyl. 68 to mediana dolnej połowy wyniku określonego w dostępnych danych – to znaczy mediana wyników od 59 do 75.
Q1 mówi nam, że 25% wyników jest mniejszych niż 68, a 75% wyników klas jest wyższych. Q2 (mediana) jest 50 th percentyla i pokazuje, że 50% punktów mniejszej niż 75, i 50% punktów są powyżej 75. Ponadto 3Q 75 ty percentyl, pokazuje, że 25% punktów są większe, a 75% to mniej niż 84.
Uwagi specjalne
Jeśli punkt danych dla Q1 jest dalej od mediany niż Q3 jest od mediany, wówczas możemy powiedzieć, że istnieje większe rozrzuty między mniejszymi wartościami zbioru danych niż między większymi wartościami. Ta sama logika ma zastosowanie, jeśli Q3 jest dalej od Q2 niż Q1 od mediany.
Alternatywnie, jeśli istnieje parzysta liczba punktów danych, mediana będzie średnią z dwóch środkowych liczb. W naszym przykładzie powyżej, jeśli mieliśmy 20 uczniów zamiast 19, mediana ich wyników będzie średnią arytmetyczną z 10 th i 11 th numer.
Kwartyle służą do obliczania rozstępu międzykwartylowego, który jest miarą zmienności wokół mediany. Przedział międzykwartylowy jest po prostu obliczany jako różnica między pierwszym i trzecim kwartylem: Q3 – Q1. W efekcie to zakres środkowej połowy danych pokazuje, jak rozłożone są dane.
W przypadku dużych zestawów danych program Microsoft Excel ma funkcję KWARTYL do obliczania kwartylów.