4 maja 2021 17:45

Opisowe statystyki

Co to są statystyki opisowe?

Statystyka opisowa to krótkie współczynniki opisowe, które podsumowują dany zestaw danych, który może być reprezentacją całej populacji lub próbą populacji. Statystyka opisowa jest podzielona na miary tendencji centralnej i miary zmienności (rozrzutu). Miary tendencji centralnej obejmują średnią, medianę i modę, podczas gdy miary zmienności obejmują kurtozy i skośność.

Kluczowe wnioski

  • Statystyka opisowa podsumowuje lub opisuje cechy zbioru danych.
  • Statystyka opisowa składa się z dwóch podstawowych kategorii miar: miar tendencji centralnej i miar zmienności (lub rozrzutu).
  • Miary tendencji centralnej opisują środek zbioru danych.
  • Miary zmienności lub rozrzutu opisują rozproszenie danych w zbiorze.

Zrozumienie statystyk opisowych

Krótko mówiąc, statystyki opisowe pomagają opisać i zrozumieć cechy określonego zestawu danych, podając krótkie podsumowania próby i miar danych. Najbardziej rozpoznawalnymi typami statystyk opisowych są miary środka: średnia, mediana i tryb, które są używane na prawie wszystkich poziomach matematyki i statystyki. Średnią lub średnią oblicza się poprzez dodanie wszystkich liczb w zestawie danych, a następnie podzielenie przez liczbę liczb w zestawie. Na przykład suma następującego zestawu danych wynosi 20: (2, 3, 4, 5, 6). Średnia wynosi 4 (20/5). Tryb zbioru danych to najczęściej pojawiająca się wartość, a mediana to liczba znajdująca się w środku zbioru danych. Jest to liczba oddzielająca wyższe wartości od niższych w zestawie danych. Istnieją jednak mniej popularne typy statystyk opisowych, które są nadal bardzo ważne.

Ludzie używają statystyk opisowych, aby zmienić przeznaczenie trudnych do zrozumienia ilościowych spostrzeżeń w dużym zestawie danych na krótkie opisy. Na przykład średnia ocen ucznia (GPA) zapewnia dobre zrozumienie statystyk opisowych. Idea GPA polega na tym, że pobiera punkty danych z szerokiej gamy egzaminów, zajęć i ocen i uśrednia je razem, aby zapewnić ogólne zrozumienie ogólnych wyników akademickich ucznia. Osobisty GPA studenta odzwierciedla jego średnie wyniki w nauce.

Miary statystyki opisowej

Wszystkie statystyki opisowe są albo miarami tendencji centralnej, albo miarami zmienności, zwanymi również miarami dyspersji. Miary tendencji centralnej koncentrują się na średnich lub środkowych wartościach zbiorów danych, podczas gdy miary zmienności koncentrują się na rozproszeniu danych. Te dwie miary wykorzystują wykresy, tabele i ogólne dyskusje, aby pomóc ludziom zrozumieć znaczenie analizowanych danych.

Miary tendencji centralnej opisują położenie środka rozkładu dla zbioru danych. Osoba analizuje częstotliwość każdego punktu danych w rozkładzie i opisuje go za pomocą średniej, mediany lub trybu, który mierzy najczęściej występujące wzorce analizowanego zbioru danych.

Miary zmienności lub miary rozprzestrzeniania pomagają analizować, jak rozłożony jest rozkład zbioru danych. Na przykład, chociaż miary tendencji centralnej mogą dać osobie średnią ze zbioru danych, to nie opisuje, w jaki sposób dane są rozmieszczone w zbiorze. Tak więc, chociaż średnia danych może wynosić 65 na 100, nadal mogą istnieć punkty danych zarówno na poziomie 1, jak i 100. Miary zmienności pomagają to zakomunikować poprzez opisanie kształtu i rozrzutu zbioru danych. Zakres, kwartyle, odchylenie bezwzględne i wariancja to przykłady miar zmienności.

Rozważmy następujący zbiór danych: 5, 19, 24, 62, 91, 100. Zakres tego zbioru danych wynosi 95, który jest obliczany przez odjęcie najniższej liczby (5) w zestawie danych od największej (100).

Często Zadawane Pytania

Po co nam statystyki, które po prostu opisują dane?

Statystyki opisowe służą do opisywania lub podsumowywania cech próbki lub zbioru danych, takich jak średnia zmiennej, odchylenie standardowe lub częstotliwość. Statystyka wnioskowa. Tego typu statystyki mogą pomóc nam zrozumieć zbiorcze właściwości elementów próbki danych. Te miary mogą dać nam wyobrażenie o rozkładzie prawdopodobieństwa  lub ogólnym „kształcie” danych, które można przedstawić na wykresie, takim jak histogram lub wykres punktowy. Znajomość średniej próby, wariancji i rozkładu zmiennej może pomóc nam zrozumieć otaczający nas świat.

Co to jest średnia i odchylenie standardowe?

Są to dwie powszechnie stosowane statystyki opisowe. Średnia to średni poziom obserwowany w niektórych danych, podczas gdy odchylenie standardowe opisuje wariancję lub sposób rozproszenia danych obserwowanych w tej zmiennej wokół jej średniej.

Czy statystyki opisowe mogą służyć do wnioskowania lub przewidywania?

Nie. Chociaż opisy te są pomocne w zrozumieniu atrybutów danych, do zrozumienia, w jaki sposób zmienne oddziałują na siebie w zbiorze danych, wymagane są metody wnioskowania statystycznego – oddzielna gałąź statystyki.