5 maja 2021 7:11

Winsorized Mean Definicja

Co to jest Winsorized Mean?

Średnia winsoryzowana to metoda uśredniania, która początkowo zastępuje najmniejsze i największe wartości obserwacjami najbliższymi im. Ma to na celu ograniczenie wpływu wartości odstających lub nietypowych wartości ekstremalnych lub wartości odstających na obliczenia. Po zamianie wartości na średnią arytmetyczną oblicza się średnią winsoryzowaną.

kluczowe wnioski

  • Średnia winsoryzowana to metoda uśredniania polegająca na zastępowaniu najmniejszych i największych wartości zbioru danych obserwacjami najbliższymi im.
  • Łagodzi skutki wartości odstających, zastępując je mniej ekstremalnymi wartościami.
  • Średnia winsoryzowana nie jest tym samym, co średnia obcięta, która polega na usuwaniu punktów danych, a nie na ich zastępowaniu – chociaż wyniki tych dwóch są zazwyczaj bliskie.

Wzór na Winsorized Mean

Średnie wygrane są wyrażane na dwa sposoby. Średnia winsoryzowana „k n ” odnosi się do zastąpienia najmniejszej i największej obserwacji „k”, gdzie „k” jest liczbą całkowitą. Winsorized średnia „X%” obejmuje zastąpienie danego procentu wartości z obu końców danych.

Średnia winsoryzowana jest osiągana przez zastąpienie najmniejszych i największych punktów danych, a następnie zsumowanie wszystkich punktów danych i podzielenie sumy przez całkowitą liczbę punktów danych.

Co mówi Winsorized Meaning?

Średnia winsoryzowana jest mniej wrażliwa na wartości odstające, ponieważ może zastąpić je mniej skrajnymi wartościami. Oznacza to, że jest mniej podatny na wartości odstające w porównaniu ze średnią arytmetyczną. Jeśli jednak rozkład ma grube ogony, efekt usunięcia najwyższych i najniższych wartości w rozkładzie będzie miał niewielki wpływ ze względu na duży stopień zmienności danych rozkładu.

Przykład użycia Winsorized Mean

Obliczmy średnią winsoryzowaną dla następującego zbioru danych: 1, 5, 7, 8, 9, 10, 34. W tym przykładzie zakładamy, że średnia winsoryzowana jest w pierwszej kolejności, w której najmniejsze i największe wartości zastępujemy wartością najbliższe obserwacje.

Zbiór danych wygląda teraz następująco: 5, 5, 7, 8, 9, 10, 10. Przyjmowanie średniej arytmetycznej z nowego zestawu daje średnią wygraną 7,7 lub (5 + 5 + 7 + 8 + 9 + 10 + 10) podzielone przez 7. Zauważ, że średnia arytmetyczna miałaby wyższe – 10,6. Średnia winsoryzowana skutecznie zmniejsza wpływ wartości 34 jako wartości odstającej.

Lub rozważ 20% wygraną średnią, która zajmuje 10% górnych i 10% dolnych i zastępuje je następną najbliższą wartością. Winsoryzujemy następujący zestaw danych: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Te dwa najmniejsze i największe punkty danych – 10% z 20 punktów danych – zostaną zastąpione kolejną najbliższą wartością. Zatem nowy zestaw danych wygląda następująco: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Średnia winsoryzowana to 33,9, czyli suma danych (678) podzielona przez całkowitą liczbę punktów danych (20).

Średnia Winsorized vs.Średnia obcięta

Średnia winsoryzowana obejmuje modyfikację punktów danych, podczas gdy średnia obcięta obejmuje usuwanie punktów danych. Często zdarza się, że średnia winsoryzowana i średnia obcięta są bliskie lub czasami równe sobie.

Ograniczenia Winsorized Mean

Jedną z głównych wad metod winsorized jest to, że w naturalny sposób wprowadzają one pewne odchylenie do zbioru danych. Zmniejszając wpływ wartości odstających, analiza jest modyfikowana w celu lepszej analizy, ale także usuwa informacje o danych bazowych.