Zasada empiryczna
Jaka jest reguła empiryczna?
Reguła empiryczna, nazywana również regułą trzech sigm lub regułą 68-95-99,7, jest regułą statystyczną, która stwierdza, że dla rozkładu normalnego prawie wszystkie obserwowane dane będą mieścić się w trzech odchyleniach standardowych (oznaczonych przez σ) średnia lub średnia (oznaczona przez µ).
W szczególności reguła empiryczna przewiduje, że 68% obserwacji mieści się w pierwszym odchyleniu standardowym (µ ± σ), 95% w ramach pierwszych dwóch odchyleń standardowych (µ ± 2σ) i 99,7% w ramach pierwszych trzech odchyleń standardowych (µ ± 3σ).
Kluczowe wnioski
- Reguła empiryczna stwierdza, że 99,7% danych obserwowanych po rozkładzie normalnym mieści się w granicach 3 odchyleń standardowych średniej.
- Zgodnie z tą zasadą 68% danych mieści się w granicach jednego odchylenia standardowego, 95% w ramach dwóch odchyleń standardowych, a 99,7% w ramach trzech odchyleń standardowych od średniej.
- Limity trójsigma, które są zgodne z regułą empiryczną, są używane do ustalania górnych i dolnych granic kontrolnych w statystycznych wykresach kontroli jakości oraz w analizie ryzyka, takiej jak VaR.
Zrozumienie reguły empirycznej
Reguła empiryczna jest często używana w statystykach do prognozowania ostatecznych wyników. Po obliczeniu odchylenia standardowego i przed zebraniem dokładnych danych regułę tę można wykorzystać jako przybliżone oszacowanie wyniku zbliżających się danych, które mają zostać zebrane i przeanalizowane.
Ten rozkład prawdopodobieństwa można zatem wykorzystać jako tymczasową heurystykę, ponieważ zebranie odpowiednich danych może być czasochłonne lub nawet niemożliwe w niektórych przypadkach. Takie rozważania mają znaczenie, gdy firma dokonuje przeglądu swoich środków kontroli jakości lub ocenia swoje narażenie na ryzyko. Na przykład powszechnie stosowane narzędzie ryzyka znane jako wartość zagrożona (VaR) zakłada, że prawdopodobieństwo wystąpienia zdarzeń ryzyka ma rozkład normalny.
Reguła empiryczna jest również używana jako przybliżony sposób testowania „normalności” rozkładu. Jeśli zbyt wiele punktów danych wykracza poza trzy granice odchylenia standardowego, sugeruje to, że rozkład nie jest normalny i może zamiast tego być wypaczony lub podążać za innym rozkładem.
Reguły empiryczne są również znane jako reguła trzech sigma, ponieważ „trzy sigma” odnosi się do statystycznego rozkładu danych w ramach trzech odchyleń standardowych od średniej na rozkładzie normalnym ( krzywa dzwonowa ), jak pokazano na poniższym rysunku.
Przykłady reguły empirycznej
Załóżmy, że populacja zwierząt w zoo ma rozkład normalny. Każde zwierzę żyje średnio 13,1 lat (średnia), a odchylenie standardowe długości życia wynosi 1,5 roku. Jeśli ktoś chce poznać prawdopodobieństwo, że zwierzę będzie żyło dłużej niż 14,6 lat, może skorzystać z reguły empirycznej. Wiedząc, że średnia rozkładu wynosi 13,1 lat, dla każdego odchylenia standardowego występują następujące przedziały wiekowe:
- Jedno odchylenie standardowe (µ ± σ): (13,1 – 1,5) do (13,1 + 1,5) lub 11,6 do 14,6
- Dwa odchylenia standardowe (µ ± 2σ): 13,1 – (2 x 1,5) do 13,1 + (2 x 1,5) lub 10,1 do 16,1
- Trzy odchylenia standardowe (µ ± 3σ): 13,1 – (3 x 1,5) do 13,1 + (3 x 1,5) lub 8,6 do 17,6
Osoba rozwiązująca ten problem musi obliczyć całkowite prawdopodobieństwo, że zwierzę będzie żyło 14,6 lat lub dłużej. Reguła empiryczna pokazuje, że 68% rozkładu mieści się w obrębie jednego odchylenia standardowego, w tym przypadku od 11,6 do 14,6 lat. Zatem pozostałe 32% rozkładu leży poza tym zakresem. Połowa leży powyżej 14,6, a połowa poniżej 11,6. Zatem prawdopodobieństwo przeżycia zwierzęcia powyżej 14,6 wynosi 16% (obliczone jako 32% podzielone przez dwa).
Jako inny przykład przyjmijmy zamiast tego, że zwierzę w zoo żyje średnio do 10 lat, z odchyleniem standardowym wynoszącym 1,4 roku. Załóżmy, że opiekun zooka próbuje obliczyć prawdopodobieństwo, że zwierzę będzie żyło dłużej niż 7,2 roku. Ta dystrybucja wygląda następująco:
- Jedno odchylenie standardowe (µ ± σ): 8,6 do 11,4 lat
- Dwa odchylenia standardowe (µ ± 2σ): 7,2 do 12,8 lat
- Trzy odchylenia standardowe ((µ ± 3σ): 5,8 do 14,2 lat
Reguła empiryczna stwierdza, że 95% rozkładu mieści się w granicach dwóch odchyleń standardowych. Zatem 5% leży poza dwoma odchyleniami standardowymi; połowa powyżej 12,8 lat i połowa poniżej 7,2 lat. Zatem prawdopodobieństwo życia dłużej niż 7,2 lat wynosi:
95% + (5% / 2) = 97,5%
Często Zadawane Pytania
Jaka jest reguła empiryczna?
W statystyce reguła empiryczna stwierdza, że 99,7% danych występuje w ramach trzech odchyleń standardowych średniej w ramach rozkładu normalnego. W tym celu 68% obserwowanych danych wystąpi w ramach pierwszego odchylenia standardowego, 95% w drugim odchyleniu, a 97,5% w trzecim odchyleniu standardowym. Reguła empiryczna przewiduje rozkład prawdopodobieństwa dla zbioru wyników.
Jak jest używana reguła empiryczna?
Reguła empiryczna jest stosowana do przewidywania prawdopodobnych wyników w rozkładzie normalnym. Na przykład statystyka użyłby tego do oszacowania odsetka przypadków, które przypadają na każde odchylenie standardowe. Weź pod uwagę, że odchylenie standardowe wynosi 3,1, a średnia wynosi 10. W tym przypadku pierwsze odchylenie standardowe mieściłoby się w zakresie od (10 + 3,2) = 13,2 do (10-3,2) = 6,8. Drugie odchylenie mieści się między 10 + (2 X 3,2) = 16,4 a 10 – (2 X 3,2) = 3,6 i tak dalej.
Jakie są zalety reguły empirycznej?
Reguła empiryczna jest korzystna, ponieważ służy do prognozowania danych. Jest to szczególnie prawdziwe w przypadku dużych zbiorów danych i tych, w których zmienne są nieznane. W szczególności w finansach reguła empiryczna ma związek z cenami akcji, indeksami cen i wartościami logarytmów kursów walutowych, które mają tendencję do spadania wzdłuż krzywej dzwonowej lub rozkładu normalnego.