Jednolita dystrybucja
Co to jest jednolita dystrybucja?
W statystyce rozkład równomierny odnosi się do typu rozkładu prawdopodobieństwa, w którym wszystkie wyniki są jednakowo prawdopodobne. Talia kart ma w niej jednolitych rozkładów ponieważ prawdopodobieństwo rysunek serca, klub, diament, albo łopata jest równie prawdopodobne. Moneta ma również równomierny rozkład, ponieważ prawdopodobieństwo otrzymania orła lub reszki podczas rzutu monetą jest takie samo.
Jednorodny rozkład można wizualizować jako prostą linię poziomą, więc dla rzutu monetą zwracającego orzeł lub ogon, oba mają prawdopodobieństwo p = 0,50 i byłyby przedstawione linią od osi y przy 0,50.
Kluczowe wnioski
- Rozkłady jednolite to rozkłady prawdopodobieństwa z równie prawdopodobnymi wynikami.
- W dyskretnym jednorodnym rozkładzie wyniki są dyskretne i mają takie samo prawdopodobieństwo.
- W ciągłym, jednolitym rozkładzie wyniki są ciągłe i nieskończone.
- W rozkładzie normalnym dane dotyczące średniej występują częściej.
- Częstotliwość występowania zmniejsza się, im dalej jesteś od średniej w normalnym rozkładzie.
Zrozumienie jednolitej dystrybucji
Istnieją dwa typy rozkładów jednorodnych: dyskretne i ciągłe. Możliwe wyniki rzutu kostką stanowią przykład nieciągłego, równomiernego rozkładu: można wyrzucić 1, 2, 3, 4, 5 lub 6, ale nie można wyrzucić 2,3, 4,7 lub 5,5. Dlatego rzut kostką generuje dyskretny rozkład z p = 1/6 dla każdego wyniku. Jest tylko 6 możliwych wartości do zwrócenia i nic pomiędzy nimi.
Wykreślone wyniki rzutu pojedynczą kostką będą dyskretnie jednolite, podczas gdy naniesione wyniki (średnie) z rzutu dwoma lub więcej kośćmi będą miały rozkład normalny.
Niektóre rozkłady jednorodne są raczej ciągłe niż dyskretne. Wyidealizowany generator liczb losowych byłby uważany za ciągły rozkład jednorodny. Przy tego rodzaju rozkładzie każdy punkt w ciągłym zakresie od 0,0 do 1,0 ma równe szanse pojawienia się, ale istnieje nieskończona liczba punktów między 0,0 a 1,0.
Istnieje kilka innych ważnych rozkładów ciągłych, takich jak rozkład normalny, chi-kwadrat i rozkład t-Studenta.
Istnieje również kilka funkcji generowania lub analizowania danych powiązanych z rozkładami, które pomagają zrozumieć zmienne i ich wariancję w zestawie danych. Funkcje te obejmują funkcję gęstości prawdopodobieństwa, gęstość skumulowaną i funkcje generujące momenty.
Wizualizacja jednolitych rozkładów
Dystrybucja to prosty sposób na wizualizację zestawu danych. Można to przedstawić jako wykres lub listę, pokazując, które wartości zmiennej losowej mają mniejsze lub większe szanse na wystąpienie. Istnieje wiele różnych typów rozkładów prawdopodobieństwa, a rozkład jednorodny jest prawdopodobnie najprostszy ze wszystkich.
Przy równomiernym rozkładzie każda wartość w zbiorze możliwych wartości ma taką samą możliwość zaistnienia. Gdy jest wyświetlany jako wykres słupkowy lub liniowy, rozkład ten ma taką samą wysokość dla każdego potencjalnego wyniku. W ten sposób może wyglądać jak prostokąt i dlatego jest czasami opisywany jako rozkład prostokątny. Jeśli myślisz o możliwości losowania określonego koloru z talii kart do gry, istnieje przypadkowa, ale równa szansa na wyciągnięcie serca, jak w przypadku wyciągnięcia piku – czyli 1/4 lub 25%.
Rzut pojedynczą kostką daje jedną z sześciu liczb: 1, 2, 3, 4, 5 lub 6. Ponieważ jest tylko 6 możliwych wyników, prawdopodobieństwo wylądowania na którymkolwiek z nich wynosi 16,67% (1/6 ). Na wykresie rozkład jest przedstawiany jako linia pozioma, a każdy możliwy wynik jest uchwycony na osi x, w stałym punkcie prawdopodobieństwa wzdłuż osi y.
Rozkład jednorodny a rozkład normalny
Rozkłady prawdopodobieństwa pomagają określić prawdopodobieństwo przyszłego zdarzenia. Niektóre z najczęstszych rozkładów prawdopodobieństwa to dyskretne jednorodne, dwumianowe, ciągłe jednorodne, normalne i wykładnicze. Być może jednym z najbardziej znanych i powszechnie stosowanych jest rozkład normalny, często przedstawiany jako krzywa dzwonowa.
Rozkłady normalne pokazują rozkład danych ciągłych i zapewniają, że większość danych koncentruje się na średniej lub średniej. W rozkładzie normalnym pole powierzchni pod krzywą wynosi 1, a 68,27% wszystkich danych mieści się w zakresie 1 odchylenia standardowego– w jakim stopniu są rozproszone– od średniej;95,45% wszystkich danych mieści się w zakresie 2 odchyleń standardowych od średniej, a około 99,73% wszystkich danych mieści się w granicach 3 odchyleń standardowych od średniej. Gdy dane oddalają się od średniej, częstotliwość ich występowania maleje.
Dyskretny rozkład jednorodny pokazuje, że zmienne w zakresie mają takie samo prawdopodobieństwo wystąpienia. Nie ma różnic w prawdopodobnych wynikach, a dane są raczej dyskretne niż ciągłe. Jego kształt przypomina prostokąt, a nie dzwonek rozkładu normalnego. Jednak podobnie jak w przypadku rozkładu normalnego pole pod wykresem jest równe 1.
Przykład jednolitej dystrybucji
W tradycyjnej talii kart znajdują się 52 karty. Są w nim cztery kolory: kiery, karo, trefl i pik. Każdy kolor zawiera A, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K i 2 jokery. Jednak w tym przykładzie wyeliminujemy jokery i figury, skupiając się tylko na kartach liczbowych replikowanych w każdym kolorze. W rezultacie zostaje nam 40 kart, zestaw dyskretnych danych.
Załóżmy, że chcesz poznać prawdopodobieństwo wyciągnięcia 2 kier ze zmodyfikowanej talii. Prawdopodobieństwo wyciągnięcia 2 kier wynosi 1/40 lub 2,5%. Każda karta jest niepowtarzalna; w związku z tym prawdopodobieństwo wyciągnięcia jednej z kart w talii jest takie samo.
Rozważmy teraz prawdopodobieństwo wyciągnięcia serca z talii. Prawdopodobieństwo jest znacznie wyższe. Dlaczego? Teraz zajmiemy się tylko garniturami w talii. Ponieważ są tylko cztery kolory, pociągnięcie za serce daje prawdopodobieństwo 1/4 lub 25%.
Jednolita dystrybucja – często zadawane pytania
Co oznacza jednolita dystrybucja?
Rozkład jednorodny to rozkład prawdopodobieństwa, który potwierdza, że wyniki dla dyskretnego zestawu danych mają takie samo prawdopodobieństwo.
Jaki jest wzór na jednolitą dystrybucję?
Wzór na dyskretny, jednorodny rozkład to
gdzie:
- P (x) = prawdopodobieństwo
- n = liczba wartości w zakresie
Podobnie jak na przykładzie kostki, każda strona zawiera unikalną liczbę całkowitą. Prawdopodobieństwo rzutu kostką i uzyskania dowolnej liczby wynosi 1/6, czyli 16,67%.
Czy jednolity rozkład jest normalny?
Normalny wskazuje na sposób dystrybucji danych dotyczących średniej. Normalne dane pokazują, że prawdopodobieństwo wystąpienia zmiennej wokół średniej lub środka jest wyższe. Im bardziej oddalasz się od tej średniej, tym mniej punktów danych jest obserwowanych, co oznacza, że prawdopodobieństwo wystąpienia zmiennej daleko od średniej jest mniejsze. Prawdopodobieństwo nie jest jednakowe w przypadku danych normalnych, natomiast jest stałe z równomiernym rozkładem. Dlatego równomierny rozkład nie jest normalny.
Czego oczekuje się od jednolitej dystrybucji?
Oczekuje się, że równomierny rozkład spowoduje, że wszystkie możliwe wyniki będą miały takie samo prawdopodobieństwo. Prawdopodobieństwo dla jednej zmiennej jest takie samo dla innej.