Przedział ufności
Co to jest przedział ufności?
Przedział ufności w statystyce odnosi się do prawdopodobieństwa, że parametr populacji będzie mieścił się między zbiorem wartości przez określony odsetek czasów.
Kluczowe wnioski
- Przedział ufności przedstawia prawdopodobieństwo, że parametr znajdzie się między parą wartości wokół średniej.
- Przedziały ufności mierzą stopień niepewności lub pewności metody pobierania próbek.
- Najczęściej są one konstruowane przy użyciu poziomów ufności 95% lub 99%.
Zrozumienie przedziału ufności
Przedziały ufności mierzą stopień niepewności lub pewności metody pobierania próbek. Mogą przyjąć dowolną liczbę granic prawdopodobieństwa, z których najczęstszym jest poziom ufności 95% lub 99%. Przedziały ufności są określane przy użyciu metod statystycznych, takich jak test t.
Statystycy używają przedziałów ufności do pomiaru niepewności zmiennej próby. Na przykład badacz losowo wybiera różne próbki z tej samej populacji i oblicza przedział ufności dla każdej próbki, aby zobaczyć, jak może ona reprezentować prawdziwą wartość zmiennej populacyjnej. Wynikowe zbiory danych są różne; niektóre przedziały zawierają rzeczywisty parametr populacji, a inne nie.
Przedział ufności to zakres wartości, ograniczony powyżej i poniżej średniej statystyki, który prawdopodobnie zawiera nieznany parametr populacji. Poziom ufności odnosi się do procentu prawdopodobieństwa lub pewności, że przedział ufności będzie zawierał prawdziwy parametr populacji w przypadku wielokrotnego losowania próbki. Lub, używając języka potocznego, „mamy 99% pewności ( poziom ufności), że większość tych próbek (przedziały ufności) zawiera prawdziwy parametr populacji”.
Największym nieporozumieniem dotyczącym przedziałów ufności jest to, że reprezentują one procent danych z danej próbki, który mieści się między górną a dolną granicą. Na przykład można błędnie zinterpretować wspomniany powyżej 99% przedział ufności od 70 do 78 cali jako wskazujący, że 99% danych w losowej próbie mieści się między tymi liczbami. Jest to niepoprawne, chociaż istnieje odrębna metoda analizy statystycznej umożliwiająca dokonanie takiego ustalenia. W tym celu należy zidentyfikować średnią próbki i odchylenie standardowe oraz wykreślić te wartości na krzywej dzwonowej.
Zaufanie interwał i zaufanie poziom są ze sobą powiązane, ale nie są dokładnie takie same.
Obliczanie przedziału ufności
Załóżmy, że grupa naukowców bada wzrosty koszykarzy w liceum. Naukowcy pobierają losową próbkę z populacji i ustalają średnią wysokość 74 cali.
Średnia 74 cali to punktowa ocena średniej populacji. Samo oszacowanie punktowe ma ograniczoną użyteczność, ponieważ nie ujawnia niepewności związanej z oszacowaniem; nie masz dobrego wyczucia, jak daleko ta 74-calowa średnia z próby może znajdować się od średniej populacji. Brakuje stopnia niepewności w tej pojedynczej próbce.
Przedziały ufności dostarczają więcej informacji niż szacunki punktowe. Ustalając 95-procentowy przedział ufności przy użyciu średniej próbki i odchylenia standardowego oraz przyjmując rozkład normalny przedstawiony za pomocą krzywej dzwonowej, naukowcy dochodzą do górnej i dolnej granicy, która zawiera prawdziwą średnią 95% czasu.
Załóżmy, że odstęp wynosi od 72 cali do 76 cali. Jeśli badacze pobiorą 100 losowych próbek z całej populacji koszykarzy ze szkół średnich, średnia powinna wynosić od 72 do 76 cali w 95 z tych próbek.
Jeśli naukowcy chcą jeszcze większej pewności, mogą rozszerzyć przedział do 99% pewności. Robi to niezmiennie szerszy zakres, ponieważ daje miejsce na większą liczbę średnich prób. Jeśli ustalą 99% przedział ufności jako między 70 cali a 78 cali, mogą oczekiwać, że 99 ze 100 ocenianych próbek będzie zawierać średnią wartość między tymi liczbami.
Z drugiej strony 90% poziom ufności oznacza, że oczekiwalibyśmy, że 90% oszacowań przedziałów obejmowałoby parametr populacji i tak dalej.
Często Zadawane Pytania
Co ujawnia przedział ufności?
Przedział ufności to zakres wartości, ograniczony powyżej i poniżej średniej statystyki, który prawdopodobnie zawiera nieznany parametr populacji. Poziom ufności odnosi się do procentu prawdopodobieństwa lub pewności, że przedział ufności będzie zawierał prawdziwy parametr populacji w przypadku wielokrotnego losowania próbki.
Jak wykorzystuje się przedziały ufności?
Statystycy używają przedziałów ufności do pomiaru niepewności zmiennej próby. Na przykład badacz losowo wybiera różne próbki z tej samej populacji i oblicza przedział ufności dla każdej próbki, aby zobaczyć, jak może ona reprezentować prawdziwą wartość zmiennej populacyjnej. Wynikowe zbiory danych są różne, gdy niektóre przedziały zawierają rzeczywisty parametr populacji, a inne nie.
Jakie jest powszechne błędne przekonanie dotyczące przedziałów ufności?
Największym nieporozumieniem dotyczącym przedziałów ufności jest to, że reprezentują one procent danych z danej próbki, który mieści się między górną a dolną granicą. Innymi słowy, błędne byłoby założenie, że 99% przedział ufności oznacza, że 99% danych w losowej próbie mieści się między tymi granicami. W rzeczywistości oznacza to, że można mieć 99% pewności, że zakres będzie zawierał średnią populacji.
Co to jest test T?
Przedziały ufności są określane przy użyciu metod statystycznych, takich jak test t. Test t jest rodzajem statystyki inferencyjnej używanej do określenia, czy istnieje istotna różnica między średnimi dwóch grup, która może być powiązana w pewnych cechach. Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między średnimi wartościami z każdego zestawu danych (zwanymi średnią różnicą), odchyleniem standardowym każdej grupy i liczbą wartości danych w każdej grupie.