Margines błędu - Margin of error

Gęstości prawdopodobieństwa ankiet o różnych rozmiarach, z których każda jest zakodowana kolorem zgodnie z 95% przedziałem ufności (poniżej), marginesem błędu (po lewej) i wielkością próbki (po prawej). Każdy przedział odzwierciedla zakres, w którym można mieć 95% pewności, że można znaleźć prawdziwy odsetek , przy zadeklarowanym odsetku równym 50%. Margines błędu to połowa przedział ufności (Również promień przedziału). Im większa próba, tym mniejszy margines błędu. Również im dalej od 50% zgłoszonego odsetka, tym mniejszy margines błędu.

Margines błędu to statystyka wyrażającą ilość losowych błędów próbkowania w wynikach badania . Im większy margines błędu, tym mniej należy mieć pewność, że wynik sondażu będzie odzwierciedlał wynik sondażu całej populacji . Margines błędu będzie dodatni, gdy populacja jest niekompletna, a miara wyniku ma dodatnią wariancję , co oznacza, że ​​miara jest zróżnicowana .

Termin „ margines błędu” jest często używany w kontekstach innych niż badania, aby wskazać błąd obserwacji w raportowaniu mierzonych wielkości. Jest również używany w mowie potocznej w odniesieniu do ilości miejsca lub elastyczności, jaką można mieć w osiągnięciu celu. Na przykład jest często używany w sporcie przez komentatorów, gdy opisują, jak bardzo precyzja jest wymagana do osiągnięcia celu, punktów lub wyniku. Kręgle stosowany w Stanach Zjednoczonych jest 4,75 cala szerokości, a piłka jest 8,5 cala, więc można powiedzieć, melonik ma margines 21,75 cala błędu podczas próby hit konkretny pin do zarabiania zapasowego (np 1 sworzeń pozostając na pasie).

Pojęcie

Rozważmy prosty tak / nie ankietę jako próby respondentów wywodzących się z populacji zgłaszających procent z yes odpowiedzi. Chcielibyśmy wiedzieć, jak bliski jest prawdziwy wynik badania całej populacji , bez konieczności jego przeprowadzania. Gdybyśmy hipotetycznie przeprowadzili ankietę na kolejnych próbach respondentów (nowo dobranych z ), oczekiwalibyśmy, że te kolejne wyniki będą miały rozkład normalny około . Margines błędu opisuje odległość, w którym oczekuje się, że określony procent z tych wyników, które różnią się od .

Zgodnie z regułą 68-95-99,7 oczekiwalibyśmy, że 95% wyników będzie mieścić się w około dwóch odchyleniach standardowych ( ) po obu stronach prawdziwej średniej . Przedział ten nazywany jest przedziałem ufności , a promień (połowa przedziału) nazywany jest marginesem błędu , odpowiadającym 95% poziomowi ufności .

Ogólnie rzecz biorąc, na poziomie ufności próba z populacji o oczekiwanym odchyleniu standardowym ma margines błędu

gdzie oznacza kwantyl (często również z-score ) i jest błędem standardowym .

Odchylenie standardowe i błąd standardowy

Spodziewalibyśmy się, że wartości o rozkładzie normalnym   będą miały odchylenie standardowe, które w jakiś sposób zmienia się wraz z . Im mniejszy , tym szerszy margines. Nazywa się to błędem standardowym .

W przypadku pojedynczego wyniku z naszej ankiety zakładamy, że , a wszystkie kolejne wyniki razem będą miały wariancję .

Zauważ, że odpowiada to wariancji rozkładu Bernoulliego .

Maksymalny margines błędu na różnych poziomach ufności

Empiryczna reguła.PNG

Dla poziomu ufności istnieje odpowiedni przedział ufności dotyczący średniej , to znaczy przedział, w którym wartości powinny mieścić się z prawdopodobieństwem . Dokładne wartości są podane przez funkcję kwantylową rozkładu normalnego (którego przybliża reguła 68-95-99,7).

Zauważ, że jest undefined for , czyli jest undefined, tak jak .

 
0,68 0,994 457 883 210 0,999 3,290 526 731 492
0,90 1,644 853 626 951 0,9999 3,890 591 886 413
0,95 1.959963984540 0,999999 4,417 173 413 469
0,98 2,326 347 874 041 0,999999 4,891 638 475 699
0,99 2,575 829 303 549 0,9999999 5,326 723 886 384
0,995 2,807 033 768 344 0,999999999 5.730 728 868 236
0,997 2,967 737 925 342 0,9999999999 6.109 410 204 869
Wykresy log-log dla wielkości próbki n i poziomu ufności γ . Strzałki pokazują, że maksymalny błąd marginesu dla wielkości próbki 1000 wynosi ±3,1% przy 95% poziomie ufności i ±4,1% przy 99%. Wstawka parabola ilustruje związek między at i at . W tym przykładzie MOE 95 (0,71) 0,9 × ±3,1% ≈ ±2,8%.

Ponieważ w , możemy dowolnie ustawić , obliczyć , i uzyskać maksymalny margines błędu dla danego poziomu ufności i wielkości próby , nawet przed uzyskaniem rzeczywistych wyników. Z

Również przydatne dla każdego zgłoszonego

Określone marginesy błędu

Jeśli sonda ma wiele wyników procentowych (na przykład sonda mierząca pojedynczą preferencję wielokrotnego wyboru), wynik najbliższy 50% będzie miał największy margines błędu. Zazwyczaj jest to liczba, która jest zgłaszana jako margines błędu dla całej ankiety. Wyobraź sobie raporty z ankiet jako

(jak na powyższym rysunku)

Gdy dany procent zbliża się do ekstremów 0% lub 100%, jego margines błędu zbliża się do ±0%.

Porównywanie procentów

Wyobraź sobie raporty z ankiet wielokrotnego wyboru jako . Jak opisano powyżej, margines błędu zgłoszony dla ankiety będzie zwykle wynosił , ponieważ jest najbliższy 50%. Popularne pojęcie statystycznego remisu lub statystycznego martwego upału dotyczy jednak nie dokładności poszczególnych wyników, ale rankingu wyników. Który jest pierwszy?

Gdybyśmy hipotetycznie mieli przeprowadzić ankietę na kolejnych próbach respondentów (nowo dobranych z ) i podać wynik , moglibyśmy użyć standardowego błędu różnicy, aby zrozumieć, w jaki sposób ma spadać o . W tym celu musimy zastosować sumę wariancji, aby uzyskać nową wariancję, ,

gdzie jest kowariancja z i .

Tak więc (po uproszczeniu)

Należy zauważyć, że zakłada się, że jest on zbliżony do stałej, to znaczy, że respondenci wybierający A lub B prawie nigdy nie wybraliby C (dokonanie i bliskie idealnie ujemnie skorelowane ). Przy trzech lub więcej wyborach w bliższej rywalizacji wybór właściwej formuły staje się bardziej skomplikowany.

Wpływ skończonej wielkości populacji

Powyższe wzory na margines błędu zakładają, że istnieje nieskończenie duża populacja, a zatem nie zależą od wielkości populacji , a jedynie od wielkości próby . Zgodnie z teorią pobierania próbek założenie to jest uzasadnione, gdy frakcja pobierania próbek jest niewielka. Margines błędu dla konkretnej metody doboru próby jest zasadniczo taki sam, niezależnie od tego, czy interesująca populacja jest wielkości szkoły, miasta, stanu czy kraju, o ile frakcja próby jest niewielka.

W przypadkach, gdy ułamek próbkowania jest większy (w praktyce większy niż 5%), analitycy mogą skorygować margines błędu, stosując skończoną korektę populacji, aby uwzględnić dodatkową precyzję uzyskaną przez próbkowanie znacznie większego odsetka populacji. FPC można obliczyć za pomocą wzoru

…a więc gdyby sondaż przeprowadzono na ponad 24%, powiedzmy, elektoratu 300 tys. wyborców

Intuicyjnie, dla odpowiednio dużych ,

W pierwszym przypadku jest tak mały, że nie wymaga korekty. W tym drugim przypadku sondaż staje się w efekcie spisem, a błąd doboru próby staje się dyskusyjny.

Zobacz też

Uwagi

Bibliografia

  • Sudman, Seymour i Bradburn, Norman (1982). Zadawanie pytań: praktyczny przewodnik po projektowaniu kwestionariusza . San Francisco: Jossey Bass. ISBN  0-87589-546-8
  • Wonnacott, TH i RJ Wonnacott (1990). Statystyki wprowadzające (wyd. 5). Wileya. Numer ISBN 0-471-61518-8.

Zewnętrzne linki