Sprawdzenie, czy moneta jest uczciwa - Checking whether a coin is fair

W statystyce kwestia sprawdzenia, czy moneta jest uczciwa, to taka, której znaczenie polega, po pierwsze, na przedstawieniu prostego problemu, na którym zilustruje się podstawowe idee wnioskowania statystycznego, a po drugie, na przedstawieniu prostego problemu, który można wykorzystać do porównania różnych konkurencyjne metody wnioskowania statystycznego, w tym teoria decyzji . Praktyczny problem sprawdzania, czy moneta jest uczciwa, można uznać za łatwy do rozwiązania, przeprowadzając wystarczająco dużą liczbę prób, ale statystyka i teoria prawdopodobieństwa mogą dostarczyć wskazówek dotyczących dwóch rodzajów pytań; w szczególności te dotyczące liczby prób do podjęcia i dokładności oszacowania prawdopodobieństwa pojawienia się głów, wyprowadzone z danej próby prób.

Fair moneta jest wyidealizowany urządzenie losowanie z dwóch stanów (zazwyczaj o nazwie „głowy” i „ogony” ), które są jednakowo prawdopodobne. Opiera się na rzucie monetą szeroko stosowanym w sporcie i innych sytuacjach, w których wymagane jest zapewnienie dwóm stronom tej samej szansy na wygraną. Używany jest albo specjalnie zaprojektowany żeton, albo, częściej, zwykła moneta walutowa , chociaż ta ostatnia może być nieco „niesprawiedliwa” ze względu na asymetryczny rozkład wagi, co może powodować, że jeden stan występuje częściej niż drugi, dając jednej ze stron nieuczciwą przewagę . Może więc być konieczne przetestowanie eksperymentalnie, czy moneta jest rzeczywiście „uczciwa” – to znaczy, czy prawdopodobieństwo, że moneta spadnie na którąś ze stron podczas rzucania, wynosi dokładnie 50%. Oczywiście niemożliwe jest wykluczenie arbitralnie małych odchyleń od uczciwości, takich, jakich można by oczekiwać, że wpłyną tylko na jedno przerzucenie w ciągu całego życia przerzucania; również zawsze jest możliwe, że nieuczciwa (lub „ stronnicza ”) moneta wyrzuci dokładnie 10 resztek w 20 rzutach. Dlatego każdy test rzetelności musi jedynie ustalić pewien stopień zaufania do pewnego stopnia rzetelności (pewne maksymalne obciążenie). W bardziej rygorystycznej terminologii problem polega na określeniu parametrów procesu Bernoulliego , biorąc pod uwagę tylko ograniczoną próbkę prób Bernoulliego .

Preambuła

W tym artykule opisano eksperymentalne procedury określania, czy moneta jest uczciwa, czy nieuczciwa. Istnieje wiele statystycznych metod analizy takiej procedury eksperymentalnej. Ten artykuł ilustruje dwa z nich.

Obie metody zalecają eksperyment (lub próbę), w którym monetą rzuca się wiele razy, a wynik każdego rzutu jest rejestrowany. Wyniki można następnie przeanalizować statystycznie, aby zdecydować, czy moneta jest „uczciwa”, czy „prawdopodobnie nieuczciwa”.

  • Funkcja gęstości prawdopodobieństwa a posteriori lub PDF ( podejście bayesowskie ). Początkowo prawdziwe prawdopodobieństwo uzyskania określonej strony podczas rzucania monetą jest nieznane, ale niepewność jest reprezentowana przez „ uprzedni rozkład ”. Teoria wnioskowania bayesowskiego służy do wyprowadzenia rozkładu a posteriori przez połączenie rozkładu a priori i funkcji wiarygodności, która reprezentuje informacje uzyskane z eksperymentu. Prawdopodobieństwo, że ta konkretna moneta jest „uczciwą monetą”, można następnie uzyskać, integrując PDF rozkładu a posteriori w odpowiednim przedziale, który reprezentuje wszystkie prawdopodobieństwa, które można uznać za „uczciwe” w sensie praktycznym.
  • Estymator prawdopodobieństwa rzeczywistego ( podejście freektystyczne ). Metoda ta zakłada, że ​​eksperymentator może decydować o rzucie monetą dowolną ilość razy. Eksperymentator najpierw decyduje o wymaganym poziomie ufności i dopuszczalnym marginesie błędu. Te parametry określają minimalną liczbę rzutów, które należy wykonać, aby ukończyć eksperyment.

Ważną różnicą między tymi dwoma podejściami jest to, że pierwsze podejście nadaje pewną wagę wcześniejszemu doświadczeniu w rzucaniu monetami, podczas gdy drugie nie. Kwestia, jaką wagę należy nadać wcześniejszemu doświadczeniu, w zależności od jakości (wiarygodności) tego doświadczenia, jest omawiana w ramach teorii wiarygodności .

Funkcja gęstości prawdopodobieństwa a posteriori

Jedną metodą jest obliczenie tylną funkcję gęstości prawdopodobieństwa z teorii prawdopodobieństwa Bayesa .

Test jest wykonywany przez rzucenie monetą N razy i zanotowanie zaobserwowanej liczby orłów, h i reszek, t . Symbole H i T reprezentują bardziej uogólnione zmienne wyrażające odpowiednio liczbę głów i ogonów, które można było zaobserwować w eksperymencie. Zatem N = H + T = h + t .

Następnie niech r będzie rzeczywistym prawdopodobieństwem uzyskania orła w jednym rzucie monetą. Jest to własność badanej monety. Korzystając z twierdzenia Bayesa , gęstość prawdopodobieństwa a posteriori r w zależności od h i t jest wyrażona w następujący sposób:

gdzie g ( r ) reprezentuje wcześniejszy rozkład gęstości prawdopodobieństwa r , który leży w zakresie od 0 do 1.

Wcześniejszy rozkład gęstości prawdopodobieństwa podsumowuje to, co wiadomo o rozkładzie r przy braku jakichkolwiek obserwacji. Zakładamy, że przed rozkład z R jest jednolita w przedziale [0, 1]. Oznacza to, że g ( r ) = 1. (W praktyce bardziej odpowiednie byłoby założenie wcześniejszego rozkładu, który ma znacznie większą wagę w regionie około 0,5, aby odzwierciedlić nasze doświadczenia z prawdziwymi monetami).

Prawdopodobieństwo uzyskania reszki h w N rzutach monetą z prawdopodobieństwem resztek równym r jest określone przez rozkład dwumianowy :

Zastępując to w poprzednim wzorze:

W rzeczywistości jest to rozkład beta ( koniugat poprzedzający rozkład dwumianowy), którego mianownik można wyrazić w postaci funkcji beta :

Ponieważ założono jednostajny rozkład a priori, a ponieważ h i t są liczbami całkowitymi, można to również zapisać w postaci silni :

Przykład

Np. niech N = 10, h = 7, czyli moneta jest rzucana 10 razy i otrzymuje się 7 orłów:

Wykres na prawej przedstawia funkcja gęstości od R , zważywszy, że głowice 7 uzyskano w 10 rzutach. (Uwaga: r jest prawdopodobieństwem uzyskania orła podczas jednorazowego rzucenia tą samą monetą.)

Wykres gęstości prawdopodobieństwa f ( r  |  H  = 7, T  = 3) = 1320  r 7  (1 -  r ) 3 z r w zakresie od 0 do 1.

Prawdopodobieństwo bezstronnej monety (w tym celu definiowanej jako taka, której prawdopodobieństwo wypadnięcia orła wynosi od 45% do 55%)

jest mały w porównaniu z hipotezą alternatywną (tendencyjna moneta). Nie jest jednak na tyle mały, abyśmy uwierzyli, że moneta ma znaczące stronniczość. Prawdopodobieństwo to jest nieco wyższe niż nasze założenie, że moneta była uczciwa, co odpowiada jednorodnemu rozkładowi wcześniejszemu, które wynosiło 10%. Stosując rozkład a priori, który odzwierciedla naszą wcześniejszą wiedzę o tym, czym jest moneta i jak działa, rozkład a posteriori nie będzie faworyzował hipotezy stronniczości. Jednak liczba prób w tym przykładzie (10 rzutów) jest bardzo mała, a przy większej liczbie prób wybór wcześniejszej dystrybucji byłby nieco mniej istotny).

Przy jednolitym a priori rozkład prawdopodobieństwa a posteriori f ( r  |  H  = 7, T  = 3) osiąga swój szczyt przy r  =  h  / ( h  +  t ) = 0,7; Wartość ta jest nazywana maksimum a posteriori (MAP), oszacowanie z r . Także jednolite przed The wartość oczekiwana z R podstawie rozkładu tylnej jest


Estymator prawdziwego prawdopodobieństwa

Najlepszym estymatorem dla rzeczywistej wartości jest estymator .

Ten estymator ma margines błędu (E) przy określonym poziomie ufności.

Stosując to podejście, aby zdecydować, ile razy należy rzucić monetą, wymagane są dwa parametry:

  1. Poziom ufności oznaczony przedziałem ufności (Z)
  2. Maksymalny (dopuszczalny) błąd (E)
  • Poziom ufności jest oznaczony przez Z i jest podany przez wartość Z standardowego rozkładu normalnego . Tę wartość można odczytać ze standardowej tabeli statystyk wyników dla rozkładu normalnego. Oto kilka przykładów:
Wartość Z Poziom zaufania Komentarz
0,6745 daje poziom ufności 50 000 % Połowa
1.0000 daje 68,269 % poziom ufności Jedno std
1.6449 daje 90 000 % poziom ufności „Jeden dziewięć”
1,9599 daje 95 000 % poziomu ufności 95 procent
2.0000 daje 95.450 % poziom ufności Dwa std dev
2,5759 daje 99 000 % poziom ufności „Dwie dziewiątki”
3.0000 daje 99,730 % poziomu ufności Trzy std dev
3,2905 daje 99.900 % poziom ufności „Trzy dziewiątki”
3.8906 daje 99,990 % poziom ufności „Cztery dziewiątki”
4.0000 daje 99,993 % poziom ufności Cztery std
4.4172 daje 99,999 % poziom ufności „Pięć dziewiątek”
  • Maksymalny błąd (E) jest określony przez gdzie jest szacowanym prawdopodobieństwem uzyskania orłów. Uwaga: jest to takie samo rzeczywiste prawdopodobieństwo (uzyskania orłów) jak w poprzedniej sekcji tego artykułu.
  • W statystyce oszacowanie części próby (oznaczonej przez p ) zawiera błąd standardowy określony wzorem :

gdzie n jest liczbą prób (oznaczoną przez N w poprzedniej sekcji).

Ta standardowa funkcja błędu p ma maksimum przy . Co więcej, w przypadku rzucania monetą, prawdopodobnie p nie będzie dalekie od 0,5, więc rozsądne jest przyjęcie p =0,5 w następujący sposób:

I stąd wartość błędu maksymalnego (E) dana jest wzorem

Obliczanie wymaganej liczby rzutów monetą, n ,

Przykłady

1. Jeśli pożądany jest maksymalny błąd 0,01, ile razy należy rzucić monetą?

przy 68,27% poziomie ufności (Z=1)
przy 95,45% poziomie ufności (Z=2)
przy 99,90% poziomie ufności (Z=3,3)

2. Jeżeli moneta jest rzucana 10000 razy, jaki jest maksymalny błąd estymatora na wartości (rzeczywiste prawdopodobieństwo uzyskania orła w rzucie monetą)?

przy 68,27% poziomie ufności (Z=1)
przy 95,45% poziomie ufności (Z=2)
przy 99,90% poziomie ufności (Z=3,3)

3. Moneta została rzucona 12000 razy z wynikiem 5961 orłów (i 6039 reszek). W jakim przedziale mieści się wartość (prawdziwe prawdopodobieństwo uzyskania orła), jeśli pożądany jest poziom ufności 99,999%?

Teraz znajdź wartość Z odpowiadającą 99,999% poziomowi ufności.

Teraz oblicz E

Przedział zawierający r to zatem:

Inne podejścia

Inne podejścia do kwestii sprawdzenia, czy moneta jest uczciwa, są dostępne za pomocą teorii decyzji , której zastosowanie wymagałoby sformułowania funkcji straty lub funkcji użyteczności opisującej konsekwencje podjęcia danej decyzji. Podejściem, które unika wymagania funkcji straty lub prawdopodobieństwa a priori (jak w podejściu bayesowskim) jest „próbkowanie akceptacyjne”.

Inne aplikacje

Powyższa matematyczna analiza w celu ustalenia, czy moneta jest uczciwa, może być również zastosowana do innych zastosowań. Na przykład:

  • Ustalenie proporcji wadliwych rzeczy do produktu poddanego szczególnemu (ale dobrze określonemu) warunkowi. Czasami produkt może być bardzo trudny lub kosztowny w produkcji. Ponadto, jeśli testowanie takich produktów będzie skutkowało ich zniszczeniem, należy przetestować minimalną liczbę pozycji. Korzystając z podobnej analizy, można znaleźć funkcję gęstości prawdopodobieństwa wskaźnika wadliwości produktu.
  • Ankieta na dwie strony. Jeśli przeprowadza się małą, losową ankietę próbną, w której są tylko dwie wzajemnie wykluczające się opcje, jest to podobne do wielokrotnego rzucania jedną monetą przy użyciu monety o możliwej stronniczości. Podobną analizę można zatem zastosować do określenia zaufania, jakie należy przypisać rzeczywistemu stosunkowi oddanych głosów. (Jeśli ludziom wolno się wstrzymać, analiza musi to uwzględnić, a analogia rzutu monetą nie do końca się sprawdza).
  • Określanie proporcji płci w dużej grupie gatunków zwierząt. Przy założeniu, że przy losowym doborze populacji zostanie pobrana niewielka próba losowa (tj. mała w porównaniu z całą populacją), analiza jest podobna do określenia prawdopodobieństwa uzyskania orła w losowym rzucie monetą.

Zobacz też

Bibliografia

  1. ^ Jednakże, jeśli moneta zostanie złapana, a nie pozwoli się jej odbić lub zakręcić, trudno jest zmienić wynik rzutu monetą. Zobacz Gelman , Andrew; Debora Nolan (2002). „Kącik nauczyciela: można załadować kostkę, ale nie można stronniczo monety”. Statystyk amerykański . 56 (4): 308–311. doi : 10.1198/000313002605 .
  2. ^ Cox, DR, Hinkley, DV (1974) Statystyka teoretyczna (przykład 11.7), Chapman & Hall. ISBN  0-412-12420-3
  • Guttman, Wilks i Hunter: Wstępne statystyki inżynieryjne , John Wiley & Sons, Inc. (1971) ISBN  0-471-33770-6
  • Devinder Sivia: Analiza danych , samouczek bayesowski , Oxford University Press (1996) ISBN  0-19-851889-7