Prawdopodobieństwo a posteriori - Posterior probability

W Bayesa statystycznych The prawdopodobieństwo a posteriori o zdarzenia losowego lub niepewnej propozycji jest prawdopodobieństwo warunkowe , który jest przypisany po odpowiednim dowodów lub tło jest brane pod uwagę. „Posterior” w tym kontekście oznacza po uwzględnieniu odpowiednich dowodów związanych z konkretną badaną sprawą.

Rozkład prawdopodobieństwa a posteriori to rozkład prawdopodobieństwa nieznanej wielkości, traktowany jako zmienna losowa , zależny od dowodów uzyskanych z eksperymentu lub badania.

Definicja

Prawdopodobieństwo a posteriori to prawdopodobieństwo parametrów podanych w dowodach : .

Kontrastuje to z funkcją wiarygodności , która jest prawdopodobieństwem dowodu o danych parametrach: .

Oba są powiązane w następujący sposób:

Biorąc pod uwagę wcześniejsze przekonanie, że funkcja rozkładu prawdopodobieństwa jest i że obserwacje mają wiarogodność , wtedy prawdopodobieństwo a posteriori definiuje się jako

gdzie jest stałą normalizującą i jest obliczana jako

for Continuous lub przez sumowanie wszystkich możliwych wartości for discrete .

Prawdopodobieństwo a posteriori jest zatem proporcjonalne do iloczynu Prawdopodobieństwo · Prawdopodobieństwo a priori .

Przykład

Załóżmy, że istnieje szkoła, w której uczy się 60% chłopców i 40% dziewcząt. Dziewczęta noszą spodnie lub spódnice w równych ilościach; wszyscy chłopcy noszą spodnie. Obserwator widzi (przypadkowego) ucznia z daleka; wszystko, co obserwator może zobaczyć, to to, że ten uczeń ma na sobie spodnie. Jakie jest prawdopodobieństwo, że ta studentka jest dziewczyną? Poprawną odpowiedź można obliczyć za pomocą twierdzenia Bayesa.

Zdarzenie polega na tym, że obserwowany uczeń jest dziewczyną, a obserwowany uczeń ma na sobie spodnie. Aby obliczyć prawdopodobieństwo a posteriori najpierw musimy wiedzieć:

  • lub prawdopodobieństwo, że uczeń jest dziewczyną, niezależnie od jakichkolwiek innych informacji. Ponieważ obserwator widzi losowego ucznia, co oznacza, że ​​wszyscy uczniowie mają takie samo prawdopodobieństwo bycia obserwowanymi, a odsetek dziewcząt wśród uczniów wynosi 40%, prawdopodobieństwo to wynosi 0,4.
  • , lub prawdopodobieństwo, że uczeń nie jest dziewczynką (tj. chłopcem) niezależnie od jakichkolwiek innych informacji ( jest wydarzeniem uzupełniającym do ). To jest 60%, czyli 0,6.
  • lub prawdopodobieństwo, że uczeń będzie nosił spodnie, biorąc pod uwagę, że uczeń jest dziewczyną. Ponieważ tak samo chętnie noszą spódnice jak spodnie, jest to 0,5.
  • lub prawdopodobieństwo, że uczeń nosi spodnie, biorąc pod uwagę, że uczeń jest chłopcem. Jest to podane jako 1.
  • lub prawdopodobieństwo, że (losowo wybrany) uczeń nosi spodnie niezależnie od jakichkolwiek innych informacji. Ponieważ (poprzez prawo całkowitego prawdopodobieństwa ), to jest .

Biorąc pod uwagę wszystkie te informacje, prawdopodobieństwo, że obserwator zauważył dziewczynę, biorąc pod uwagę, że obserwowany uczeń ma na sobie spodnie, można obliczyć, podstawiając te wartości do wzoru:

Intuicyjnym sposobem rozwiązania tego problemu jest założenie, że szkoła ma N uczniów. Liczba chłopców = 0,6N i liczba dziewcząt = 0,4N. Jeśli N jest wystarczająco duże, całkowita liczba osób noszących spodnie = 0,6N+ 50% z 0,4N. A liczba dziewczynek noszących spodnie = 50% z 0,4N. Dlatego w populacji spodni dziewczęta to (50% z 0,4N)/(0,6N+ 50% z 0,4N) = 25%. Innymi słowy, jeśli oddzielisz grupę noszących spodnie, jedną czwartą tej grupy będą dziewczyny. Dlatego jeśli widzisz spodnie, jedyne, co możesz wywnioskować, to to, że patrzysz na pojedynczą próbkę z podzbioru uczniów, w której 25% stanowią dziewczęta. A z definicji szansa, że ​​ta przypadkowa uczennica będzie dziewczynką, wynosi 25%. W ten sposób można rozwiązać każdy problem z twierdzeniem Bayesa.

Obliczenie

Rozkład prawdopodobieństwa a posteriori jednej zmiennej losowej o wartości innej można obliczyć za pomocą twierdzenia Bayesa, mnożąc rozkład prawdopodobieństwa a priori przez funkcję wiarygodności , a następnie dzieląc przez stałą normalizującą , w następujący sposób:

podaje funkcję gęstości prawdopodobieństwa a posteriori dla zmiennej losowej z danych , gdzie

  • jest poprzednią gęstością ,
  • jest funkcją wiarygodności jako funkcją ,
  • jest stałą normalizującą, a
  • to gęstość a posteriori danych .

Wiarygodny interwał

Prawdopodobieństwo a posteriori to prawdopodobieństwo warunkowe uwarunkowane losowo obserwowanymi danymi. Jest to więc zmienna losowa. W przypadku zmiennej losowej ważne jest podsumowanie jej niepewności. Jednym ze sposobów osiągnięcia tego celu jest zapewnienie wiarygodnego przedziału prawdopodobieństwa a posteriori.

Klasyfikacja

W klasyfikacji prawdopodobieństwa a posteriori odzwierciedlają niepewność oceny obserwacji do określonej klasy, patrz także Prawdopodobieństwo przynależności do klasy . Podczas gdy metody klasyfikacji statystycznej z definicji generują prawdopodobieństwa a posteriori, systemy uczące się zwykle dostarczają wartości członkostwa, które nie wywołują żadnej pewności probabilistycznej. Pożądane jest przekształcenie lub przeskalowanie wartości przynależności do prawdopodobieństw przynależności do klasy, ponieważ są one porównywalne i dodatkowo łatwiejsze do zastosowania do przetwarzania końcowego.

Zobacz też

Bibliografia

Dalsza lektura