Prawdopodobieństwo funkcji masowej - Probability mass function

Wykres funkcji masy prawdopodobieństwa. Wszystkie wartości tej funkcji muszą być nieujemne i sumować się do 1.

W prawdopodobieństwa i statystyki , A funkcja masy prawdopodobieństwa jest funkcją, która daje prawdopodobieństwo, że dyskretna zmienna losowa jest dokładnie równa pewnej wartości. Czasami jest również znany jako funkcja gęstości dyskretnej. Funkcja masy prawdopodobieństwa jest często podstawowym sposobem definiowania dyskretnego rozkładu prawdopodobieństwa , a takie funkcje istnieją zarówno dla skalarnych, jak i wielowymiarowych zmiennych losowych, których dziedzina jest dyskretna.

Funkcja masy prawdopodobieństwa różni się od funkcji gęstości prawdopodobieństwa (PDF) tym, że ta ostatnia jest powiązana z ciągłymi, a nie dyskretnymi zmiennymi losowymi. Aby uzyskać prawdopodobieństwo, plik PDF musi być zintegrowany w przedziale.

Wartość zmiennej losowej o największej masie prawdopodobieństwa nazywamy modą .

Formalna definicja

Funkcja masy prawdopodobieństwa jest rozkładem prawdopodobieństwa dyskretnej zmiennej losowej i podaje możliwe wartości oraz związane z nimi prawdopodobieństwa. Jest to funkcja zdefiniowana przez

dla , gdzie jest miarą prawdopodobieństwa . można również uprościć jako .

Prawdopodobieństwa związane ze wszystkimi (hipotetycznymi) wartościami muszą być nieujemne i sumować się do 1,

i .

Myślenie o prawdopodobieństwie jako masie pomaga uniknąć błędów, ponieważ masa fizyczna jest zachowana, podobnie jak całkowite prawdopodobieństwo dla wszystkich hipotetycznych wyników .

Zmierz sformułowanie teoretyczne

Funkcja masy prawdopodobieństwa dyskretnej zmiennej losowej może być postrzegane jako szczególnym przypadku dwóch lub większej liczby środka ogólnego teoretycznych konstrukcji: w dystrybucji w i przez gęstość w odniesieniu do środków zliczania . Poniżej precyzujemy to.

Załóżmy, że jest to przestrzeń prawdopodobieństwa i jest to przestrzeń mierzalna, której podstawowa σ-algebra jest dyskretna, a więc w szczególności zawiera pojedyncze zbiory . W tym ustawieniu zmienna losowa jest dyskretna pod warunkiem, że jej obraz jest policzalny. Środek odwzorowanie styczne -called rozkładu w tym kontekście, to miara prawdopodobieństwa, na której ograniczenie do pojedynczych odbiorników wywołuje funkcję masy prawdopodobieństwa (jak wspomniano w poprzednim paragrafie) , ponieważ dla każdego .

Załóżmy teraz, że jest to przestrzeń miarowa wyposażona w miarę zliczania μ. Funkcja gęstości prawdopodobieństwa w odniesieniu do środka do liczenia, jeśli istnieje, jest pochodną Radona-Nikodyma środka odwzorowanie styczne z (w odniesieniu do środka liczenie), tak i jest funkcją z do nieujemne liczb rzeczywistych. W konsekwencji dla wszystkich, które mamy

wykazanie, że jest to w rzeczywistości funkcja masy prawdopodobieństwa.

Gdy istnieje naturalny porządek wśród potencjalnych wyników , wygodnie może być przypisanie im wartości liczbowych (lub n -krotek w przypadku dyskretnej wielowymiarowej zmiennej losowej ) i uwzględnienie również wartości nie będących w obrazie . Oznacza to, że mogą być zdefiniowane dla wszystkich liczb rzeczywistych i dla wszystkich, jak pokazano na rysunku.

Obraz ma policzalny podzbiór, na którym funkcja masy prawdopodobieństwa jest jedna. W konsekwencji funkcja masy prawdopodobieństwa wynosi zero dla wszystkich wartości oprócz policzalnej liczby .

Nieciągłość funkcji masy prawdopodobieństwa jest związana z faktem, że dystrybuanty dyskretnej zmiennej losowej również są nieciągłe. Jeżeli jest dyskretną zmienną losową, to oznacza, że ​​przypadkowe zdarzenie jest pewne (jest to prawda w 100% przypadków); wręcz przeciwnie, oznacza, że ​​przypadkowe wydarzenie jest zawsze niemożliwe. To stwierdzenie nie jest prawdziwe dla ciągłej zmiennej losowej , dla której dla każdej możliwej . Dyskretyzacja to proces przekształcania ciągłej zmiennej losowej w zmienną dyskretną.

Przykłady

Skończone

Istnieją trzy główne dystrybucje związane, tym rozkład zero-jedynkowy , rozkładu dwumianowego i rozkładu geometrycznego .

  • Rozkład Bernoulliego: ber(p) , służy do modelowania eksperymentu z tylko dwoma możliwymi wynikami. Te dwa wyniki są często zakodowane jako 1 i 0.
    Przykładem rozkładu Bernoulliego jest rzucanie monetą. Załóżmy, że jest to przestrzeń próbna wszystkich wyników pojedynczego rzutu uczciwą monetą i jest to zmienna losowa zdefiniowana po przypisaniu 0 do kategorii „reszki” i 1 do kategorii „orzełki”. Ponieważ moneta jest uczciwa, funkcja masy prawdopodobieństwa wynosi
  • Rozkład dwumianowy , modeluje liczbę sukcesów, gdy ktoś losuje n razy z wymianą. Każde losowanie lub eksperyment jest niezależny i ma dwa możliwe wyniki. Powiązana funkcja masy prawdopodobieństwa to .
    Funkcja masy prawdopodobieństwa uczciwej kostki . Wszystkie liczby na kostce mają taką samą szansę pojawienia się na górze, gdy kostka przestanie się rzucać.
    Przykładem rozkładu dwumianowego jest prawdopodobieństwo uzyskania dokładnie jednej 6, gdy ktoś rzuci uczciwą kostką trzy razy.
  • Rozkład geometryczny opisuje liczbę prób potrzebnych do osiągnięcia jednego sukcesu. Jego funkcją masy prawdopodobieństwa jest .
    Przykładem jest rzucanie monetą, aż pojawi się pierwsza głowa. Litera „p” oznacza prawdopodobieństwo pojawienia się głowy, a „k” oznacza liczbę rzutów monetą do momentu pojawienia się głowy.
    Inne rozkłady, które można modelować za pomocą funkcji masy prawdopodobieństwa, to rozkład kategoryczny (znany również jako uogólniony rozkład Bernoulliego) i rozkład wielomianowy .
  • Jeśli rozkład dyskretny ma dwie lub więcej kategorii, z których jedna może wystąpić, niezależnie od tego, czy kategorie te mają naturalne uporządkowanie, czy nie, gdy jest tylko jedna próba (losowanie), jest to rozkład kategoryczny.
  • Przykładem wielowymiarowego rozkładu dyskretnego i jego funkcji masy prawdopodobieństwa jest rozkład wielomianowy . Tutaj wiele zmiennych losowych to liczby sukcesów w każdej z kategorii po określonej liczbie prób, a każda niezerowa masa prawdopodobieństwa daje prawdopodobieństwo pewnej kombinacji liczb sukcesów w różnych kategoriach.

Nieskończony

  • Poniższy rozkład wykładniczo malejący jest przykładem rozkładu z nieskończoną liczbą możliwych wyników — wszystkimi dodatnimi liczbami całkowitymi:
    Pomimo nieskończonej liczby możliwych wyników, całkowita masa prawdopodobieństwa wynosi 1/2 + 1/4 + 1/8 + ⋯ = 1, spełniając wymóg całkowitego prawdopodobieństwa jednostkowego dla rozkładu prawdopodobieństwa.

Przypadek wielowymiarowy

Dwie lub więcej dyskretnych zmiennych losowych ma łączną funkcję masy prawdopodobieństwa, która podaje prawdopodobieństwo każdej możliwej kombinacji realizacji dla zmiennych losowych.

Bibliografia

Dalsza lektura