Przestrzeń prawdopodobieństwa - Probability space

W teorii prawdopodobieństwa , wykorzystując przestrzeń prawdopodobieństwo lub prawdopodobieństwo potrójny jest matematyczny konstrukt , który zapewnia formalny model losowego procesu lub „eksperyment”. Na przykład można zdefiniować przestrzeń prawdopodobieństwa, która modeluje rzut kostką .

Przestrzeń prawdopodobieństwa składa się z trzech elementów:

  1. Przestrzeń próbka , , która jest zbiorem wszystkich możliwych wyników .
  2. Przestrzeń zdarzeń , która jest zbiorem zdarzeń , zdarzenie będące zbiorem wyników w przestrzeni próbek.
  3. Funkcja prawdopodobieństwa , która przypisuje każdemu zdarzeniu w przestrzeni zdarzeń prawdopodobieństwo , które jest liczbą z zakresu od 0 do 1.

Aby zapewnić sensowny model prawdopodobieństwa, elementy te muszą spełniać szereg aksjomatów, szczegółowo opisanych w tym artykule.

W przykładzie rzutu kostką standardową przyjęlibyśmy przestrzeń próbki jako . W przypadku przestrzeni zdarzeń moglibyśmy po prostu użyć zbioru wszystkich podzbiorów przestrzeni próbki, która zawierałaby wtedy proste zdarzenia, takie jak („kostka ląduje na 5”), a także złożone zdarzenia, takie jak („ kostka ląduje na 5”). Liczba parzysta"). Na koniec, w przypadku funkcji prawdopodobieństwa, zmapowalibyśmy każde zdarzenie na liczbę wyników w tym zdarzeniu podzieloną przez 6 — więc na przykład zostanie zmapowany na i będzie zmapowany na .

Kiedy przeprowadzamy eksperyment, wyobrażamy sobie, że „natura” „wybiera” pojedynczy wynik , z przestrzeni próbki . O wszystkich zdarzeniach w przestrzeni zdarzeń, które zawierają wybrany wynik, mówi się, że „wystąpiły”. Ten „wybór” odbywa się w taki sposób, że gdyby eksperyment został powtórzony wiele razy, liczba wystąpień każdego zdarzenia, jako ułamek całkowitej liczby eksperymentów, najprawdopodobniej zmierzałaby w kierunku prawdopodobieństwa przypisanego temu zdarzeniu przez prawdopodobieństwo funkcja .

Rosyjski matematyk Andriej Kołmogorow wprowadził pojęcie przestrzeni probabilistycznej wraz z innymi aksjomatami prawdopodobieństwa w latach 30. XX wieku. We współczesnej teorii prawdopodobieństwa istnieje wiele alternatywnych podejść do aksjomatyzacji — na przykład algebra zmiennych losowych .

Wstęp

Przestrzeń prawdopodobieństwa rzucenia kostką dwa razy z rzędu: Przestrzeń próbki składa się ze wszystkich 36 możliwych wyników; pokazano trzy różne zdarzenia (kolorowe wielokąty) wraz z odpowiadającymi im prawdopodobieństwami (przy założeniu dyskretnego rozkładu równomiernego ).

Przestrzeń prawdopodobieństwa to matematyczna trójka, która przedstawia model dla określonej klasy sytuacji w świecie rzeczywistym. Podobnie jak w przypadku innych modeli, jej autor ostatecznie określa, które elementy , i będzie zawierać.

  • Przestrzeń prób to zbiór wszystkich możliwych wyników. Wynik jest wynikiem pojedynczego wykonania modelu. Wynikami mogą być stany natury, możliwości, wyniki eksperymentalne i tym podobne. Każdy przypadek rzeczywistej sytuacji (lub przebieg eksperymentu) musi dawać dokładnie jeden wynik. Jeśli wyniki różnych przebiegów eksperymentu różnią się w jakikolwiek istotny sposób, są to odrębne wyniki. To, jakie różnice mają znaczenie, zależy od rodzaju analizy, którą chcemy przeprowadzić. Prowadzi to do różnych wyborów przestrzeni próbki.
  • Σ-algebra jest zbiorem wszystkich zdarzeń chcielibyśmy rozważyć. Ta kolekcja może, ale nie musi obejmować każdego z podstawowych wydarzeń. Tutaj „zdarzenie” jest zbiorem zerowym lub więcej wyników, tj. podzbiorem przestrzeni próbek. Uznaje się, że zdarzenie „zdarzyło się” podczas eksperymentu, gdy wynik tego ostatniego jest elementem zdarzenia. Ponieważ ten sam wynik może należeć do wielu zdarzeń, możliwe jest, że wiele zdarzeń zajdzie w przypadku jednego wyniku. Na przykład, gdy próba polega na rzuceniu dwiema kostkami, zbiór wszystkich wyników z sumą 7 oczek może stanowić zdarzenie, podczas gdy wyniki z nieparzystą liczbą oczek mogą stanowić inne zdarzenie. Jeśli wynikiem jest element podstawowego zdarzenia dwóch pipsów na pierwszej kostce i pięciu na drugiej, to mówi się, że oba zdarzenia, „7 pipsów” i „nieparzysta liczba pipsów”, miały miejsce.
  • Miarą prawdopodobieństwa jest funkcją powrocie zdarzenia, prawdopodobieństwo . Prawdopodobieństwo to liczba rzeczywista pomiędzy zerem (zdarzenia niemożliwe mają prawdopodobieństwo zerowe, chociaż zdarzenia prawdopodobieństwo zerowe niekoniecznie są niemożliwe) a jedynką (zdarzenie zachodzi prawie na pewno , z niemal całkowitą pewnością). Tak jest funkcja . Funkcja miarą prawdopodobieństwa musi spełnić dwa proste warunki: po pierwsze, prawdopodobieństwo policzalnych unii wzajemnie wykluczających się zdarzeń musi być równa policzalnych suma prawdopodobieństw każdego z tych zdarzeń. Na przykład prawdopodobieństwo zjednoczenia wzajemnie wykluczających się zdarzeń iw losowym eksperymencie jednego rzutu monetą jest sumą prawdopodobieństwa dla i prawdopodobieństwa dla , . Po drugie, prawdopodobieństwo przestrzeni próbnej musi być równe 1 (co uwzględnia fakt, że przy wykonaniu modelu musi nastąpić jakiś wynik). W poprzednim przykładzie prawdopodobieństwo zbioru wyników musi być równa jeden, ponieważ jest całkowicie pewny, że wynik będzie albo albo (model zaniedbuje żadnej innej możliwości) w jednym losowaniu.

Nie każdy podzbiór przestrzeni próbki musi być koniecznie uważany za zdarzenie: niektóre podzbiory po prostu nie są interesujące, innych nie można „zmierzyć” . Nie jest to tak oczywiste w przypadku rzutu monetą. W innym przykładzie, można by rozważyć długość rzutu oszczepem, gdzie zdarzeniami są zazwyczaj odstępy takie jak „od 60 do 65 metrów” i sumy takich odstępów, ale nie zestawy takie jak „liczby niewymierne między 60 a 65 metrów”.

Definicja

Krótko mówiąc, przestrzeń prawdopodobieństwa jest przestrzenią miary taką, że miara całej przestrzeni jest równa jeden.

Rozszerzona definicja jest następująca: przestrzeń prawdopodobieństwa to trójka składająca się z:

  • przestrzeń próbka - dowolny niepusty zbiór ,
  • σ-algebra (zwany także σ-field) - zbiór podzbiorów , zwanych zdarzeń , tak że:
    • zawiera przestrzeń próbki: ,
    • jest zamknięta pod uzupełnieniami : if , to także ,
    • jest zamknięty pod policzalnych związków : jeśli do , a następnie także
      • Konsekwencją dwóch poprzednich własności i prawa De Morgana jest to, że jest również domknięta pod
    przecinkami policzalnymi : jeśli dla , to także
  • miarą prawdopodobieństwa - funkcja na takie, że:
    • P jest przeliczalnie addytywne (zwane także σ-addytywnym): jeśli jest przeliczalnym zbiorem parami rozłącznych zbiorów , to
    • miara całej przestrzeni próbki jest równa jeden: .
  • Dyskretna obudowa

    Dyskretna teoria prawdopodobieństwa potrzebuje tylko co najwyżej policzalnych przestrzeni próbek . Prawdopodobieństwa mogą być przypisane punktom przez funkcję masy prawdopodobieństwa tak, że . Wszystkie podzbiory mogą być traktowane jako zdarzenia (w ten sposób, jest zestaw power ). Miara prawdopodobieństwa przybiera prostą postać

    Największa σ-algebra opisuje kompletną informację. Ogólnie rzecz biorąc, σ-algebra odpowiada skończonemu lub przeliczalnemu podziałowi , przy czym ogólną formą zdarzenia jest . Zobacz także przykłady.

    Przypadek jest dozwolony przez definicję, ale rzadko używany, ponieważ można go bezpiecznie wykluczyć z przestrzeni próbki.

    Sprawa ogólna

    Jeśli Ω jest niepoliczalne , może się jednak zdarzyć, że p ( ω ) ≠ 0 dla niektórych ω ; takie ω nazywamy atomami . Są one co najwyżej przeliczalnym (może pustym ) zbiorem, którego prawdopodobieństwo jest sumą prawdopodobieństw wszystkich atomów. Jeśli ta suma jest równa 1, to wszystkie inne punkty można bezpiecznie wykluczyć z przestrzeni próbek, cofając nas do przypadku dyskretnego. W przeciwnym razie, jeśli suma prawdopodobieństw wszystkich atomów wynosi od 0 do 1, przestrzeń prawdopodobieństwa rozkłada się na część dyskretną (atomową) (być może pustą) i część nieatomową .

    Przypadek nieatomowy

    Jeśli p ( ω ) = 0 dla wszystkich ω ∈Ω (w tym przypadku Ω musi być niepoliczalne, ponieważ w przeciwnym razie P(Ω)=1 nie może być spełnione), to równanie (∗) zawodzi: prawdopodobieństwo zbioru nie jest koniecznie suma nad prawdopodobieństwami jej elementów, ponieważ sumowanie jest zdefiniowane tylko dla policzalnej liczby elementów. To sprawia, że ​​teoria przestrzeni prawdopodobieństwa jest znacznie bardziej techniczna. Sformułowanie silniejsze niż sumowanie, teoria miary ma zastosowanie. Początkowo prawdopodobieństwa przypisywane są pewnym zbiorom „generującym” (patrz przykłady). Następnie procedura ograniczająca umożliwia przypisanie prawdopodobieństw do zbiorów, które są granicami sekwencji zespołów prądotwórczych lub granicami granic i tak dalej. Wszystkie te zbiory są σ-algebrą . Szczegóły techniczne można znaleźć w

    twierdzeniu Carathéodory'ego o rozszerzeniu . Zbiory należące do grupy nazywane są mierzalnymi . Generalnie są one znacznie bardziej skomplikowane niż zespoły prądotwórcze, ale znacznie lepsze niż zespoły niemierzalne .

    Pełna przestrzeń prawdopodobieństwa

    Mówi się, że przestrzeń prawdopodobieństwa jest pełną przestrzenią prawdopodobieństwa, jeśli dla wszystkich zi wszystko ma . Często badanie przestrzeni prawdopodobieństwa ogranicza się do pełnych przestrzeni prawdopodobieństwa.

    Przykłady

    Dyskretne przykłady

    Przykład 1

    Jeśli eksperyment składa się tylko z jednego rzutu uczciwą monetą , wynikiem jest orła lub reszka: . σ-algebra zawiera zdarzenia, a mianowicie: ( „orzechy”), ( „reszki”), ( „ani orzeł ani ogonów”) i ( „albo orzeł lub ogona”); innymi słowy, . Istnieje pięćdziesiąt procent szans na rzucenie orłem i pięćdziesiąt procent na reszkę, więc miarą prawdopodobieństwa w tym przykładzie jest , , , .

    Przykład 2

    Uczciwa moneta jest rzucana trzy razy. Jest 8 możliwych wyników: Ω = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT} (tutaj „HTH” oznacza na przykład, że za pierwszym razem moneta wylądowała orłem, za drugim rewersem, a za ostatnim ponownie głowy). Pełna informacja jest opisana przez σ-algebrę = 2

    Ω z 28 = 256 zdarzeń, gdzie każde ze zdarzeń jest podzbiorem Ω.

    Alicja zna tylko wynik drugiego rzutu. Tak więc jej niepełna informacja jest opisana przez podział Ω = A 1 ⊔ A 2 = {HHH, HHT, THH, THT} ⊔ {HTH, HTT, TTH, TTT}, gdzie ⊔ jest sumą rozłączną i odpowiadającą jej σ-algebrą

    Alicja = {{}, A 1 , A 2 , Ω}. Bryan zna tylko całkowitą liczbę ogonów. Jego podział składa się z czterech części: Ω = B 0 ⊔ B 1 ⊔ B 2 ⊔ B 3 = {HHH} ⊔ {HHT, HTH, THH} ⊔ {TTH, THT, HTT} ⊔ {TTT}; odpowiednio, jego σ-algebra Bryan zawiera 2 4 = 16 zdarzeń.

    Dwie Ď-algebry są nieporównywalne : ani

    AlicjaBryan ani BryanAlice ; obie są sub-σ-algebrami 2 Ω .

    Przykład 3

    Jeśli 100 wyborców ma być losowo wylosowanych spośród wszystkich wyborców w Kalifornii i zapytanych, kogo zagłosują na gubernatora, to zbiór wszystkich ciągów 100 wyborców kalifornijskich byłby przestrzenią próbną Ω. Zakładamy, że stosuje się próbkowanie bez zastępowania : dozwolone są tylko sekwencje po 100 różnych wyborców. Dla uproszczenia rozważana jest próbka uporządkowana, czyli ciąg {Alicja, Bryan} różni się od {Bryana, Alicji}. Przyjmujemy również za pewnik, że każdy potencjalny wyborca ​​dokładnie zna swój przyszły wybór, czyli nie wybiera losowo.

    Alicja wie tylko, czy Arnold Schwarzenegger otrzymał co najmniej 60 głosów. Jej niepełne informacje opisuje σ-algebra

    Alice, która zawiera: (1) zbiór wszystkich ciągów w Ω, w którym co najmniej 60 osób głosuje na Schwarzeneggera; (2) zbiór wszystkich sekwencji, w których mniej niż 60 głosuje na Schwarzeneggera; (3) cała przestrzeń próbki Ω; oraz (4) pusty zbiór ∅.

    Bryan zna dokładną liczbę wyborców, którzy będą głosować na Schwarzeneggera. Jego niepełna informacja jest opisana przez odpowiedni podział Ω = B 0 ⊔ B 1 ... ⊔ B 100, a σ-algebra

    Bryana składa się z 2 101 zdarzeń.

    W tym przypadku σ-algebra Alice jest podzbiorem Bryana:

    AliceBryan . σ-algebra Bryana jest z kolei podzbiorem znacznie większej „pełnej informacji” σ-algebry 2 Ω składającej się z 2 n ( n −1)...( n −99) zdarzeń, gdzie n jest liczbą wszystkich potencjalnych wyborców w Kalifornii.

    Przykłady nieatomowe

    Przykład 4

    Liczba od 0 do 1 jest wybierana losowo, jednakowo. Tutaj Ω = [0,1], jest σ-algebrą

    zbiorów borelowskich na Ω, a P jest miarą Lebesgue'a na [0,1].

    W tym przypadku otwarte przedziały postaci ( a , b ), gdzie 0 <  a  <  b  < 1, mogą być traktowane jako zespoły prądotwórcze. Każdemu takiemu zbiorowi można przypisać prawdopodobieństwo P (( a , b )) = ( b  −  a ), które generuje miarę Lebesgue'a na [0,1], a σ-algebrę Borela na Ω.

    Przykład 5

    Uczciwa moneta jest rzucana bez końca. Tutaj można wziąć Ω = {0,1} , zbiór wszystkich nieskończonych ciągów liczb 0 i 1. Zbiory cylindryczne {( x 1x 2 , ...) ∈ Ω : x 1  =  a 1 , .. .,  x n  =  a n } mogą być używane jako zespoły prądotwórcze. Każdy taki zestaw zawiera opis zdarzenia, w którym pierwsze N rzutów doprowadziły w ustalonej sekwencji (

    1 , ..., n ), a reszta sekwencji mogą być dowolne. Każdemu takiemu zdarzeniu można naturalnie podać prawdopodobieństwo 2 n .

    Te dwa nieatomowe przykłady są ściśle powiązane: ciąg ( x 1 , x 2 ,...) ∈ {0,1} prowadzi do liczby 2 −1 x 1 + 2 −2 x 2 + ... ∈ [0,1]. Nie jest to jednak zależność jeden do jednego między {0,1} a [0,1]: jest to izomorfizm modulo zero , który pozwala traktować dwie przestrzenie prawdopodobieństwa jako dwie formy tej samej przestrzeni prawdopodobieństwa. W rzeczywistości wszystkie niepatologiczne przestrzenie prawdopodobieństwa nieatomowego są w tym sensie takie same. Są to tak zwane standardowe przestrzenie probabilistyczne . Podstawowe zastosowania przestrzeni probabilistycznych są niewrażliwe na standardowość. Jednak warunkowanie niedyskretne jest łatwe i naturalne na standardowych przestrzeniach probabilistycznych, w przeciwnym razie staje się niejasne.

    Pojęcia pokrewne

    Rozkład prawdopodobieństwa

    Każdy rozkład prawdopodobieństwa definiuje miarę prawdopodobieństwa.

    Zmienne losowe

    Zmienną losową X jest mierzalna Funkcja X : Ω → S z próbki przestrzeni Ohm na inny mierzalny przestrzeni S zwany przestrzeni stanów .

    Jeśli AS , notacja Pr( XA ) jest powszechnie używanym skrótem dla P ({ ω ∈ Ω: X ( ω ) ∈ A }).

    Definiowanie wydarzeń pod kątem przestrzeni próbki

    Jeśli Ω jest policzalne , prawie zawsze definiujemy jako

    zbiór potęgowy Ω, tj. = 2 Ω, która jest trywialnie σ-algebrą i największą, jaką możemy stworzyć za pomocą Ω. Możemy zatem pominąć i po prostu napisać (Ω,P), aby zdefiniować przestrzeń prawdopodobieństwa.

    Z drugiej strony, jeśli Ω jest niepoliczalne i używamy = 2

    Ω, mamy kłopoty ze zdefiniowaniem naszej miary prawdopodobieństwa P, ponieważ jest ona zbyt „duża”, tj. często będą zestawy, do których nie będzie można przypisać jednoznacznej miary. W tym przypadku musimy użyć mniejszej σ-algebry , na przykład algebry Borela Ω, która jest najmniejszą σ-algebrą, która sprawia, że ​​wszystkie otwarte zbiory są mierzalne.

    Warunkowe prawdopodobieństwo

    Definicja przestrzeni probabilistycznych Kołmogorowa daje początek naturalnej koncepcji prawdopodobieństwa warunkowego . Każdy zbiór A z niezerowym prawdopodobieństwem (czyli P ( A ) > 0) definiuje inną miarę prawdopodobieństwa

    na przestrzeni. Jest to zwykle wymawiane jako „prawdopodobieństwo B przy danym A ”.

    Dla każdego zdarzenia B takiego, że P ( B ) > 0 funkcja Q zdefiniowana przez Q ( A ) = P ( A | B ) dla wszystkich zdarzeń A sama jest miarą prawdopodobieństwa.

    Niezależność

    Mówi się, że dwa zdarzenia, A i B,niezależne, jeśli P ( AB )= P ( A ) P ( B ).

    Mówi się, że dwie zmienne losowe, X i Y , są niezależne, jeśli dowolne zdarzenie zdefiniowane w kategoriach X jest niezależne od dowolnego zdarzenia zdefiniowanego w kategoriach Y . Formalnie generują niezależne σ-algebry, gdzie dwie σ-algebry G i H , które są podzbiorami F, są uważane za niezależne, jeśli dowolny element G jest niezależny od dowolnego elementu H .

    Wzajemna wyłączność

    Mówi się, że dwa zdarzenia, A i B , wzajemnie się wykluczają lub są rozłączne, jeśli wystąpienie jednego implikuje brak drugiego, tj. ich przecięcie jest puste. Jest to silniejszy warunek niż prawdopodobieństwo ich przecięcia wynosi zero.

    Jeśli A i B są zdarzeniami rozłącznymi, to P ( AB ) = P ( A ) + P ( B ). To rozciąga się na (skończoną lub przeliczalnie nieskończoną) sekwencję zdarzeń. Jednak prawdopodobieństwo zjednoczenia niepoliczalnego zbioru zdarzeń nie jest sumą ich prawdopodobieństw. Na przykład, jeśli Z jest zmienną losową o rozkładzie normalnym , wtedy P ( Z = x ) wynosi 0 dla dowolnego x , ale P ( ZR ) = 1.

    Impreza ∩

    B jest nazywany „ A i B ”, a zdarzenie ∪ B jako „ A lub B ”.

    Zobacz też

    Bibliografia

    Bibliografia

    Pierwszy poważny traktat łączący rachunek różniczkowy z teorią prawdopodobieństwa, pierwotnie w języku francuskim: Théorie Analytique des Probabilités .
    Współczesne podstawy teorii miar i teorii prawdopodobieństwa; oryginalna wersja niemiecka ( Grundbegriffe der Wahrscheinlichkeitrechnung ) pojawiła się w 1933 roku.
    Empiryczne, bayesowskie podejście do podstaw teorii prawdopodobieństwa.
    • Edward Nelson (1987) Radykalnie elementarna teoria prawdopodobieństwa
    Podstawy rachunku prawdopodobieństwa oparte na analizie niestandardowej. Do pobrania. http://www.math.princeton.edu/~nelson/books.html
    • Patrick Billingsley : Prawdopodobieństwo i miara , John Wiley and Sons, Nowy Jork, Toronto, Londyn, 1979.
    • Henk Tijms (2004) Rozumienie prawdopodobieństwa
    Żywe wprowadzenie do teorii prawdopodobieństwa dla początkujących, Cambridge Univ. Naciskać.
    • David Williams (1991) Prawdopodobieństwo z martyngałami
    Licencjackie wprowadzenie do prawdopodobieństwa teorii miary, Cambridge Univ. Naciskać.
    • Gut, Allan (2005). Prawdopodobieństwo: kurs dla absolwentów . Skoczek. Numer ISBN 0-387-22833-0.

    Zewnętrzne linki