Zmienna losowa - Random variable

W prawdopodobieństwa i statystyki , o zmiennej losowej , liczby losowe , zmiennych losowych lub zmienną stochastyczną opisano nieformalnie jako zmienną, której wartość zależy od wyników o losowej zjawiska. Formalne matematyczne traktowanie zmiennych losowych jest tematem teorii prawdopodobieństwa . W tym kontekście zmienna losowa jest rozumiana jako mierzalna funkcja zdefiniowana na przestrzeni prawdopodobieństwa, która odwzorowuje przestrzeń próbki na liczby rzeczywiste .

Ten wykres pokazuje, jak zmienna losowa jest funkcją od wszystkich możliwych wyników do wartości rzeczywistych. Pokazuje również, w jaki sposób zmienna losowa jest używana do definiowania funkcji masy prawdopodobieństwa.

Możliwe wartości zmiennej losowej mogą reprezentować możliwe wyniki eksperymentu, którego jeszcze nie przeprowadzono, lub możliwe wyniki poprzedniego eksperymentu, którego już istniejąca wartość jest niepewna (na przykład z powodu nieprecyzyjnych pomiarów lub niepewności kwantowej ). Mogą również koncepcyjnie reprezentować wyniki „obiektywnie” losowego procesu (takiego jak rzucanie kostką) lub „subiektywnej” losowości, która wynika z niepełnej wiedzy o wielkości. Znaczenie prawdopodobieństw przypisanych potencjalnym wartościom zmiennej losowej nie jest częścią samej teorii prawdopodobieństwa, ale jest związane z filozoficznymi argumentami dotyczącymi interpretacji prawdopodobieństwa . Matematyka działa tak samo, niezależnie od używanej interpretacji.

Jako funkcja zmienna losowa musi być mierzalna , co pozwala na przypisanie prawdopodobieństw do zbiorów jej potencjalnych wartości. Często zdarza się, że wyniki zależą od pewnych zmiennych fizycznych, których nie można przewidzieć. Na przykład podczas rzucania uczciwą monetą ostateczny wynik orła lub reszki zależy od niepewnych warunków fizycznych, więc obserwowany wynik jest niepewny. Moneta mogłaby zahaczyć o pęknięcie w podłodze, ale taka możliwość jest wykluczona.

Domeny zmiennej losowej nazywamy próbkowania przestrzeni, zdefiniowany jako zbiór możliwych wyników o niedeterministycznym imprezy. Na przykład w przypadku rzutu monetą możliwe są tylko dwa możliwe wyniki: orła lub reszki.

Zmienna losowa ma rozkład prawdopodobieństwa , który określa prawdopodobieństwo występowania podzbiorów borelowskich w jej zakresie. Zmienne losowe mogą być dyskretne , to znaczy przyjmujące dowolną z określonej skończonej lub przeliczalnej listy wartości (mających przeliczalny zakres), wyposażonej w funkcję masy prawdopodobieństwa, która jest charakterystyczna dla rozkładu prawdopodobieństwa zmiennej losowej; lub ciągły , przyjmując dowolną wartość liczbową w przedziale lub zbiorze przedziałów (o nieprzeliczalnym zakresie), za pomocą funkcji gęstości prawdopodobieństwa, która jest charakterystyczna dla rozkładu prawdopodobieństwa zmiennej losowej; lub mieszanina obu.

Dwie zmienne losowe o tym samym rozkładzie prawdopodobieństwa mogą nadal różnić się pod względem związku z innymi zmiennymi losowymi lub niezależności od nich. Realizacje zmiennej losowej, czyli wyniki losowego wyboru wartości zgodnie z rozkładem prawdopodobieństwa zmiennej, nazywamy zmiennymi losowymi .

Chociaż pomysł został pierwotnie wprowadzony przez Christiaana Huygensa , pierwszą osobą, która zaczęła myśleć systematycznie w kategoriach zmiennych losowych, był Pafnuty Czebyszew .

Definicja

Zmienna losowa jest mierzalna funkcja ze zbioru możliwych efektów do mierzalnego przestrzeni . Techniczna definicja aksjomatyczna wymaga bycia przestrzenią prób trójki prawdopodobieństwa (patrz definicja w teorii miary ). Zmienna losowa jest często oznaczana dużymi literami alfabetu łacińskiego, takimi jak , , , .

Prawdopodobieństwo przyjęcia wartości w mierzalnym zbiorze zapisuje się jako

Standardowy przypadek

W wielu przypadkach ma wartość rzeczywistą , czyli . W niektórych kontekstach termin element losowy (patrz rozszerzenia ) jest używany do oznaczenia zmiennej losowej innej niż ta forma.

Gdy obraz (lub zakres) jest policzalny , zmienna losowa nazywana jest dyskretną zmienną losową, a jej rozkład jest dyskretnym rozkładem prawdopodobieństwa , tj. może być opisany przez funkcję masy prawdopodobieństwa, która przypisuje prawdopodobieństwo każdej wartości w obrazie . Jeśli obraz jest nieprzeliczalnie nieskończony (zazwyczaj przedział ), to nazywa się ciągłą zmienną losową . W szczególnym przypadku, gdy jest ona absolutnie ciągła , jej rozkład można opisać funkcją gęstości prawdopodobieństwa , która przypisuje prawdopodobieństwa przedziałom; w szczególności każdy pojedynczy punkt musi koniecznie mieć prawdopodobieństwo zerowe dla absolutnie ciągłej zmiennej losowej. Nie wszystkie ciągłe zmienne losowe są absolutnie ciągłe, rozkład mieszaniny jest jednym z takich kontrprzykładów; takie zmienne losowe nie mogą być opisane przez gęstość prawdopodobieństwa lub funkcję masy prawdopodobieństwa.

Każdą zmienną losową można opisać za pomocą funkcji rozkładu skumulowanego , która opisuje prawdopodobieństwo, że zmienna losowa będzie mniejsza lub równa określonej wartości.

Rozszerzenia

Termin „zmienna losowa” w statystyce jest tradycyjnie ograniczony do przypadku o wartościach rzeczywistych ( ). W tym przypadku struktura liczb rzeczywistych umożliwia określenie wielkości takich jak wartość oczekiwana i wariancja zmiennej losowej, jej dystrybuanty skumulowanej oraz momenty jej rozkładu.

Jednak powyższa definicja obowiązuje dla każdej mierzalnej przestrzeni wartości. Tak więc można uznać, losowo elementów innych grup , na przykład losowych wartości logicznych , wartości kategoryczne , liczb zespolonych , wektory , macierze , sekwencje , drzew , zestawów , kształtach , rur rozgałęźnych i funkcji . Można wtedy odnieść się konkretnie do zmiennej losowej typu lub zmiennej losowej o wartościach .

Ta bardziej ogólna koncepcja elementu losowego jest szczególnie przydatna w takich dyscyplinach jak teoria grafów , uczenie maszynowe , przetwarzanie języka naturalnego i inne dziedziny matematyki dyskretnej i informatyki , gdzie często interesuje się modelowaniem losowej zmienności danych nieliczbowych . struktury . W niektórych przypadkach wygodnie jest jednak przedstawić każdy element , używając jednej lub więcej liczb rzeczywistych. W takim przypadku element losowy może opcjonalnie być reprezentowany jako wektor zmiennych losowych o wartościach rzeczywistych (wszystkie zdefiniowane w tej samej podstawowej przestrzeni prawdopodobieństwa , co pozwala na kowariancję różnych zmiennych losowych ). Na przykład:

  • Losowe słowo może być reprezentowane jako losowa liczba całkowita, która służy jako indeks słownika możliwych słów. Alternatywnie może być reprezentowany jako losowy wektor wskaźnikowy, którego długość jest równa rozmiarowi słownika, gdzie jedynymi wartościami dodatniego prawdopodobieństwa są , , a pozycja 1 wskazuje słowo.
  • Losowe zdanie o zadanej długości może być reprezentowane jako wektor losowych słów.
  • Losowo wykres w podanych wierzchołków może być przedstawiony jako macierz zmiennych losowych, których wartości określają macierz sąsiedztwa losowego wykresie.
  • Funkcja losowa może być reprezentowana jako zbiór zmiennych losowych , podając wartości funkcji w różnych punktach w dziedzinie funkcji. Są to zwykłe zmienne losowe o wartościach rzeczywistych pod warunkiem, że funkcja ma wartość rzeczywistą. Na przykład proces stochastyczny jest funkcją losową czasu, wektor losowy jest funkcją losową pewnego zestawu indeksów, takiego jak , a pole losowe jest funkcją losową w dowolnym zestawie (zazwyczaj czas, przestrzeń lub zestaw dyskretny).

Funkcje dystrybucji

Jeśli podana jest zmienna losowa zdefiniowana w przestrzeni prawdopodobieństwa , możemy zadawać pytania typu „Jak prawdopodobne jest, że wartość jest równa 2?”. Jest to to samo, co prawdopodobieństwo zdarzenia, które często zapisuje się jako lub w skrócie.

Nagrywanie wszystkich tych prawdopodobieństw zakresów wyjściowych zmiennej losowej o wartościach rzeczywistych daje rozkład prawdopodobieństwa o . Rozkład prawdopodobieństwa „zapomina” o konkretnej przestrzeni prawdopodobieństwa użytej do zdefiniowania i rejestruje tylko prawdopodobieństwa różnych wartości . Taki rozkład prawdopodobieństwa zawsze można uchwycić jego dystrybuantą skumulowaną

a czasami także za pomocą funkcji gęstości prawdopodobieństwa , . W miar-teoretycznie rzecz biorąc, używamy zmiennej losowej do „push-forward” środka na do środka sprawie . Podstawowa przestrzeń prawdopodobieństwa jest urządzeniem technicznym używanym do zagwarantowania istnienia zmiennych losowych, czasami do ich konstrukcji, oraz do zdefiniowania pojęć takich jak korelacja i zależność lub niezależność w oparciu o łączny rozkład dwóch lub więcej zmiennych losowych w tej samej przestrzeni prawdopodobieństwa. W praktyce często pozbywamy się przestrzeni całkowicie i po prostu umieszczamy na niej miarę, która przypisuje miarę 1 do całej linii rzeczywistej, tj. pracujemy z rozkładami prawdopodobieństwa zamiast ze zmiennymi losowymi. Zobacz artykuł o funkcjach kwantylowych, aby uzyskać pełniejszy rozwój.

Przykłady

Dyskretna zmienna losowa

W eksperymencie osoba może być wybrana losowo, a jedną zmienną losową może być wzrost osoby. Matematycznie zmienna losowa jest interpretowana jako funkcja, która odwzorowuje osobę na jej wzrost. Ze zmienną losową powiązany jest rozkład prawdopodobieństwa, który umożliwia obliczenie prawdopodobieństwa, że ​​wzrost znajduje się w dowolnym podzbiorze możliwych wartości, takich jak prawdopodobieństwo, że wzrost jest między 180 a 190 cm lub prawdopodobieństwo, że wzrost jest mniejszy niż 150 lub więcej niż 200 cm.

Inną zmienną losową może być liczba dzieci danej osoby; jest to dyskretna zmienna losowa z nieujemnymi wartościami całkowitymi. Umożliwia obliczanie prawdopodobieństw dla poszczególnych wartości całkowitych – funkcji masy prawdopodobieństwa (PMF) – lub dla zbiorów wartości, w tym zbiorów nieskończonych. Na przykład interesującym wydarzeniem może być „parzysta liczba dzieci”. Zarówno w przypadku skończonych, jak i nieskończonych zbiorów zdarzeń ich prawdopodobieństwa można znaleźć, sumując PMF elementów; to znaczy, że prawdopodobieństwo parzystej liczby dzieci jest nieskończoną sumą .

W takich przykładach przestrzeń prób jest często pomijana, ponieważ jest matematycznie trudna do opisania, a możliwe wartości zmiennych losowych są wówczas traktowane jako przestrzeń prób. Ale kiedy dwie zmienne losowe są mierzone na tej samej przestrzeni próbnej wyników, takich jak wzrost i liczba dzieci obliczanych na tych samych losowych osobach, łatwiej jest śledzić ich związek, jeśli uzna się, że zarówno wzrost, jak i liczba dzieci od tej samej losowej osoby, na przykład, aby można było zadać pytania, czy takie zmienne losowe są skorelowane, czy nie.

Jeśli są przeliczalnymi zbiorami liczb rzeczywistych, a , to jest funkcją rozkładu dyskretnego. Tutaj za , za . Biorąc na przykład wyliczenie wszystkich liczb wymiernych jako , otrzymujemy funkcję rozkładu dyskretnego, która nie jest funkcją skokową ani odcinkową stałą.

Rzut monetą

Możliwe wyniki jednego rzutu monetą można opisać za pomocą pola próbki . Możemy wprowadzić zmienną losową o wartości rzeczywistej, która modeluje wypłatę 1 USD za udany zakład na orła w następujący sposób:

Jeśli moneta jest monetą uczciwą , Y ma funkcję masy prawdopodobieństwa wyrażoną wzorem:

Rzut kostką

Jeśli przestrzeń próbki jest zbiorem możliwych liczb wyrzuconych na dwóch kostkach, a interesująca zmienna losowa jest sumą S liczb na dwóch kostkach, to S jest dyskretną zmienną losową, której rozkład jest opisany przez wykreśloną funkcję masy prawdopodobieństwa jako wysokość kolumn obrazu tutaj.

Zmienna losowa może być również wykorzystana do opisania procesu rzucania kostką i możliwych wyników. Najbardziej oczywistą reprezentacją w przypadku dwóch kostek jest wzięcie zestawu par liczb n 1 i n 2 z {1, 2, 3, 4, 5, 6} (reprezentujących liczby na dwóch kostkach) jako próbki przestrzeń. Całkowita liczba wyrzucona (suma liczb w każdej parze) jest wtedy zmienną losową X podaną przez funkcję odwzorowującą parę na sumę:

oraz (jeśli kości są uczciwe ) ma funkcję masy prawdopodobieństwa ƒ X wyrażoną wzorem :

Ciągła zmienna losowa

Formalnie ciągła zmienna losowa to zmienna losowa, której skumulowana funkcja rozkładu jest wszędzie ciągła . Nie ma „ luk ”, które odpowiadałyby liczbom o skończonym prawdopodobieństwie wystąpienia . Zamiast tego ciągłe zmienne losowe prawie nigdy nie przyjmują dokładnie określonej wartości c (formalnie, ), ale istnieje dodatnie prawdopodobieństwo, że jej wartość będzie leżeć w określonych przedziałach, które mogą być dowolnie małe . Ciągłe zmienne losowe zwykle dopuszczają funkcje gęstości prawdopodobieństwa (PDF), które charakteryzują ich CDF i miary prawdopodobieństwa ; takie rozkłady są również nazywane absolutnie ciągłymi ; ale niektóre rozkłady ciągłe są singular lub mieszanką absolutnie ciągłej części i osobliwej części.

Przykładem ciągłej zmiennej losowej może być ta oparta na przędzarce, która może wybrać kierunek poziomy. Wówczas wartościami przyjmowanymi przez zmienną losową są kierunki. Moglibyśmy przedstawić te kierunki jako północ, zachód, wschód, południe, południowy wschód itd. Jednak zwykle wygodniej jest odwzorować przestrzeń próbki na zmienną losową, która przyjmuje wartości będące liczbami rzeczywistymi. Można to zrobić, na przykład, mapując kierunek na czwartak w stopniach zgodnie z ruchem wskazówek zegara od północy. Zmienna losowa przyjmuje wtedy wartości będące liczbami rzeczywistymi z przedziału [0, 360), przy czym wszystkie części przedziału są „równie prawdopodobne”. W tym przypadku X = kąt wirowania. Każda liczba rzeczywista ma zerowe prawdopodobieństwo wybrania, ale prawdopodobieństwo dodatnie można przypisać dowolnemu zakresowi wartości. Na przykład prawdopodobieństwo wybrania liczby w [0, 180] wynosi 12 . Zamiast mówić o funkcji masy prawdopodobieństwa, możemy powiedzieć, że prawdopodobieństwo gęstość od X wynosi 1/360. Prawdopodobieństwo podzbioru [0, 360) można obliczyć mnożąc miarę zbioru przez 1/360. Ogólnie rzecz biorąc, prawdopodobieństwo zbioru dla danej ciągłej zmiennej losowej można obliczyć przez całkowanie gęstości w danym zbiorze.

Bardziej formalnie, biorąc pod uwagę dowolny przedział , zmienna losowa jest nazywana „ ciągłą jednolitą zmienną losową” (CURV), jeśli prawdopodobieństwo, że przyjmie wartość w podprzedziale zależy tylko od długości podprzedziału. Oznacza to, że prawdopodobieństwo wpadnięcia w dowolny podprzedział jest proporcjonalne do długości podprzedziału, to znaczy, jeśli acdb , mamy

gdzie ostatnia równość wynika z aksjomatu unitarności prawdopodobieństwa. Funkcja gęstości prawdopodobieństwa CURV jest określona przez funkcję wskaźnika jej przedziału podparcia znormalizowanego przez długość przedziału:

Szczególnie interesujący jest równomierny rozkład na interwale jednostkowym . Próbki o żądanym rozkładzie prawdopodobieństwa można wytwarzać przez obliczenie odwrotna dystrybuanta się na zasadzie losowo wygenerowaną liczbą, rozłożone równomiernie w przedziale urządzenia. Wykorzystuje to właściwości funkcji dystrybucji skumulowanej , które stanowią jednolitą strukturę dla wszystkich zmiennych losowych.

Typ mieszany

Miesza Zmienna losowa jest zmienną, której losowa skumulowanego dystrybucja nie jest ani odcinkowo stałego (dyskretną zmienną losową) ani wszędzie stały . Może być zrealizowany jako suma dyskretnej zmiennej losowej i ciągłej zmiennej losowej; w takim przypadku CDF będzie średnią ważoną

CDF zmiennych składowych.

Przykład zmiennej losowej typu mieszanego opierałby się na eksperymencie, w którym moneta jest rzucana, a spinner jest obracany tylko wtedy, gdy wynikiem rzutu monetą są reszki. Jeśli wynikiem są ogony, X = -1; w przeciwnym razie X = wartość przędzarki jak w poprzednim przykładzie. Istnieje prawdopodobieństwo 12, że ta zmienna losowa będzie miała wartość -1. Inne zakresy wartości miałyby połowę prawdopodobieństwa z ostatniego przykładu.

Najogólniej, każdy rozkład prawdopodobieństwa na linii rzeczywistej jest mieszanką części dyskretnej, części osobliwej i części absolutnie ciągłej; patrz twierdzenie o dekompozycji Lebesgue'a § Udoskonalenie . Część dyskretna jest skoncentrowana na zbiorze policzalnym, ale zbiór ten może być gęsty (jak zbiór wszystkich liczb wymiernych).

Definicja teoretyczna miary

Najbardziej formalna, aksjomatyczna definicja zmiennej losowej obejmuje teorię miary . Ciągłe zmienne losowe definiuje się jako zbiory liczb wraz z funkcjami, które odwzorowują takie zbiory na prawdopodobieństwa. Ze względu na różne trudności (np. paradoks Banacha–Tarskiego ), które pojawiają się, gdy takie zbiory są niewystarczająco ograniczone, konieczne jest wprowadzenie tak zwanej sigma-algebry, aby ograniczyć możliwe zbiory, względem których można zdefiniować prawdopodobieństwa. Zwykle używana jest konkretna taka sigma-algebra, Borel σ-algebra , która pozwala na definiowanie prawdopodobieństw dla dowolnych zbiorów, które można wyprowadzić albo bezpośrednio z ciągłych przedziałów liczb, albo przez skończoną lub przeliczalnie nieskończoną liczbę sum i/ lub przecięcia takich przedziałów.

Definicja teorii miary jest następująca.

Pozwolić być

przestrzeń prawdopodobieństwo i wymierne przestrzeń . Wtedy zmienna losowa o wartości -wartości jest funkcją mierzalną , co oznacza, że ​​dla każdego podzbioru jej obraz wstępny jest -mierzalny; , gdzie . Ta definicja pozwala nam zmierzyć dowolny podzbiór w przestrzeni docelowej, patrząc na jego obraz wstępny, który z założenia jest mierzalny.

Mówiąc bardziej intuicyjnie, element jest możliwym wynikiem, element jest mierzalnym podzbiorem możliwych wyników, funkcja podaje prawdopodobieństwo każdego takiego mierzalnego podzbioru, reprezentuje zbiór wartości, które może przyjąć zmienna losowa (takich jak zbioru liczb rzeczywistych), a członek jest „dobrym” (mierzalnym) podzbiorem (tych, dla których można określić prawdopodobieństwo). Zmienna losowa jest wtedy funkcją od dowolnego wyniku do ilości, tak że wyniki prowadzące do dowolnego użytecznego podzbioru ilości dla zmiennej losowej mają dobrze zdefiniowane prawdopodobieństwo.

Kiedy jest

przestrzenią topologiczną , to najczęstszym wyborem dla σ-algebry jest Borel σ-algebra , która jest σ-algebrą generowaną przez zbiór wszystkich otwartych zbiorów w . W takim przypadku zmienna losowa o wartościach nazywana jest zmienną losową o wartościach . Co więcej, gdy przestrzeń jest linią rzeczywistą , to taka zmienna losowa o wartości rzeczywistej nazywana jest po prostu zmienną losową .

Zmienne losowe o wartościach rzeczywistych

W tym przypadku przestrzeń obserwacji jest zbiorem liczb rzeczywistych. Przypomnijmy, jest przestrzenią prawdopodobieństwa. Dla rzeczywistej przestrzeni obserwacji funkcja jest zmienną losową o wartościach rzeczywistych, jeśli

Ta definicja jest szczególnym przypadkiem powyższego, ponieważ zbiór generuje algebrę borelowską na zbiorze liczb rzeczywistych i wystarczy sprawdzić mierzalność na dowolnym zbiorze generującym. Tutaj możemy udowodnić mierzalność na tym zbiorze generującym, wykorzystując fakt, że .

Chwile

Rozkład prawdopodobieństwa zmiennej losowej często charakteryzuje się niewielką liczbą parametrów, które również mają praktyczną interpretację. Na przykład często wystarczy wiedzieć, jaka jest jego „średnia wartość”. Ujmuje to matematyczne pojęcie wartości oczekiwanej zmiennej losowej, oznaczanej , a także nazywanej

momentem pierwszym . Ogólnie rzecz biorąc, nie jest równe . Gdy znana jest „wartość średnia”, można by zapytać, jak daleko od tej wartości średniej znajdują się wartości typowo, na które odpowiada wariancja i odchylenie standardowe zmiennej losowej. może być postrzegana intuicyjnie jako średnia uzyskana z nieskończonej populacji, której członkami są poszczególne oceny .

Matematycznie jest to znane jako (uogólniony) problem momentów : dla danej klasy zmiennych losowych znajdź zbiór funkcji takich, że wartości oczekiwane w pełni charakteryzują

rozkład zmiennej losowej .

Momenty można definiować tylko dla funkcji zmiennych losowych o wartościach rzeczywistych (lub o wartościach zespolonych itp.). Jeżeli zmienna losowa sama jest wartością rzeczywistą, to można przyjąć momenty samej zmiennej, które są równoważne momentom funkcji tożsamości zmiennej losowej. Jednak nawet dla zmiennych losowych o wartościach rzeczywistych można przyjąć momenty funkcji tych zmiennych o wartościach rzeczywistych. Na przykład, na

kategoryczne zmiennej losowej X , który może trwać od nominalnych wartości „czerwony”, „czerwony” i „zielone” funkcja o wartościach rzeczywistych może być wykonana; używa nawiasu Iversona i ma wartość 1, jeśli ma wartość „zielony”, w przeciwnym razie 0. Następnie można określić oczekiwaną wartość i inne momenty tej funkcji.

Funkcje zmiennych losowych

Nową zmienną losową Y można zdefiniować, stosując rzeczywistą mierzalną funkcję borelowską do wyników zmiennej losowej o

wartościach rzeczywistych . To znaczy . Skumulowanego rozkład z Następnie

Jeżeli funkcja jest odwracalne (to jest istnieje, gdzie jest jest

odwrotną funkcję ) i albo zwiększając lub zmniejszając , a poprzednia zależność może być rozszerzone w celu uzyskania

Przy tych samych hipotezach o odwracalności , zakładając również

różniczkowalność , związek między funkcjami gęstości prawdopodobieństwa można znaleźć różnicując obie strony powyższego wyrażenia względem , w celu uzyskania

Jeśli nie ma odwracalności, ale każdy dopuszcza co najwyżej policzalną liczbę pierwiastków (tj. skończoną lub przeliczalnie nieskończoną liczbę takich, które ), to poprzednią zależność między

funkcjami gęstości prawdopodobieństwa można uogólnić za pomocą

gdzie , zgodnie z

twierdzeniem o funkcji odwrotnej . Wzory gęstości nie wymagają zwiększania.

W teoretycznym, aksjomatycznym podejściu do prawdopodobieństwa miary , jeśli zmienna losowa na i

funkcja mierzalna borelowska , to również zmienna losowa na , ponieważ mierzalna jest również kompozycja funkcji mierzalnych . (Jednak niekoniecznie jest to prawdą, jeśli jest to mierzalne przez Lebesgue'a .) Ta sama procedura, która pozwoliła przejść z przestrzeni prawdopodobieństwa do, może być użyta do uzyskania rozkładu .

Przykład 1

Niech będzie

ciągłą zmienną losową o wartości rzeczywistej i niech .

Jeśli , to , więc

Jeśli , to

więc

Przykład 2

Załóżmy, że jest to zmienna losowa o skumulowanym rozkładzie

gdzie jest ustalonym parametrem. Rozważ zmienną losową Następnie,

Ostatnie wyrażenie można obliczyć w postaci skumulowanego rozkładu so

która jest funkcją dystrybucji skumulowanej (CDF) rozkładu wykładniczego .

Przykład 3

Załóżmy, że jest to zmienna losowa o

standardowym rozkładzie normalnym , której gęstość wynosi

Rozważ zmienną losową Gęstość możemy obliczyć korzystając z powyższego wzoru na zmianę zmiennych:

W tym przypadku zmiana nie jest monotoniczna , ponieważ każda wartość ma dwie odpowiadające sobie wartości (jedną dodatnią i ujemną). Jednak ze względu na symetrię obie połówki przekształcą się identycznie, tj.

Odwrotna transformacja to

a jego pochodną jest

Następnie,

Jest to rozkład chi-kwadrat z jednym stopniem swobody .

Przykład 4

Załóżmy, że jest to zmienna losowa o

rozkładzie normalnym , której gęstość wynosi

Rozważ zmienną losową Gęstość możemy obliczyć korzystając z powyższego wzoru na zmianę zmiennych:

W tym przypadku zmiana nie jest monotoniczna , ponieważ każda wartość ma dwie odpowiadające sobie wartości (jedną dodatnią i ujemną). Inaczej niż w poprzednim przykładzie, w tym przypadku jednak nie ma symetrii i musimy obliczyć dwa różne terminy:

Odwrotna transformacja to

a jego pochodną jest

Następnie,

Jest to niecentralny rozkład chi-kwadrat z jednym stopniem swobody .

Niektóre właściwości

Równoważność zmiennych losowych

Istnieje kilka różnych znaczeń, w których zmienne losowe można uznać za równoważne. Dwie zmienne losowe mogą być równe, prawie na pewno równe lub mieć taki sam rozkład.

W porządku rosnącym siły, dokładna definicja tych pojęć równoważności jest podana poniżej.

Równość w dystrybucji

Jeśli przestrzeń próbki jest podzbiorem prostej rzeczywistej, zmienne losowe X i Y mają równy rozkład (oznaczony ), jeśli mają te same funkcje rozkładu:

Aby były równe w rozkładzie, zmienne losowe nie muszą być definiowane w tej samej przestrzeni prawdopodobieństwa. Dwie zmienne losowe o równych funkcjach generujących momenty mają ten sam rozkład. Daje to np. użyteczną metodę sprawdzania równości pewnych funkcji niezależnych zmiennych losowych o identycznym rozkładzie (IID) . Jednak funkcja generująca moment istnieje tylko dla rozkładów, które mają zdefiniowaną transformację Laplace'a .

Prawie pewna równość

Dwie zmienne losowe X i Y

prawie na pewno równe (oznaczone ) wtedy i tylko wtedy, gdy prawdopodobieństwo, że są różne, wynosi zero :

Ze wszystkich praktycznych celów teorii prawdopodobieństwa to pojęcie równoważności jest tak silne, jak rzeczywista równość. Jest powiązany z następującą odległością:

gdzie "ess sup" reprezentuje zasadnicze supremum w sensie teorii miary .

Równość

Wreszcie, dwie zmienne losowe X i Yrówne, jeśli są równe jako funkcje w swojej mierzalnej przestrzeni:

To pojęcie jest zazwyczaj najmniej przydatny w teorii prawdopodobieństwa, ponieważ w praktyce i teorii, podstawowa miara przestrzeń z eksperymentu jest wyraźnie charakteryzuje rzadko lub nawet scharakteryzowania.

Konwergencja

Istotnym tematem statystyki matematycznej jest uzyskiwanie wyników zbieżności dla pewnych ciągów zmiennych losowych; na przykład prawo wielkich liczb i centralne twierdzenie graniczne .

Istnieje wiele znaczeń, w których sekwencja zmiennych losowych może zbiegać się w zmienną losową . Zostały one wyjaśnione w artykule dotyczącym

zbieżności zmiennych losowych .

Zobacz też

Bibliografia

Cytaty w tekście

Literatura

Zewnętrzne linki