Gradient funkcji wiarygodności
W statystyk The wynik (lub informator ) jest gradientu w funkcji log wiarogodności względem wektora parametru . Oceniany w konkretnym punkcie wektora parametrów, wynik wskazuje na stromość funkcji logarytmicznego prawdopodobieństwa, a tym samym wrażliwość na nieskończenie małe zmiany wartości parametrów. Jeśli funkcja logarytmu wiarygodności jest ciągła w przestrzeni parametrów , wynik zniknie przy lokalnym maksimum lub minimum ; fakt ten jest wykorzystywany w szacowaniu największego prawdopodobieństwa aby znaleźć wartości parametrów, które maksymalizują funkcję wiarygodności.
Ponieważ wynik jest funkcją obserwacji , które podlegają błędowi próbkowania , nadaje się do statystyki testowej znanej jako test na wynik, w którym parametr jest utrzymywany na określonej wartości. Co więcej, stosunek dwóch funkcji wiarygodności oszacowanych przy dwóch różnych wartościach parametrów można rozumieć jako całkę określoną z funkcji punktacji.
Definicja
Wynik jest nachylenie (wektor pochodnych cząstkowych ) z The logarytmu naturalnego z funkcji prawdopodobieństwa , w odniesieniu do w m -wymiarowego wektora parametru .
W ten sposób różnicowanie daje wektor wierszowy i wskazuje wrażliwość prawdopodobieństwa (jego pochodną znormalizowaną przez jej wartość).
W starszej literaturze „punktacja liniowa” może odnosić się do partytury w odniesieniu do nieskończenie małego przełożenia danej gęstości. Konwencja ta wywodzi się z czasów, gdy głównym parametrem zainteresowania była średnia lub mediana rozkładu. W tym przypadku prawdopodobieństwo obserwacji określa gęstość formularza . „Wynik liniowy” jest następnie definiowany jako
Nieruchomości
Mieć na myśli
O ile wynik jest funkcją , to zależy również od obserwacji, na których oceniana jest funkcja wiarygodności, a ze względu na losowy charakter próbkowania można przenosić jego wartość oczekiwaną na przestrzeń próby . W pewnych warunkach regularności na funkcjach gęstości zmiennych losowych oczekiwana wartość wyniku, oszacowana przy prawdziwej wartości parametru , wynosi zero. Aby to zobaczyć, przepisz funkcję wiarygodności jako funkcję gęstości prawdopodobieństwa i oznacz przestrzeń próbki . Następnie:
Przyjęte warunki regularności pozwalają na zamianę pochodnej i całki (patrz reguła całkowa Leibniza ), stąd powyższe wyrażenie można przepisać jako
Powyższy wynik warto powtórzyć słowami: oczekiwana wartość wyniku to zero. Tak więc, gdyby ktoś wielokrotnie pobierał próbki z jakiegoś rozkładu i wielokrotnie obliczał wynik, to średnia wartość wyników miałaby tendencję do asymptotycznie zerowej wartości .
Zmienność
Odchylenie od wyniku, mogą być uzyskane z powyżej wyrażenie dla wartości oczekiwanej.
Stąd wariancja wyniku jest równa ujemnej wartości oczekiwanej hessowskiej macierzy logarytmicznego prawdopodobieństwa.
Ta ostatnia jest znana jako informacja Fishera i jest napisana . Zauważ, że informacja Fishera nie jest funkcją żadnej konkretnej obserwacji, ponieważ zmienna losowa została uśredniona. Ta koncepcja informacji jest użyteczna przy porównywaniu dwóch metod obserwacji pewnego procesu losowego .
Przykłady
Proces Bernoulliego
Rozważ obserwowanie pierwszych n prób procesu Bernoulliego i zobaczenie, że A z nich to sukcesy, a pozostałe B to niepowodzenia, gdzie prawdopodobieństwo sukcesu wynosi θ .
Wtedy prawdopodobieństwo jest
więc wynik s to
Możemy teraz zweryfikować, że oczekiwany wynik wynosi zero. Zauważając, że oczekiwaniem A jest nθ, a oczekiwaniem B jest n (1 − θ ) [przypominamy, że A i B są zmiennymi losowymi], widzimy, że oczekiwanie s jest
Możemy również sprawdzić wariancję . Wiemy, że A + B = n (więc B = n − A ) i wariancja A wynosi nθ (1 − θ ), więc wariancja s wynosi
Binarny model wynikowy
W przypadku modeli z wynikami binarnymi ( Y = 1 lub 0), model można oceniać za pomocą logarytmu predykcji
gdzie p jest prawdopodobieństwem w modelu do oszacowania, a S jest wynikiem.
Aplikacje
Algorytm punktacji
Algorytm punktacji jest iteracyjną metodą numerycznego określania estymatora największej wiarygodności .
Test punktacji
Zauważ, że jest to funkcja i obserwacja , więc generalnie nie jest to statystyka . Jednak w niektórych aplikacjach, takich jak wynik test , wynik jest oceniany na podstawie określonej wartości (takiej jak wartość hipotezy zerowej), w którym to przypadku wynikiem jest statystyka. Intuicyjnie, jeśli ograniczony estymator jest bliski maksimum funkcji wiarygodności, wynik nie powinien różnić się od zera o więcej niż błąd próbkowania . W 1948 roku, CR Rao pierwszy wykazały, że kwadrat wyniku podzielonej przez matrycę informacji następuje asymptotyczny × 2 -Dystrybucja mocy hipotezy zerowej.
Dalej zauważ, że test ilorazu wiarygodności jest podany przez
co oznacza, że test ilorazu wiarygodności można rozumieć jako obszar pod funkcją punktacji między a .
Zobacz też
Uwagi
Bibliografia