Wynik (statystyki) - Score (statistics)

W statystyk The wynik (lub informator ) jest gradientu w funkcji log wiarogodności względem wektora parametru . Oceniany w konkretnym punkcie wektora parametrów, wynik wskazuje na stromość funkcji logarytmicznego prawdopodobieństwa, a tym samym wrażliwość na nieskończenie małe zmiany wartości parametrów. Jeśli funkcja logarytmu wiarygodności jest ciągła w przestrzeni parametrów , wynik zniknie przy lokalnym maksimum lub minimum ; fakt ten jest wykorzystywany w szacowaniu największego prawdopodobieństwa aby znaleźć wartości parametrów, które maksymalizują funkcję wiarygodności.

Ponieważ wynik jest funkcją obserwacji , które podlegają błędowi próbkowania , nadaje się do statystyki testowej znanej jako test na wynik, w którym parametr jest utrzymywany na określonej wartości. Co więcej, stosunek dwóch funkcji wiarygodności oszacowanych przy dwóch różnych wartościach parametrów można rozumieć jako całkę określoną z funkcji punktacji.

Definicja

Wynik jest nachylenie (wektor pochodnych cząstkowych ) z The logarytmu naturalnego z funkcji prawdopodobieństwa , w odniesieniu do w m -wymiarowego wektora parametru .

W ten sposób różnicowanie daje wektor wierszowy i wskazuje wrażliwość prawdopodobieństwa (jego pochodną znormalizowaną przez jej wartość).

W starszej literaturze „punktacja liniowa” może odnosić się do partytury w odniesieniu do nieskończenie małego przełożenia danej gęstości. Konwencja ta wywodzi się z czasów, gdy głównym parametrem zainteresowania była średnia lub mediana rozkładu. W tym przypadku prawdopodobieństwo obserwacji określa gęstość formularza . „Wynik liniowy” jest następnie definiowany jako

Nieruchomości

Mieć na myśli

O ile wynik jest funkcją , to zależy również od obserwacji, na których oceniana jest funkcja wiarygodności, a ze względu na losowy charakter próbkowania można przenosić jego wartość oczekiwaną na przestrzeń próby . W pewnych warunkach regularności na funkcjach gęstości zmiennych losowych oczekiwana wartość wyniku, oszacowana przy prawdziwej wartości parametru , wynosi zero. Aby to zobaczyć, przepisz funkcję wiarygodności jako funkcję gęstości prawdopodobieństwa i oznacz przestrzeń próbki . Następnie:

Przyjęte warunki regularności pozwalają na zamianę pochodnej i całki (patrz reguła całkowa Leibniza ), stąd powyższe wyrażenie można przepisać jako

Powyższy wynik warto powtórzyć słowami: oczekiwana wartość wyniku to zero. Tak więc, gdyby ktoś wielokrotnie pobierał próbki z jakiegoś rozkładu i wielokrotnie obliczał wynik, to średnia wartość wyników miałaby tendencję do asymptotycznie zerowej wartości .

Zmienność

Odchylenie od wyniku, mogą być uzyskane z powyżej wyrażenie dla wartości oczekiwanej.

Stąd wariancja wyniku jest równa ujemnej wartości oczekiwanej hessowskiej macierzy logarytmicznego prawdopodobieństwa.

Ta ostatnia jest znana jako informacja Fishera i jest napisana . Zauważ, że informacja Fishera nie jest funkcją żadnej konkretnej obserwacji, ponieważ zmienna losowa została uśredniona. Ta koncepcja informacji jest użyteczna przy porównywaniu dwóch metod obserwacji pewnego procesu losowego .

Przykłady

Proces Bernoulliego

Rozważ obserwowanie pierwszych n prób procesu Bernoulliego i zobaczenie, że A z nich to sukcesy, a pozostałe B to niepowodzenia, gdzie prawdopodobieństwo sukcesu wynosi  θ .

Wtedy prawdopodobieństwo jest

więc wynik s to

Możemy teraz zweryfikować, że oczekiwany wynik wynosi zero. Zauważając, że oczekiwaniem A jest nθ, a oczekiwaniem B jest n (1 −  θ ) [przypominamy, że A i B są zmiennymi losowymi], widzimy, że oczekiwanie s jest

Możemy również sprawdzić wariancję . Wiemy, że A + B = n (więc Bn  −  A ) i wariancja A wynosi (1 −  θ ), więc wariancja s wynosi

Binarny model wynikowy

W przypadku modeli z wynikami binarnymi ( Y = 1 lub 0), model można oceniać za pomocą logarytmu predykcji

gdzie p jest prawdopodobieństwem w modelu do oszacowania, a S jest wynikiem.

Aplikacje

Algorytm punktacji

Algorytm punktacji jest iteracyjną metodą numerycznego określania estymatora największej wiarygodności .

Test punktacji

Zauważ, że jest to funkcja i obserwacja , więc generalnie nie jest to statystyka . Jednak w niektórych aplikacjach, takich jak wynik test , wynik jest oceniany na podstawie określonej wartości (takiej jak wartość hipotezy zerowej), w którym to przypadku wynikiem jest statystyka. Intuicyjnie, jeśli ograniczony estymator jest bliski maksimum funkcji wiarygodności, wynik nie powinien różnić się od zera o więcej niż błąd próbkowania . W 1948 roku, CR Rao pierwszy wykazały, że kwadrat wyniku podzielonej przez matrycę informacji następuje asymptotyczny × 2 -Dystrybucja mocy hipotezy zerowej.

Dalej zauważ, że test ilorazu wiarygodności jest podany przez

co oznacza, że ​​test ilorazu wiarygodności można rozumieć jako obszar pod funkcją punktacji między a .

Zobacz też

Uwagi

Bibliografia