Teoria estymacji - Estimation theory

Teoria estymacji to dział statystyki zajmujący się szacowaniem wartości parametrów na podstawie zmierzonych danych empirycznych, które mają składnik losowy. Parametry opisują podstawowe ustawienie fizyczne w taki sposób, że ich wartość wpływa na rozkład danych pomiarowych. Estymator usiłuje zbliżyć nieznanych parametrów za pomocą pomiarów. Czytaj W teorii estymacji na ogół rozważane są dwa podejścia.

  • Podejście probabilistyczne (opisane w tym artykule) zakłada, że ​​dane pomiarowe są losowe z rozkładem prawdopodobieństwa zależnym od interesujących nas parametrów
  • Podejście zbioru-członkostwa zakłada, że ​​wektor danych pomiarowych należy do zbioru, który zależy od wektora parametrów.

Przykłady

Na przykład pożądane jest oszacowanie odsetka populacji wyborców, którzy zagłosują na konkretnego kandydata. Ta proporcja jest poszukiwanym parametrem; szacunek opiera się na małej losowej próbie wyborców. Alternatywnie, pożądane jest oszacowanie prawdopodobieństwa głosowania wyborcy na konkretnego kandydata na podstawie pewnych cech demograficznych, takich jak wiek.

Lub, na przykład, w radarze celem jest znalezienie zasięgu obiektów (samoloty, łodzie itp.) poprzez analizę dwukierunkowego czasu przejścia odebranych ech wysyłanych impulsów. Ponieważ odbite impulsy są nieuchronnie osadzane w szumie elektrycznym, ich zmierzone wartości są losowo rozłożone, tak że czas przejścia musi być oszacowany.

Inny przykład, w teorii komunikacji elektrycznej, pomiary, które zawierają informacje dotyczące interesujących parametrów, są często związane z zaszumionym sygnałem .

Podstawy

Dla danego modelu potrzeba kilku „składników” statystycznych, aby można było zaimplementować estymator. Pierwsza to próba statystyczna – zbiór punktów danych pobranych z losowego wektora (RV) o rozmiarze N . Wstaw do wektora ,

Po drugie, są parametry M

których wartości mają być oszacowane. Po trzecie, ciągłą funkcję gęstości prawdopodobieństwa (pdf) lub jej dyskretny odpowiednik, funkcję masy prawdopodobieństwa (pmf) rozkładu bazowego, który wygenerował dane, należy określić w zależności od wartości parametrów:

Możliwe jest również, że same parametry mają rozkład prawdopodobieństwa (np. statystyka bayesowska ). Następnie konieczne jest zdefiniowanie prawdopodobieństwa bayesowskiego

Po utworzeniu modelu, celem jest oszacowanie parametrów, z oszacowaniami powszechnie oznaczanymi , gdzie „czapka” oznacza oszacowanie.

Jednym wspólnym estymatorem jest estymator minimalnego błędu średniokwadratowego (MMSE), który wykorzystuje błąd między oszacowanymi parametrami a rzeczywistą wartością parametrów

jako podstawa optymalności. Ten składnik błędu jest następnie podnoszony do kwadratu, a oczekiwana wartość tej kwadratowej wartości jest minimalizowana dla estymatora MMSE.

Estymatory

Powszechnie stosowane estymatory (metody estymacji) i tematy z nimi związane to:

Przykłady

Nieznana stała w addytywnym białym szumie Gaussa

Rozważmy otrzymany dyskretny sygnał , , niezależnych próbek, który składa się z nieznanej stałej z dodatkiem białego szumu Gaussa (AWGN) o zerowej średniej i znanej wariancji ( tj , ). Ponieważ wariancja jest znana, jedynym nieznanym parametrem jest .

Modelem sygnału jest zatem

Dwa możliwe (z wielu) estymatory dla parametru to:

  • która jest średnią próbki

Oba te estymatorów mają średnią z , która może być pokazany przez poświęcenie oczekiwaną wartość każdego estymatora

oraz

W tym momencie wydaje się, że te dwa estymatory wykonują to samo. Jednak różnica między nimi staje się widoczna przy porównywaniu wariancji.

oraz

Wydawałoby się, że średnia z próby jest lepszym estymatorem, ponieważ jej wariancja jest mniejsza dla każdego  N  > 1.

Maksymalne prawdopodobieństwo

Kontynuując przykład z wykorzystaniem estymatora największej wiarygodności , funkcja gęstości prawdopodobieństwa (pdf) szumu dla jednej próbki wynosi

i prawdopodobieństwo staje się ( można pomyśleć o )

Przez niezależność prawdopodobieństwo staje się

Biorąc logarytmu naturalnego z PDF

a estymator największej wiarygodności to

Biorąc pierwszą pochodną funkcji logarytmicznej wiarygodności

i ustawiam na zero

Daje to estymator największej wiarygodności

co jest po prostu średnią z próby. Na podstawie tego przykładu stwierdzono, że średnia próbki jest estymatorem maksymalnego prawdopodobieństwa dla próbek o ustalonym, nieznanym parametrze uszkodzonym przez AWGN.

Cramér-Rao dolna granica

Aby znaleźć dolną granicę Craméra-Rao (CRLB) estymatora średniej próbki, należy najpierw znaleźć numer informacyjny Fishera

i kopiowanie z góry

Biorąc drugą pochodną

a znalezienie ujemnej wartości oczekiwanej jest trywialne, ponieważ jest to teraz stała deterministyczna

Na koniec, umieszczając informacje Fishera w:

prowadzi do

Porównanie tego z wariancją średniej próbki (określonej wcześniej) pokazuje, że średnia próbki jest równa dolnej granicy Craméra-Rao dla wszystkich wartości i . Innymi słowy, średnia z próby jest (koniecznie unikalnym) efektywnym estymatorem , a zatem również nieobciążonym estymatorem minimalnej wariancji (MVUE), oprócz tego, że jest estymatorem największej wiarygodności .

Maksimum równomiernego rozkładu

Jednym z najprostszych nietrywialnych przykładów estymacji jest estymacja maksimum rozkładu jednostajnego. Jest używany jako praktyczne ćwiczenie w klasie i do zilustrowania podstawowych zasad teorii estymacji. Ponadto, w przypadku estymacji na pojedynczej próbie, pokazuje problemy filozoficzne i możliwe nieporozumienia w stosowaniu estymatorów największej wiarogodności i funkcji wiarogodności .

Biorąc pod uwagę dyskretny rozkład jednostajny z nieznanym maksimum, estymator UMVU dla maksimum jest podany przez

gdzie m to maksimum próbki, a k to wielkość próby , pobieranie próbek bez wymiany. Problem ten jest powszechnie znany jako problem niemieckich czołgów , ze względu na zastosowanie maksymalnych szacunków do oszacowań produkcji niemieckich czołgów podczas II wojny światowej .

Formuła może być intuicyjnie rozumiana jako;

"Maksimum próbki plus średnia luka między obserwacjami w próbie",

luka jest dodawana w celu skompensowania ujemnego obciążenia maksimum próbki jako estymatora maksimum populacji.

To ma wariancję

więc odchylenie standardowe w przybliżeniu , średnia (populacyjna) wielkość luki między próbkami; porównaj powyżej. Można to postrzegać jako bardzo prosty przypadek oszacowania maksymalnego odstępu .

Maksimum próbki jest estymatorem największej wiarygodności dla maksimum populacji, ale, jak omówiono powyżej, jest obciążone.

Aplikacje

Wiele dziedzin wymaga zastosowania teorii estymacji. Niektóre z tych pól obejmują:

Dane pomiarowe mogą być przedmiotem hałasu lub niepewności, a to przez statystycznego prawdopodobieństwa , że optymalne rozwiązania są starał się ekstraktu jak najwięcej informacji z danych, jak to możliwe.

Zobacz też

Uwagi

Bibliografia

Cytaty

Źródła

Zewnętrzne linki