Teoria estymacji - Estimation theory
Teoria estymacji to dział statystyki zajmujący się szacowaniem wartości parametrów na podstawie zmierzonych danych empirycznych, które mają składnik losowy. Parametry opisują podstawowe ustawienie fizyczne w taki sposób, że ich wartość wpływa na rozkład danych pomiarowych. Estymator usiłuje zbliżyć nieznanych parametrów za pomocą pomiarów. Czytaj W teorii estymacji na ogół rozważane są dwa podejścia.
- Podejście probabilistyczne (opisane w tym artykule) zakłada, że dane pomiarowe są losowe z rozkładem prawdopodobieństwa zależnym od interesujących nas parametrów
- Podejście zbioru-członkostwa zakłada, że wektor danych pomiarowych należy do zbioru, który zależy od wektora parametrów.
Przykłady
Na przykład pożądane jest oszacowanie odsetka populacji wyborców, którzy zagłosują na konkretnego kandydata. Ta proporcja jest poszukiwanym parametrem; szacunek opiera się na małej losowej próbie wyborców. Alternatywnie, pożądane jest oszacowanie prawdopodobieństwa głosowania wyborcy na konkretnego kandydata na podstawie pewnych cech demograficznych, takich jak wiek.
Lub, na przykład, w radarze celem jest znalezienie zasięgu obiektów (samoloty, łodzie itp.) poprzez analizę dwukierunkowego czasu przejścia odebranych ech wysyłanych impulsów. Ponieważ odbite impulsy są nieuchronnie osadzane w szumie elektrycznym, ich zmierzone wartości są losowo rozłożone, tak że czas przejścia musi być oszacowany.
Inny przykład, w teorii komunikacji elektrycznej, pomiary, które zawierają informacje dotyczące interesujących parametrów, są często związane z zaszumionym sygnałem .
Podstawy
Dla danego modelu potrzeba kilku „składników” statystycznych, aby można było zaimplementować estymator. Pierwsza to próba statystyczna – zbiór punktów danych pobranych z losowego wektora (RV) o rozmiarze N . Wstaw do wektora ,
Po drugie, są parametry M
których wartości mają być oszacowane. Po trzecie, ciągłą funkcję gęstości prawdopodobieństwa (pdf) lub jej dyskretny odpowiednik, funkcję masy prawdopodobieństwa (pmf) rozkładu bazowego, który wygenerował dane, należy określić w zależności od wartości parametrów:
Możliwe jest również, że same parametry mają rozkład prawdopodobieństwa (np. statystyka bayesowska ). Następnie konieczne jest zdefiniowanie prawdopodobieństwa bayesowskiego
Po utworzeniu modelu, celem jest oszacowanie parametrów, z oszacowaniami powszechnie oznaczanymi , gdzie „czapka” oznacza oszacowanie.
Jednym wspólnym estymatorem jest estymator minimalnego błędu średniokwadratowego (MMSE), który wykorzystuje błąd między oszacowanymi parametrami a rzeczywistą wartością parametrów
jako podstawa optymalności. Ten składnik błędu jest następnie podnoszony do kwadratu, a oczekiwana wartość tej kwadratowej wartości jest minimalizowana dla estymatora MMSE.
Estymatory
Powszechnie stosowane estymatory (metody estymacji) i tematy z nimi związane to:
- Estymatory największej wiarygodności
- Estymatory Bayesa
- Metoda estymatorów momentów
- Cramér-Rao związany
- Najmniej kwadratów
- Minimalny błąd średniokwadratowy (MMSE), znany również jako błąd najmniejszego kwadratu Bayesa (BLSE)
- Maksymalnie a posteriori (MAP)
- Nieobciążony estymator minimalnej wariancji (MVUE)
- Nieliniowa identyfikacja systemu
- Najlepszy liniowy nieobciążony estymator (NIEBIESKI)
- Bezstronne estymatory — patrz błąd estymatora .
- Filtr cząstek
- Sieć Markowa Monte Carlo (MCMC)
- Filtr Kalmana i jego różne pochodne
- Filtr Wienera
Przykłady
Nieznana stała w addytywnym białym szumie Gaussa
Rozważmy otrzymany dyskretny sygnał , , niezależnych próbek, który składa się z nieznanej stałej z dodatkiem białego szumu Gaussa (AWGN) o zerowej średniej i znanej wariancji ( tj , ). Ponieważ wariancja jest znana, jedynym nieznanym parametrem jest .
Modelem sygnału jest zatem
Dwa możliwe (z wielu) estymatory dla parametru to:
- która jest średnią próbki
Oba te estymatorów mają średnią z , która może być pokazany przez poświęcenie oczekiwaną wartość każdego estymatora
oraz
W tym momencie wydaje się, że te dwa estymatory wykonują to samo. Jednak różnica między nimi staje się widoczna przy porównywaniu wariancji.
oraz
Wydawałoby się, że średnia z próby jest lepszym estymatorem, ponieważ jej wariancja jest mniejsza dla każdego N > 1.
Maksymalne prawdopodobieństwo
Kontynuując przykład z wykorzystaniem estymatora największej wiarygodności , funkcja gęstości prawdopodobieństwa (pdf) szumu dla jednej próbki wynosi
i prawdopodobieństwo staje się ( można pomyśleć o )
Przez niezależność prawdopodobieństwo staje się
Biorąc logarytmu naturalnego z PDF
a estymator największej wiarygodności to
Biorąc pierwszą pochodną funkcji logarytmicznej wiarygodności
i ustawiam na zero
Daje to estymator największej wiarygodności
co jest po prostu średnią z próby. Na podstawie tego przykładu stwierdzono, że średnia próbki jest estymatorem maksymalnego prawdopodobieństwa dla próbek o ustalonym, nieznanym parametrze uszkodzonym przez AWGN.
Cramér-Rao dolna granica
Aby znaleźć dolną granicę Craméra-Rao (CRLB) estymatora średniej próbki, należy najpierw znaleźć numer informacyjny Fishera
i kopiowanie z góry
Biorąc drugą pochodną
a znalezienie ujemnej wartości oczekiwanej jest trywialne, ponieważ jest to teraz stała deterministyczna
Na koniec, umieszczając informacje Fishera w:
prowadzi do
Porównanie tego z wariancją średniej próbki (określonej wcześniej) pokazuje, że średnia próbki jest równa dolnej granicy Craméra-Rao dla wszystkich wartości i . Innymi słowy, średnia z próby jest (koniecznie unikalnym) efektywnym estymatorem , a zatem również nieobciążonym estymatorem minimalnej wariancji (MVUE), oprócz tego, że jest estymatorem największej wiarygodności .
Maksimum równomiernego rozkładu
Jednym z najprostszych nietrywialnych przykładów estymacji jest estymacja maksimum rozkładu jednostajnego. Jest używany jako praktyczne ćwiczenie w klasie i do zilustrowania podstawowych zasad teorii estymacji. Ponadto, w przypadku estymacji na pojedynczej próbie, pokazuje problemy filozoficzne i możliwe nieporozumienia w stosowaniu estymatorów największej wiarogodności i funkcji wiarogodności .
Biorąc pod uwagę dyskretny rozkład jednostajny z nieznanym maksimum, estymator UMVU dla maksimum jest podany przez
gdzie m to maksimum próbki, a k to wielkość próby , pobieranie próbek bez wymiany. Problem ten jest powszechnie znany jako problem niemieckich czołgów , ze względu na zastosowanie maksymalnych szacunków do oszacowań produkcji niemieckich czołgów podczas II wojny światowej .
Formuła może być intuicyjnie rozumiana jako;
- "Maksimum próbki plus średnia luka między obserwacjami w próbie",
luka jest dodawana w celu skompensowania ujemnego obciążenia maksimum próbki jako estymatora maksimum populacji.
To ma wariancję
więc odchylenie standardowe w przybliżeniu , średnia (populacyjna) wielkość luki między próbkami; porównaj powyżej. Można to postrzegać jako bardzo prosty przypadek oszacowania maksymalnego odstępu .
Maksimum próbki jest estymatorem największej wiarygodności dla maksimum populacji, ale, jak omówiono powyżej, jest obciążone.
Aplikacje
Wiele dziedzin wymaga zastosowania teorii estymacji. Niektóre z tych pól obejmują:
- Interpretacja eksperymentów naukowych
- Przetwarzanie sygnałów
- Badania kliniczne
- Ankiety
- Kontrola jakości
- Telekomunikacja
- Zarządzanie projektami
- Inżynieria oprogramowania
- Teoria sterowania (w szczególności sterowanie adaptacyjne )
- System wykrywania włamań do sieci
- Określanie orbity
Dane pomiarowe mogą być przedmiotem hałasu lub niepewności, a to przez statystycznego prawdopodobieństwa , że optymalne rozwiązania są starał się ekstraktu jak najwięcej informacji z danych, jak to możliwe.
Zobacz też
- Najlepszy liniowy nieobciążony estymator (NIEBIESKI)
- Kompletność (statystyki)
- Teoria wykrywania
- Wydajność (statystyki)
- Algorytm maksymalizacji oczekiwań (algorytm EM)
- Problem Fermiego
- Model w szarym pudełku
- Teoria informacji
- Analiza widmowa metodą najmniejszych kwadratów
- Dopasowany filtr
- Estymacja spektralna maksymalnej entropii
- Uciążliwy parametr
- Równanie parametryczne
- Zasada Pareto
- Zasada trzech (statystyki)
- Estymator stanu
- Statystyczne przetwarzanie sygnału
- Wystarczalność (statystyki)
Uwagi
Bibliografia
Cytaty
Źródła
- Teoria estymacji punktowej autorstwa EL Lehmanna i G. Caselli. ( ISBN 0387985026 )
- Inżynieria kosztów systemów autorstwa Dale'a Shermana. ( ISBN 978-0-566-08861-2 )
- Statystyka matematyczna i analiza danych Johna Rice'a. ( ISBN 0-534-209343 )
- Podstawy statystycznego przetwarzania sygnałów: teoria estymacji Stevena M. Kaya ( ISBN 0-13-345711-7 )
- Wprowadzenie do wykrywania i szacowania sygnału autorstwa H. Vincenta Poora ( ISBN 0-387-94173-8 )
- Teoria wykrywania, szacowania i modulacji, część 1 , Harry L. Van Trees ( ISBN 0-471-09517-6 ; strona internetowa )
- Optymalnego stanu szacunek: Kalmana, H-nieskończoność, a nieliniowa Podejścia przez Dan Simon stronie
- Ali H. Sayed , Filtry adaptacyjne , Wiley, NJ, 2008, ISBN 978-0-470-25388-5 .
- Ali H. Sayed , Podstawy filtrowania adaptacyjnego, Wiley, NJ, 2003, ISBN 0-471-46126-1 .
- Thomas Kailath , Ali H. Sayed , i Babak Hassibi , Oszacowanie liniowe , Prentice-Hall, NJ, 2000, ISBN 978-0-13-022464-4 .
- Babak Hassibi , Ali H. Sayed i Thomas Kailath , Nieokreślone kwadratowe szacowanie i kontrola: ujednolicone podejście do teorii H 2 i H , Towarzystwo Matematyki Przemysłowej i Stosowanej (SIAM), PA, 1999, ISBN 978-0-89871-411 -1 .
- VGVoinov, MSNikulin, „Bezstronne estymatory i ich zastosowania. Vol.1: Przypadek jednowymiarowy”, Kluwer Academic Publishers, 1993, ISBN 0-7923-2382-3 .
- VGVoinov, MSNikulin, „Bezstronne estymatory i ich zastosowania. Vol.2: Przypadek wielowymiarowy”, Kluwer Academic Publishers, 1996, ISBN 0-7923-3939-8 .
Zewnętrzne linki
- Multimedia związane z teorią estymacji w Wikimedia Commons