Bayesowska regresja liniowa - Bayesian linear regression

W statystykach , Bayesa regresji liniowej jest podejście do regresji liniowej , w którym analiza statystyczna jest podejmowane w kontekście Bayesa wnioskowania . Gdy model regresji zawiera błędy, które mają rozkład normalny i jeśli założono określoną formę wcześniejszego rozkładu , dostępne są jawne wyniki dla późniejszych rozkładów prawdopodobieństwa parametrów modelu.

Konfiguracja modelu

Rozważmy standardowy regresji liniowej problem, w którym dla określamy średnią z rozkładu warunkowego w danym o wektorze predyktora :

gdzie jest wektorem, a zmienne losowe są niezależne i mają identyczny rozkład normalny :

Odpowiada to następującej funkcji prawdopodobieństwa :

Zwykłe kwadraty najmniej Roztwór ten jest stosowany w celu oszacowania wektora współczynnik pomocą pseudoinverse Moore-Penrose :

gdzie jest macierz projektowa , której każdy wiersz jest wektorem predykcyjnym ; i jest kolumną -vector .

Jest to podejście częste i zakłada, że ​​jest wystarczająco dużo pomiarów, aby powiedzieć o czymś sensownym . W podejściu bayesowskim dane są uzupełniane dodatkowymi informacjami w postaci wcześniejszego rozkładu prawdopodobieństwa . Wcześniejsze przekonanie o parametrach jest łączone z funkcją wiarygodności danych zgodnie z twierdzeniem Bayesa, aby uzyskać późniejsze przekonanie o parametrach i . Przeor może przybierać różne formy funkcjonalne w zależności od domeny i informacji, które są dostępne a priori .

Ze sprzężonymi poprzednikami

Koniuguj wcześniejszą dystrybucję

W przypadku arbitralnej, wcześniejszej dystrybucji, może nie być analitycznego rozwiązania dla późniejszej dystrybucji . W tej części rozważymy tak zwany koniugat, dla którego można analitycznie wyprowadzić rozkład późniejszy.

Przeor jest sprzężony z tą funkcją prawdopodobieństwa, jeśli ma tę samą postać funkcjonalną w odniesieniu do i . Ponieważ logarytm prawdopodobieństwa jest kwadratowy , logarytm prawdopodobieństwa jest ponownie zapisywany w taki sposób, że prawdopodobieństwo staje się normalne w . pisać

Prawdopodobieństwo zostało teraz ponownie zapisane jako

gdzie

gdzie jest liczbą współczynników regresji.

Sugeruje to formę dla przeora:

gdzie jest odwrotna dystrybucja gamma

W notacji wprowadzonego do dystrybucji odwrotny gamma wyrobu, to jest, że gęstość jego rozkładu o a z a co wcześniejszych wartości i , odpowiednio. Równoważnie można go również opisać jako skalowany odwrotny rozkład chi kwadrat ,

Ponadto warunkowa poprzednia gęstość jest rozkładem normalnym ,

W zapisie rozkładu normalnego warunkowy rozkład poprzedni to

Dystrybucja tylna

Po określeniu wcześniejszego rozkładu późniejszego można wyrazić jako

Po pewnym ponownym ułożeniu, późniejsze można zapisać ponownie, tak aby późniejsza średnia wektora parametrów mogła być wyrażona w postaci estymatora najmniejszych kwadratów i wcześniejszej średniej , z siłą poprzedniej wskazaną przez poprzednią macierz precyzji

Aby uzasadnić, że jest to rzeczywiście późniejsza średnia, wyrażenia kwadratowe w wykładnictwie można przeorganizować w formę kwadratową w .

Teraz a posterior można wyrazić jako rozkład normalny pomnożony przez odwrotny rozkład gamma :

Dlatego rozkład a posteriori można sparametryzować w następujący sposób.

gdzie dwa czynniki odpowiadają gęstościom i rozkładom, z parametrami tych podanymi przez

Można to zinterpretować jako uczenie bayesowskie, w którym parametry są aktualizowane zgodnie z poniższymi równaniami.

Wzorcowe dowody

Modelu dowodem jest prawdopodobieństwo danych podanych modelu . Jest również znane jako prawdopodobieństwo krańcowe i poprzednia gęstość predykcyjna . Tutaj model jest definiowany przez funkcję wiarygodności i wcześniejszy rozkład parametrów, tj . Dowody modelowe wychwytują w jednej liczbie, jak dobrze taki model wyjaśnia obserwacje. Dowody modelu Bayesowskiego modelu regresji liniowej przedstawione w tej sekcji można wykorzystać do porównania konkurujących modeli liniowych przez porównanie modeli bayesowskich . Modele te mogą różnić się liczbą i wartościami zmiennych predykcyjnych, a także ich wyprzedzeniem względem parametrów modelu. Złożoność modelu jest już brana pod uwagę przez dowody modelu, ponieważ marginalizuje parametry poprzez całkowanie wszystkich możliwych wartości i .

Całkę tę można obliczyć analitycznie, a rozwiązanie podano w poniższym równaniu.

Tutaj oznacza funkcję gamma . Ponieważ wcześniej wybraliśmy koniugat, prawdopodobieństwo krańcowe można również łatwo obliczyć, oceniając następującą równość dla dowolnych wartości i .

Zauważ, że to równanie jest niczym innym jak ponownym ułożeniem twierdzenia Bayesa . Wstawienie wzorów na wcześniejsze, prawdopodobieństwo i późniejsze oraz uproszczenie wynikowego wyrażenia prowadzi do wyrażenia analitycznego podanego powyżej.

Inne przypadki

Ogólnie rzecz biorąc, analityczne wyznaczenie późniejszego rozkładu może być niemożliwe lub niepraktyczne. Możliwe jest jednak przybliżenie późniejszego za pomocą przybliżonej metody wnioskowania bayesowskiego , takiej jak próbkowanie Monte Carlo lub wariacyjny Bayes .

Szczególny przypadek nazywa się regresją kalenicy .

Podobną analizę można przeprowadzić dla ogólnego przypadku regresji wielowymiarowej, a część z nich przewiduje bayesowskie estymacje macierzy kowariancji : patrz Bayesowska wielowymiarowa regresja liniowa .

Zobacz też

Uwagi

Bibliografia

  • Pudełko, GEP ; Tiao, GC (1973). Wnioskowanie bayesowskie w analizie statystycznej . Wiley. ISBN   0-471-57428-7 .
  • Carlin, Bradley P .; Louis, Thomas A. (2008). Bayesian Methods for Data Analysis, wydanie trzecie . Boca Raton, FL: Chapman and Hall / CRC. ISBN   1-58488-697-8 .
  • Fahrmeir, L .; Kneib, T .; Lang, S. (2009). Regresja. Modelle, Methoden und Anwendungen (wyd. Drugie). Heidelberg: Springer. doi : 10.1007 / 978-3-642-01837-4 . ISBN   978-3-642-01836-7 .
  • Fornalski KW; Parzych G .; Pylak M .; Satuła D .; Dobrzyński L. (2010). „Zastosowanie rozumowania bayesowskiego i metody maksymalnej entropii do niektórych problemów rekonstrukcji” . Acta Physica Polonica . 117 (6): 892–899. doi : 10.12693 / APhysPolA.117.892 .
  • Fornalski, Krzysztof W. (2015). „Zastosowania solidnej analizy regresji bayesowskiej”. International Journal of Society Systems Science . 7 (4): 314–333. doi : 10.1504 / IJSSS.2015.073223 .
  • Gelman, Andrew ; Carlin, John B .; Stern, Hal S .; Rubin, Donald B. (2003). Bayesian Data Analysis, wydanie drugie . Boca Raton, FL: Chapman and Hall / CRC. ISBN   1-58488-388-X .
  • Goldstein, Michael; Wooff, David (2007). Statystyka liniowa Bayesa, teoria i metody . Wiley. ISBN   978-0-470-01562-9 .
  • Minka, Thomas P. (2001) Bayesian Linear Regression , strona badawcza firmy Microsoft
  • Rossi, Peter E .; Allenby, Greg M .; McCulloch, Robert (2006). Statystyki Bayesa i marketing . John Wiley & Sons. ISBN   0470863676 .
  • O'Hagan, Anthony (1994). Wnioskowanie bayesowskie . Zaawansowana teoria statystyki Kendalla. 2B (pierwsze wyd.). Halsted. ISBN   0-340-52922-9 .
  • Sivia, DS; Umiejętności, J. (2006). Analiza danych - samouczek Bayesa (wyd. Drugie). Oxford University Press.
  • Walter, Gero; Augustin, Thomas (2009). „Bayesowska regresja liniowa - różne modele sprzężone i ich (nie) wrażliwość na konflikt danych wcześniejszych” (PDF) . Raport techniczny nr 069, Wydział Statystyki Uniwersytetu Monachijskiego .

Linki zewnętrzne