Wybór modelu - Model selection

Wybór modelu to zadanie wyboru modelu statystycznego ze zbioru modeli kandydujących, podanych danych. W najprostszych przypadkach bierze się pod uwagę istniejący zestaw danych. Jednak zadanie to może również obejmować projektowanie eksperymentów tak, aby zebrane dane były dobrze dopasowane do problemu wyboru modelu. Biorąc pod uwagę potencjalne modele o podobnej mocy predykcyjnej lub wyjaśniającej, najprostszy model najprawdopodobniej będzie najlepszym wyborem ( brzytwa Ockhama ).

Konishi i Kitagawa (2008 , s. 75) stwierdzają: „Większość problemów związanych z wnioskowaniem statystycznym można uznać za problemy związane z modelowaniem statystycznym”. W związku z tym Cox (2006 , s. 197) powiedział: „Jak dokonywane jest tłumaczenie problemu merytorycznego na model statystyczny jest często najbardziej krytyczną częścią analizy”.

Wybór modelu może również odnosić się do problemu wyboru kilku reprezentatywnych modeli z dużego zestawu modeli obliczeniowych na potrzeby podejmowania decyzji lub optymalizacji w warunkach niepewności.

Wprowadzenie

Cykl obserwacji naukowych.

W swoich najbardziej podstawowych formach dobór modelu jest jednym z podstawowych zadań dociekań naukowych . Ustalenie zasady wyjaśniającej szereg obserwacji jest często powiązane bezpośrednio z modelem matematycznym przewidującym te obserwacje. Na przykład, gdy Galileusz przeprowadzał swoje eksperymenty z pochyloną płaszczyzną , wykazał, że ruch kul odpowiada paraboli przewidywanej przez jego model.

Jak z niezliczonej liczby możliwych mechanizmów i procesów, które mogły wytworzyć dane, można w ogóle zacząć wybierać najlepszy model? Powszechnie stosowane podejście matematyczne decyduje o zestawie modeli kandydujących; ten zestaw musi być wybrany przez badacza. Często stosuje się proste modele, takie jak wielomiany , przynajmniej na początku. Burnham i Anderson (2002) podkreślają w swojej książce znaczenie wyboru modeli opartych na solidnych zasadach naukowych, takich jak zrozumienie procesów lub mechanizmów fenomenologicznych (np. reakcji chemicznych) leżących u podstaw danych.

Po wybraniu zestawu modeli kandydujących analiza statystyczna pozwala nam wybrać najlepszy z tych modeli. To, co rozumie się przez najlepsze, jest kontrowersyjne. Dobra technika wyboru modelu równoważy dobro dopasowania z prostotą. Bardziej złożone modele będą w stanie lepiej dostosować swój kształt do danych (na przykład wielomian piątego rzędu może dokładnie dopasować sześć punktów), ale dodatkowe parametry mogą nie przedstawiać niczego użytecznego. (Być może te sześć punktów jest po prostu losowo rozmieszczonych wokół linii prostej.) Dobroć dopasowania jest zwykle określana przy użyciu podejścia ilorazu wiarygodności lub jego przybliżenia, co prowadzi do testu chi-kwadrat . Złożoność jest zwykle mierzona przez zliczenie liczby parametrów w modelu.

Techniki wyboru modelu można traktować jako estymatory pewnych wielkości fizycznych, takich jak prawdopodobieństwo, że model wygeneruje dane dane. Stronniczość i wariancja są ważnymi miary jakości tego estymatora; często bierze się również pod uwagę wydajność .

Standardowym przykładem wyboru modelu jest dopasowywanie krzywej , gdzie mając zestaw punktów i inną podstawową wiedzę (np. punkty są wynikiem iid próbek), musimy wybrać krzywą opisującą funkcję, która wygenerowała punkty.

Dwa kierunki doboru modelu

Istnieją dwa główne cele wnioskowania i uczenia się na podstawie danych. Jednym z nich jest odkrycie naukowe, zrozumienie mechanizmu generowania danych i interpretacja natury danych. Innym celem uczenia się na podstawie danych jest przewidywanie przyszłych lub niewidzialnych obserwacji. W drugim celu badacz danych niekoniecznie dotyczy dokładnego probabilistycznego opisu danych. Oczywiście można zainteresować się również obydwoma kierunkami.

Zgodnie z dwoma różnymi celami, wybór modelu może mieć również dwa kierunki: wybór modelu do wnioskowania i wybór modelu do predykcji. Pierwszym kierunkiem jest identyfikacja najlepszego modelu danych, który najlepiej zapewni wiarygodną charakterystykę źródeł niepewności dla interpretacji naukowej. W tym celu istotne jest, aby wybrany model nie był zbyt wrażliwy na wielkość próby. W związku z tym odpowiednim pojęciem do oceny wyboru modelu jest spójność wyboru, co oznacza, że najsolidniejszy kandydat będzie konsekwentnie wybierany przy wystarczającej liczbie próbek danych.

Drugim kierunkiem jest wybór modelu jako maszyny, aby zapewnić doskonałą wydajność predykcyjną. Jednak w przypadku tych ostatnich wybrany model może być po prostu szczęśliwym zwycięzcą wśród kilku bliskich konkurentów, jednak wydajność predykcyjna może nadal być najlepsza z możliwych. Jeśli tak, wybór modelu jest dobry dla drugiego celu (prognozy), ale wykorzystanie wybranego modelu do wglądu i interpretacji może być bardzo niewiarygodne i mylące. Co więcej, w przypadku bardzo złożonych modeli wybranych w ten sposób, nawet przewidywania mogą być nieuzasadnione dla danych tylko nieznacznie różniących się od tych, na których dokonano selekcji.

Metody wspomagające wybór zestawu modeli kandydujących

Kryteria

Poniżej znajduje się lista kryteriów wyboru modelu. Najczęściej stosowanymi kryteriami są (i) kryterium informacyjne Akaike oraz (ii) czynnik Bayesa i/lub kryterium informacyjne bayesowskie (które w pewnym stopniu przybliża czynnik Bayesa), patrz Stoica i Selen (2004) .

Kryterium informacyjne Akaike (AIC), miara dopasowania dobroci estymowanego modelu statystycznego
Współczynnik Bayesaes
Bayesowskie kryterium informacyjne (BIC), znane również jako kryterium informacyjne Schwarza, statystyczne kryterium wyboru modelu
Kryterium pomostowe (BC), kryterium statystyczne, które pozwala osiągnąć lepszą wydajność AIC i BIC pomimo adekwatności specyfikacji modelu.
Krzyżowa walidacja
Kryterium informacji o odchyleniach (DIC), kolejne kryterium wyboru modelu zorientowanego na Bayesa
Wskaźnik fałszywych odkryć
Skoncentrowane kryterium informacyjne (FIC), kryterium selekcji sortujące modele statystyczne według ich skuteczności dla danego parametru skupienia
Kryterium informacyjne Hannana-Quinna , alternatywa dla kryteriów Akaike i Bayesa
Kryterium informacyjne Kashyap (KIC) jest potężną alternatywą dla AIC i BIC, ponieważ KIC wykorzystuje macierz informacji Fishera
Test ilorazu prawdopodobieństwa
C _{p .} Malwy
Minimalna długość opisu
Minimalna długość wiadomości (MML)
Statystyka PRESS , znana również jako kryterium PRESS
Minimalizacja ryzyka strukturalnego
Regresja krokowa
Kryterium informacyjne Watanabe- Akaike (WAIC), zwane również powszechnie stosowanym kryterium informacyjnym
Rozszerzone Bayesowskie Kryterium Informacyjne (EBIC) jest rozszerzeniem zwykłego Bayesowskiego Kryterium Informacyjnego (BIC) dla modeli o wysokich przestrzeniach parametrów.
Rozszerzone kryterium informacyjne Fishera (EFIC) jest kryterium wyboru modelu dla modeli regresji liniowej.

Wśród tych kryteriów walidacja krzyżowa jest zwykle najdokładniejszą i najdroższą obliczeniowo w przypadku nadzorowanych problemów związanych z uczeniem się.

Burnham i Anderson (2002 , §6.3) mówią, co następuje:

Istnieje wiele metod doboru modeli. Jednak z punktu widzenia wydajności statystycznej metody i zamierzonego kontekstu jej użycia, istnieją tylko dwie odrębne klasy metod: Zostały one oznaczone jako wydajne i spójne . (…) Zgodnie z paradygmatem częstystowskim przy wyborze modelu generalnie wyróżnia się trzy główne podejścia: (I) optymalizacja niektórych kryteriów wyboru, (II) testowanie hipotez oraz (III) metody ad hoc.

Zobacz też

Uwagi

Bibliografia

Aho, K.; Derryberry, D.; Peterson, T. (2014), "Wybór modelu dla ekologów: światopoglądy AIC i BIC", Ekologia , 95 (3): 631-636, doi : 10.1890/13-1452.1 , PMID 24804445
Akaike, H. (1994), „Implikacje informacyjnego punktu widzenia na rozwój nauki statystycznej”, w Bozdogan, H. (red.), Proceedings of the First US/JAPONIA Conference on The Frontiers of Statistical Modeling: An Informational Podejście — tom 3 , Kluwer Academic Publishers , s. 27–38
Anderson, DR (2008), Wnioskowanie oparte na modelu w naukach przyrodniczych , Springer, ISBN 9780387740751
Ando, T. (2010), Bayesowski wybór modelu i modelowanie statystyczne , CRC Press , ISBN 9781439836156
Breiman, L. (2001), "Modelowanie statystyczne: dwie kultury", Statistical Science , 16 : 199-231, doi : 10.1214/ss/1009213726
Burnham, KP; Anderson, DR (2002), Wybór modelu i wnioskowanie wielomodelowe: praktyczne podejście do teorii informacji (2nd ed.), Springer-Verlag, ISBN 0-387-95364-7[ma ponad 38000 cytowań w Google Scholar ]
Chamberlin, TC (1890), "Metoda wielu hipotez roboczych", Science , 15 (366): 92-6, Bibcode : 1890Sci....15R..92. , doi : 10.1126/science.ns-15.366.92 , PMID 17782687(przedruk 1965, Science 148: 754-759 [1] doi : 10.1126/science.148.3671.754 )
Claeskens, G. (2016), "Wybór modelu statystycznego" (PDF) , Roczny przegląd statystyk i ich zastosowania , 3 (1): 233-256, Bibcode : 2016AnRSA...3..233C , doi : 10.1146/annurev -statystyki-041715-033413
Claeskens, G.; Hjort, NL (2008), Wybór modelu i uśrednianie modelu , Cambridge University Press, ISBN 9781139471800
Cox, DR (2006), Zasady wnioskowania statystycznego , Cambridge University Press
Kashyap, RL (1982), „Optymalny wybór części AR i MA w autoregresyjnych modelach średniej ruchomej”, IEEE Transactions on Pattern Analysis and Machine Intelligence , IEEE, PAMI-4 (2): 99-104, doi : 10.1109/TPAMI. 1982.4767213 , PMID 21869012 , S2CID 18484243
Konishi, S.; Kitagawa, G. (2008), Kryteria informacyjne i modelowanie statystyczne , Springer, Bibcode : 2007icsm.book.....K , ISBN 9780387718866
Lahiri, P. (2001), Wybór modelu , Instytut Statystyki Matematycznej
Leeb, H.; Pötscher, BM (2009), "Wybór modelu", w Anderson, TG (red.), Handbook of Financial Time Series , Springer, pp. 889-925, doi : 10.1007/978-3-540-71297-8_39 , ISBN 978-3-540-71296-1
Lukacs, PM; Thompson, WL; Kendall, WL; Goulda, WR; Doherty, PF Jr.; Burnham, KP; Anderson, DR (2007), „Obawy dotyczące wezwania do pluralizmu teorii informacji i testowania hipotez”, Journal of Applied Ecology , 44 (2): 456-460, doi : 10.1111/j.1365-2664.2006.01267.x
McQuarrie, Allan DR; Tsai, Chih-Ling (1998), Regresja i wybór modeli szeregów czasowych , Singapur: World Scientific, ISBN 981-02-3242-X
Massart, P. (2007), Nierówności koncentracji i wybór modelu , Springer
Massart, P. (2014), „Nie asymptotyczny spacer po prawdopodobieństwie i statystyce” , w Lin, Xihong (red.), Przeszłość, teraźniejszość i przyszłość nauki statystycznej , Chapman & Hall , s. 309-321, ISBN 9781482204988
Navarro, DJ (2019), „Between the Devil and the Deep Blue Sea: Napięcia między oceną naukową a doborem modelu statystycznego”, Computational Brain & Behavior , 2 : 28-34, doi : 10.1007/s42113-018-0019-z
Resende, Paulo Angelo Alves; Dorea, Chang Chung Yu (2016), „Identyfikacja modelu za pomocą kryterium efektywnego oznaczania”, Journal of Multivariate Analysis , 150 : 229-244, arXiv : 1409.7441 , doi : 10.1016/j.jmva.2016.06.002 , S2CID 5469654
Shmueli, G. (2010), „Wyjaśnić czy przewidzieć?” , Statystyka , 25 (3): 289-310, arXiv : 1101.0891 , doi : 10.1214/10-STS330 , MR 2791669 , S2CID 15900983
Stoica, P.; Selen, Y. (2004), „Wybór modelu kolejności: przegląd zasad kryterium informacji” (PDF) , IEEE Signal Processing Magazine , 21 (4): 36-47
Dowcip, E.; van den Heuvel, E.; Romeijn, J.-W. (2012), " ' Wszystkie modele są złe...': wprowadzenie do niepewności modelu" (PDF) , Statistica Neerlandica , 66 (3): 217-236, doi : 10.1111/j.1467-9574.2012.00530.x
Dowcip, E.; McCullagh, P. (2001), Viana, MAG; Richards, D. St. P. (red.), "Rozszerzalność modeli statystycznych", Metody algebraiczne w statystyce i prawdopodobieństwie , s. 327-340
Wójtowicz, Anna; Bigaj, Tomasz (2016), „Uzasadnienie, potwierdzenie i problem wzajemnie wykluczających się hipotez”, w Kuźniar, Adrian; Odrowąż-Sypniewska, Joanna (red.), Uncovering Facts and Values , Brill Publishers , s. 122–143, doi : 10.1163/9789004312654_009 , ISBN 9789004312654
Owrang, Arash; Jansson, Magnus (2018), „Kryterium wyboru modelu dla wysokowymiarowej regresji liniowej” , IEEE Transactions on Signal Processing , 66 (13): 3436-3446, Bibcode : 2018ITSP...66.3436O , doi : 10.1109/TSP. 2018.2821628 , ISSN 1941-0476 , S2CID 46931136

Languages

In other projects