Wybór modelu - Model selection
Wybór modelu to zadanie wyboru modelu statystycznego ze zbioru modeli kandydujących, podanych danych. W najprostszych przypadkach bierze się pod uwagę istniejący zestaw danych. Jednak zadanie to może również obejmować projektowanie eksperymentów tak, aby zebrane dane były dobrze dopasowane do problemu wyboru modelu. Biorąc pod uwagę potencjalne modele o podobnej mocy predykcyjnej lub wyjaśniającej, najprostszy model najprawdopodobniej będzie najlepszym wyborem ( brzytwa Ockhama ).
Konishi i Kitagawa (2008 , s. 75) stwierdzają: „Większość problemów związanych z wnioskowaniem statystycznym można uznać za problemy związane z modelowaniem statystycznym”. W związku z tym Cox (2006 , s. 197) powiedział: „Jak dokonywane jest tłumaczenie problemu merytorycznego na model statystyczny jest często najbardziej krytyczną częścią analizy”.
Wybór modelu może również odnosić się do problemu wyboru kilku reprezentatywnych modeli z dużego zestawu modeli obliczeniowych na potrzeby podejmowania decyzji lub optymalizacji w warunkach niepewności.
Wprowadzenie
W swoich najbardziej podstawowych formach dobór modelu jest jednym z podstawowych zadań dociekań naukowych . Ustalenie zasady wyjaśniającej szereg obserwacji jest często powiązane bezpośrednio z modelem matematycznym przewidującym te obserwacje. Na przykład, gdy Galileusz przeprowadzał swoje eksperymenty z pochyloną płaszczyzną , wykazał, że ruch kul odpowiada paraboli przewidywanej przez jego model.
Jak z niezliczonej liczby możliwych mechanizmów i procesów, które mogły wytworzyć dane, można w ogóle zacząć wybierać najlepszy model? Powszechnie stosowane podejście matematyczne decyduje o zestawie modeli kandydujących; ten zestaw musi być wybrany przez badacza. Często stosuje się proste modele, takie jak wielomiany , przynajmniej na początku. Burnham i Anderson (2002) podkreślają w swojej książce znaczenie wyboru modeli opartych na solidnych zasadach naukowych, takich jak zrozumienie procesów lub mechanizmów fenomenologicznych (np. reakcji chemicznych) leżących u podstaw danych.
Po wybraniu zestawu modeli kandydujących analiza statystyczna pozwala nam wybrać najlepszy z tych modeli. To, co rozumie się przez najlepsze, jest kontrowersyjne. Dobra technika wyboru modelu równoważy dobro dopasowania z prostotą. Bardziej złożone modele będą w stanie lepiej dostosować swój kształt do danych (na przykład wielomian piątego rzędu może dokładnie dopasować sześć punktów), ale dodatkowe parametry mogą nie przedstawiać niczego użytecznego. (Być może te sześć punktów jest po prostu losowo rozmieszczonych wokół linii prostej.) Dobroć dopasowania jest zwykle określana przy użyciu podejścia ilorazu wiarygodności lub jego przybliżenia, co prowadzi do testu chi-kwadrat . Złożoność jest zwykle mierzona przez zliczenie liczby parametrów w modelu.
Techniki wyboru modelu można traktować jako estymatory pewnych wielkości fizycznych, takich jak prawdopodobieństwo, że model wygeneruje dane dane. Stronniczość i wariancja są ważnymi miary jakości tego estymatora; często bierze się również pod uwagę wydajność .
Standardowym przykładem wyboru modelu jest dopasowywanie krzywej , gdzie mając zestaw punktów i inną podstawową wiedzę (np. punkty są wynikiem iid próbek), musimy wybrać krzywą opisującą funkcję, która wygenerowała punkty.
Dwa kierunki doboru modelu
Istnieją dwa główne cele wnioskowania i uczenia się na podstawie danych. Jednym z nich jest odkrycie naukowe, zrozumienie mechanizmu generowania danych i interpretacja natury danych. Innym celem uczenia się na podstawie danych jest przewidywanie przyszłych lub niewidzialnych obserwacji. W drugim celu badacz danych niekoniecznie dotyczy dokładnego probabilistycznego opisu danych. Oczywiście można zainteresować się również obydwoma kierunkami.
Zgodnie z dwoma różnymi celami, wybór modelu może mieć również dwa kierunki: wybór modelu do wnioskowania i wybór modelu do predykcji. Pierwszym kierunkiem jest identyfikacja najlepszego modelu danych, który najlepiej zapewni wiarygodną charakterystykę źródeł niepewności dla interpretacji naukowej. W tym celu istotne jest, aby wybrany model nie był zbyt wrażliwy na wielkość próby. W związku z tym odpowiednim pojęciem do oceny wyboru modelu jest spójność wyboru, co oznacza, że najsolidniejszy kandydat będzie konsekwentnie wybierany przy wystarczającej liczbie próbek danych.
Drugim kierunkiem jest wybór modelu jako maszyny, aby zapewnić doskonałą wydajność predykcyjną. Jednak w przypadku tych ostatnich wybrany model może być po prostu szczęśliwym zwycięzcą wśród kilku bliskich konkurentów, jednak wydajność predykcyjna może nadal być najlepsza z możliwych. Jeśli tak, wybór modelu jest dobry dla drugiego celu (prognozy), ale wykorzystanie wybranego modelu do wglądu i interpretacji może być bardzo niewiarygodne i mylące. Co więcej, w przypadku bardzo złożonych modeli wybranych w ten sposób, nawet przewidywania mogą być nieuzasadnione dla danych tylko nieznacznie różniących się od tych, na których dokonano selekcji.
Metody wspomagające wybór zestawu modeli kandydujących
Kryteria
Poniżej znajduje się lista kryteriów wyboru modelu. Najczęściej stosowanymi kryteriami są (i) kryterium informacyjne Akaike oraz (ii) czynnik Bayesa i/lub kryterium informacyjne bayesowskie (które w pewnym stopniu przybliża czynnik Bayesa), patrz Stoica i Selen (2004) .
- Kryterium informacyjne Akaike (AIC), miara dopasowania dobroci estymowanego modelu statystycznego
- Współczynnik Bayesaes
- Bayesowskie kryterium informacyjne (BIC), znane również jako kryterium informacyjne Schwarza, statystyczne kryterium wyboru modelu
- Kryterium pomostowe (BC), kryterium statystyczne, które pozwala osiągnąć lepszą wydajność AIC i BIC pomimo adekwatności specyfikacji modelu.
- Krzyżowa walidacja
- Kryterium informacji o odchyleniach (DIC), kolejne kryterium wyboru modelu zorientowanego na Bayesa
- Wskaźnik fałszywych odkryć
- Skoncentrowane kryterium informacyjne (FIC), kryterium selekcji sortujące modele statystyczne według ich skuteczności dla danego parametru skupienia
- Kryterium informacyjne Hannana-Quinna , alternatywa dla kryteriów Akaike i Bayesa
- Kryterium informacyjne Kashyap (KIC) jest potężną alternatywą dla AIC i BIC, ponieważ KIC wykorzystuje macierz informacji Fishera
- Test ilorazu prawdopodobieństwa
- C p . Malwy
- Minimalna długość opisu
- Minimalna długość wiadomości (MML)
- Statystyka PRESS , znana również jako kryterium PRESS
- Minimalizacja ryzyka strukturalnego
- Regresja krokowa
- Kryterium informacyjne Watanabe- Akaike (WAIC), zwane również powszechnie stosowanym kryterium informacyjnym
- Rozszerzone Bayesowskie Kryterium Informacyjne (EBIC) jest rozszerzeniem zwykłego Bayesowskiego Kryterium Informacyjnego (BIC) dla modeli o wysokich przestrzeniach parametrów.
- Rozszerzone kryterium informacyjne Fishera (EFIC) jest kryterium wyboru modelu dla modeli regresji liniowej.
Wśród tych kryteriów walidacja krzyżowa jest zwykle najdokładniejszą i najdroższą obliczeniowo w przypadku nadzorowanych problemów związanych z uczeniem się.
Burnham i Anderson (2002 , §6.3) mówią, co następuje:
Istnieje wiele metod doboru modeli. Jednak z punktu widzenia wydajności statystycznej metody i zamierzonego kontekstu jej użycia, istnieją tylko dwie odrębne klasy metod: Zostały one oznaczone jako wydajne i spójne . (…) Zgodnie z paradygmatem częstystowskim przy wyborze modelu generalnie wyróżnia się trzy główne podejścia: (I) optymalizacja niektórych kryteriów wyboru, (II) testowanie hipotez oraz (III) metody ad hoc.
Zobacz też
- Wszystkie modele są błędne
- Analiza konkurencyjnych hipotez
- Zautomatyzowane uczenie maszynowe (AutoML)
- Dylemat bias-wariancja
- Wybór funkcji
- Paradoks Freedmana
- Wyszukiwanie w siatce
- Analiza identyfikowalności
- Analiza log-liniowa
- Identyfikacja modelu
- Brzytwa Ockhama
- Optymalny projekt
- Problem z identyfikacją parametrów
- Modelowanie naukowe
- Walidacja modelu statystycznego
- Paradoks Steina
Uwagi
Bibliografia
- Aho, K.; Derryberry, D.; Peterson, T. (2014), "Wybór modelu dla ekologów: światopoglądy AIC i BIC", Ekologia , 95 (3): 631-636, doi : 10.1890/13-1452.1 , PMID 24804445
- Akaike, H. (1994), „Implikacje informacyjnego punktu widzenia na rozwój nauki statystycznej”, w Bozdogan, H. (red.), Proceedings of the First US/JAPONIA Conference on The Frontiers of Statistical Modeling: An Informational Podejście — tom 3 , Kluwer Academic Publishers , s. 27–38
- Anderson, DR (2008), Wnioskowanie oparte na modelu w naukach przyrodniczych , Springer, ISBN 9780387740751
- Ando, T. (2010), Bayesowski wybór modelu i modelowanie statystyczne , CRC Press , ISBN 9781439836156
- Breiman, L. (2001), "Modelowanie statystyczne: dwie kultury", Statistical Science , 16 : 199-231, doi : 10.1214/ss/1009213726
- Burnham, KP; Anderson, DR (2002), Wybór modelu i wnioskowanie wielomodelowe: praktyczne podejście do teorii informacji (2nd ed.), Springer-Verlag, ISBN 0-387-95364-7[ma ponad 38000 cytowań w Google Scholar ]
- Chamberlin, TC (1890), "Metoda wielu hipotez roboczych", Science , 15 (366): 92-6, Bibcode : 1890Sci....15R..92. , doi : 10.1126/science.ns-15.366.92 , PMID 17782687(przedruk 1965, Science 148: 754-759 [1] doi : 10.1126/science.148.3671.754 )
- Claeskens, G. (2016), "Wybór modelu statystycznego" (PDF) , Roczny przegląd statystyk i ich zastosowania , 3 (1): 233-256, Bibcode : 2016AnRSA...3..233C , doi : 10.1146/annurev -statystyki-041715-033413
- Claeskens, G.; Hjort, NL (2008), Wybór modelu i uśrednianie modelu , Cambridge University Press, ISBN 9781139471800
- Cox, DR (2006), Zasady wnioskowania statystycznego , Cambridge University Press
- Kashyap, RL (1982), „Optymalny wybór części AR i MA w autoregresyjnych modelach średniej ruchomej”, IEEE Transactions on Pattern Analysis and Machine Intelligence , IEEE, PAMI-4 (2): 99-104, doi : 10.1109/TPAMI. 1982.4767213 , PMID 21869012 , S2CID 18484243
- Konishi, S.; Kitagawa, G. (2008), Kryteria informacyjne i modelowanie statystyczne , Springer, Bibcode : 2007icsm.book.....K , ISBN 9780387718866
- Lahiri, P. (2001), Wybór modelu , Instytut Statystyki Matematycznej
- Leeb, H.; Pötscher, BM (2009), "Wybór modelu", w Anderson, TG (red.), Handbook of Financial Time Series , Springer, pp. 889-925, doi : 10.1007/978-3-540-71297-8_39 , ISBN 978-3-540-71296-1
- Lukacs, PM; Thompson, WL; Kendall, WL; Goulda, WR; Doherty, PF Jr.; Burnham, KP; Anderson, DR (2007), „Obawy dotyczące wezwania do pluralizmu teorii informacji i testowania hipotez”, Journal of Applied Ecology , 44 (2): 456-460, doi : 10.1111/j.1365-2664.2006.01267.x
- McQuarrie, Allan DR; Tsai, Chih-Ling (1998), Regresja i wybór modeli szeregów czasowych , Singapur: World Scientific, ISBN 981-02-3242-X
- Massart, P. (2007), Nierówności koncentracji i wybór modelu , Springer
- Massart, P. (2014), „Nie asymptotyczny spacer po prawdopodobieństwie i statystyce” , w Lin, Xihong (red.), Przeszłość, teraźniejszość i przyszłość nauki statystycznej , Chapman & Hall , s. 309-321, ISBN 9781482204988
- Navarro, DJ (2019), „Between the Devil and the Deep Blue Sea: Napięcia między oceną naukową a doborem modelu statystycznego”, Computational Brain & Behavior , 2 : 28-34, doi : 10.1007/s42113-018-0019-z
- Resende, Paulo Angelo Alves; Dorea, Chang Chung Yu (2016), „Identyfikacja modelu za pomocą kryterium efektywnego oznaczania”, Journal of Multivariate Analysis , 150 : 229-244, arXiv : 1409.7441 , doi : 10.1016/j.jmva.2016.06.002 , S2CID 5469654
- Shmueli, G. (2010), „Wyjaśnić czy przewidzieć?” , Statystyka , 25 (3): 289-310, arXiv : 1101.0891 , doi : 10.1214/10-STS330 , MR 2791669 , S2CID 15900983
- Stoica, P.; Selen, Y. (2004), „Wybór modelu kolejności: przegląd zasad kryterium informacji” (PDF) , IEEE Signal Processing Magazine , 21 (4): 36-47
- Dowcip, E.; van den Heuvel, E.; Romeijn, J.-W. (2012), " ' Wszystkie modele są złe...': wprowadzenie do niepewności modelu" (PDF) , Statistica Neerlandica , 66 (3): 217-236, doi : 10.1111/j.1467-9574.2012.00530.x
- Dowcip, E.; McCullagh, P. (2001), Viana, MAG; Richards, D. St. P. (red.), "Rozszerzalność modeli statystycznych", Metody algebraiczne w statystyce i prawdopodobieństwie , s. 327-340
- Wójtowicz, Anna; Bigaj, Tomasz (2016), „Uzasadnienie, potwierdzenie i problem wzajemnie wykluczających się hipotez”, w Kuźniar, Adrian; Odrowąż-Sypniewska, Joanna (red.), Uncovering Facts and Values , Brill Publishers , s. 122–143, doi : 10.1163/9789004312654_009 , ISBN 9789004312654
- Owrang, Arash; Jansson, Magnus (2018), „Kryterium wyboru modelu dla wysokowymiarowej regresji liniowej” , IEEE Transactions on Signal Processing , 66 (13): 3436-3446, Bibcode : 2018ITSP...66.3436O , doi : 10.1109/TSP. 2018.2821628 , ISSN 1941-0476 , S2CID 46931136