Teoria statystyczna - Statistical theory

Teoria statystycznych stanowi podstawę dla całego zakresu technik, zarówno projektu badania i analizy danych , które są wykorzystywane w aplikacjach o statystykach . Teoria obejmuje podejścia do problemów decyzyjnych statystycznych i wnioskowania statystycznego oraz działania i dedukcje, które spełniają podstawowe zasady określone dla tych różnych podejść. W ramach danego podejścia teoria statystyczna daje sposoby porównywania procedur statystycznych; może znaleźć najlepszą możliwą procedurę w danym kontekście dla danych problemów statystycznych lub może udzielić wskazówek dotyczących wyboru między procedurami alternatywnymi.

Oprócz filozoficznych rozważań na temat sposobu wnioskowania statystycznego i decyzje, wiele teorii statystycznej składa statystyki matematycznej i jest ściśle powiązana z teorii prawdopodobieństwa i teorii użyteczności , a także optymalizacji .

Zakres

Teoria statystyczna dostarcza podstawowego uzasadnienia i zapewnia spójną podstawę wyboru metodologii stosowanej w statystyce stosowanej .

Modelowanie

Modele statystyczne opisują źródła danych i mogą mieć różne typy sformułowania odpowiadające tym źródłom i badanemu problemowi. Takie problemy mogą być różnego rodzaju:

Określone modele statystyczne można przetestować, aby sprawdzić, czy dostarczają przydatnych wniosków dla nowych zestawów danych.

Gromadzenie danych

Teoria statystyczna dostarcza wskazówek do porównywania metod zbierania danych , gdzie problemem jest generowanie danych informacyjnych z wykorzystaniem optymalizacji i randomizacji przy pomiarze i kontroli błędu obserwacji . Optymalizacja zbierania danych zmniejsza koszt danych przy jednoczesnym spełnieniu celów statystycznych, a randomizacja pozwala na wiarygodne wnioskowanie. Teoria statystyczna stanowi podstawę dobrego gromadzenia danych i ustrukturyzowania badań w zakresie:

Podsumowanie danych

Zadanie podsumowania danych statystycznych w konwencjonalnych formach (zwanych również statystyką opisową ) jest rozpatrywane w statystyce teoretycznej jako problem określenia, jakie aspekty próbek statystycznych należy opisać i jak dobrze można je opisać na podstawie typowo ograniczonej próbki danych. Zatem problemy, które rozważa statystyka teoretyczna, obejmują:

  • Wybór statystyk podsumowujących do opisu próbki
  • Podsumowanie rozkładów prawdopodobieństwa przykładowych danych przy ograniczonych założeniach co do formy rozkładu, który może zostać spełniony
  • Podsumowanie zależności między różnymi wielkościami mierzonymi na tych samych przedmiotach z próbką

Interpretowanie danych

Oprócz filozofii leżącej u podstaw wnioskowania statystycznego, teoria statystyczna ma za zadanie rozważenie rodzajów pytań, które analitycy danych mogą chcieć zadać na temat problemów, które badają, oraz dostarczenie technik analizy danych, aby na nie odpowiedzieć. Oto niektóre z tych zadań:

  • Podsumowanie populacji w postaci dopasowanego rozkładu lub funkcji gęstości prawdopodobieństwa
  • Podsumowanie zależności między zmiennymi za pomocą pewnego rodzaju analizy regresji
  • Zapewnienie sposobów przewidywania wyniku wielkości losowej przy innych powiązanych zmiennych
  • Zbadanie możliwości zmniejszenia liczby rozważanych zmiennych w ramach problemu (zadanie Redukcja wymiaru )

Gdy procedura statystyczna została określona w protokole badania, teoria statystyczna dostarcza dobrze zdefiniowane twierdzenia o prawdopodobieństwie zastosowania metody do wszystkich populacji, które mogły powstać w wyniku randomizacji użytej do wygenerowania danych. Zapewnia to obiektywny sposób szacowania parametrów, szacowania przedziałów ufności, testowania hipotez i wybierania najlepszej. Nawet w przypadku danych obserwacyjnych teoria statystyczna zapewnia sposób obliczenia wartości, która może być użyta do interpretacji próbki danych z populacji, może dostarczyć środków wskazujących, jak dobrze ta wartość jest określona przez próbkę, a tym samym stwierdzenie, że odpowiednie wartości uzyskane dla różnych populacji są tak różne, jak mogłoby się wydawać; jednak wiarygodność wniosków z danych obserwacyjnych post-hoc jest często gorsza niż w przypadku planowanego, randomizowanego generowania danych.

Zastosowane wnioskowanie statystyczne

Teoria statystyczna stanowi podstawę dla szeregu podejść do analizy danych, które są powszechne w badaniach naukowych i społecznych. Interpretacja danych odbywa się za pomocą jednego z następujących podejść:

Wiele standardowych metod stosowanych w tych podejściach opiera się na pewnych założeniach statystycznych ( przyjętych przy wyprowadzaniu metodologii), które są faktycznie stosowane w praktyce. Teoria statystyczna bada konsekwencje odstępstw od tych założeń. Ponadto zapewnia szereg solidnych technik statystycznych, które są mniej zależne od założeń, oraz zapewnia metody sprawdzające, czy określone założenia są uzasadnione dla danego zbioru danych.

Zobacz też

Bibliografia

Cytaty

Źródła

Dalsza lektura

Zewnętrzne linki