Analiza ścieżki (statystyki) - Path analysis (statistics)

W statystykach , analiza ścieżki służy do opisania skierowane zależności między zestawem zmiennych. Obejmuje to modele odpowiadające każdej formie wielokrotnej analizy regresji , analizy czynnika , kanonicznej analizie korelacji , analizy dyskryminacyjnej , jak również bardziej ogólnych rodziny modeli w wielowymiarowej analizy wariancji i analizy kowariancji ( MANOVA , ANOVA , ANCOVA ).

Oprócz tego, że jest traktowana jako forma regresji wielorakiej skupiającej się na przyczynowości, analiza ścieżki może być postrzegana jako szczególny przypadek modelowania równań strukturalnych (SEM) - taki, w którym dla każdej ze zmiennych w modelu przyczynowym stosuje się tylko pojedyncze wskaźniki . Oznacza to, że analiza ścieżki to SEM z modelem strukturalnym, ale bez modelu pomiarowego. Inne terminy używane w odniesieniu do analizy ścieżki obejmują modelowanie przyczynowe, analizę struktur kowariancji i modele zmiennych utajonych .

Analiza ścieżki jest uważana przez Judeę Pearl za bezpośredniego przodka technik wnioskowania przyczynowego .

Historia

Analiza ścieżki została opracowana około 1918 roku przez genetyka Sewalla Wrighta , który szerzej o niej pisał w latach dwudziestych XX wieku. Od tego czasu został zastosowany w wielu złożonych obszarach modelowania, w tym w biologii , psychologii , socjologii i ekonometrii .

Modelowanie ścieżek

Zazwyczaj modele ścieżek składają się z niezależnych i zależnych zmiennych przedstawionych graficznie za pomocą ramek lub prostokątów. Zmienne, które są zmiennymi niezależnymi, a nie zmiennymi zależnymi, nazywane są „egzogenicznymi”. Graficznie, te egzogeniczne pola zmiennych leżą na zewnętrznych krawędziach modelu i wychodzą z nich tylko jednogłowe strzałki. Żadne jednogłowe strzałki nie wskazują na zmienne egzogeniczne. Zmienne, które są wyłącznie zmiennymi zależnymi lub są zmiennymi niezależnymi i zależnymi, nazywane są „endogennymi”. Graficznie, zmienne endogeniczne mają co najmniej jedną skierowaną na nie pojedynczą strzałkę.

W poniższym modelu dwie zmienne egzogeniczne (Przykł 1 i Przykł 2 ) są modelowane jako skorelowane, jak pokazano za pomocą strzałki z dwoma grotami. Obie te zmienne mają bezpośredni i pośredni (poprzez En 1 ) wpływ na En 2 (dwie zależne lub „endogenne” zmienne / czynniki). W większości rzeczywistych modeli na zmienne endogeniczne mogą również wpływać zmienne i czynniki pochodzące z zewnątrz modelu (efekty zewnętrzne, w tym błąd pomiaru). Efekty te są przedstawiane w modelu za pomocą „e” lub składników błędu.

Przykład ścieżki.JPG

Przy użyciu tych samych zmiennych można sobie wyobrazić alternatywne modele. Na przykład, można postawić hipotezę, że przykład 1 ma tylko pośredni wpływ na En 2 , usuwając strzałkę z Ex 1 do En 2 ; a prawdopodobieństwo lub „dopasowanie” tych dwóch modeli można porównać statystycznie.

Zasady śledzenia ścieżki

Aby poprawnie obliczyć związek między dowolnymi dwoma ramkami na diagramie, Wright (1934) zaproponował prosty zestaw reguł śledzenia ścieżki do obliczenia korelacji między dwiema zmiennymi. Korelacja jest równa sumie wkładu wszystkich ścieżek, którymi połączone są dwie zmienne. Siła każdej z tych ścieżek składowych jest obliczana jako iloczyn współczynników ścieżki wzdłuż tej ścieżki.

Zasady śledzenia ścieżki są następujące:

  1. Możesz prześledzić wstecz w górę strzałki, a następnie do przodu wzdłuż następnej lub do przodu od jednej zmiennej do drugiej, ale nigdy do przodu i do tyłu. Innym sposobem myślenia o tej zasadzie jest to, że nigdy nie możesz przejść z jednego grotu strzały do ​​innego grotu strzały: orzeł-ogon lub ogon-grot, a nie orzeł-grot.
  2. Możesz przejść przez każdą zmienną tylko raz w danym łańcuchu ścieżek.
  3. W każdym łańcuchu ścieżek można umieścić nie więcej niż jedną strzałkę dwukierunkową.

Ponownie, oczekiwana korelacja wynikająca z każdego łańcucha prześledzonego między dwiema zmiennymi jest iloczynem standaryzowanych współczynników ścieżki, a całkowita oczekiwana korelacja między dwiema zmiennymi jest sumą tych składowych łańcuchów ścieżek.

Uwaga : zasady Wrighta zakładać model bez pętli sprzężenia zwrotnego: the graf skierowany modelu musi zawierać żadnych cykli , to znaczy jest skierowany graf acykliczny , który został gruntownie badane w ramach analizy związku przyczynowego z Judei Perły .

Śledzenie ścieżki w niestandardowych modelach

Jeśli modelowane zmienne nie zostały ustandaryzowane, dodatkowa reguła umożliwia obliczenie oczekiwanych kowariancji, o ile nie istnieją ścieżki łączące zmienne zależne z innymi zmiennymi zależnymi.

Najprostszy przypadek to taki, w którym wszystkie wariancje resztowe są modelowane jawnie. W takim przypadku, oprócz trzech powyższych reguł, oblicz oczekiwane kowariancje przez:

  1. Obliczyć iloczyn współczynników na każdej trasie między interesującymi nas zmiennymi, śledząc wstecz, zmieniając kierunek za pomocą strzałki z dwoma grotami, a następnie śledząc do przodu.
  2. Suma wszystkich odrębnych tras, gdzie ścieżki są uważane za odrębne, jeśli zawierają różne współczynniki lub napotykają te współczynniki w innej kolejności.

Tam, gdzie wariancje rezydualne nie są wyraźnie uwzględnione lub jako bardziej ogólne rozwiązanie, przy każdej zmianie kierunku napotkanej na trasie (z wyjątkiem strzałek dwukierunkowych), należy uwzględnić wariancję zmiennej w punkcie zmiany. Oznacza to, że śledząc ścieżkę od zmiennej zależnej do zmiennej niezależnej, należy uwzględnić wariancję zmiennej niezależnej, z wyjątkiem przypadków, w których naruszałoby to regułę 1 powyżej (przechodzenie przez sąsiednie groty strzałek, tj. Gdy zmienna niezależna łączy się również z podwójnym strzałka z grotem łącząca ją z inną zmienną niezależną). Przy wyprowadzaniu wariancji (co jest konieczne w przypadku, gdy nie są one modelowane jawnie), ścieżka od zmiennej zależnej do zmiennej niezależnej iz powrotem jest liczona tylko raz.

Zobacz też

Bibliografia

Linki zewnętrzne