Autoregresja wektorowa — Vector autoregression

Autoregresja wektorowa ( VAR ) to model statystyczny używany do uchwycenia relacji między wieloma wielkościami, które zmieniają się w czasie. VAR to rodzaj stochastycznego modelu procesu . Modele VAR uogólniają model autoregresji z jedną zmienną (jednowymiarową) , umożliwiając wielowymiarowe szeregi czasowe . Modele VAR są często wykorzystywane w ekonomii i naukach przyrodniczych .

Podobnie jak model autoregresyjny, każda zmienna ma równanie modelujące jej ewolucję w czasie. To równanie obejmuje opóźnione (przeszłe) wartości zmiennej , opóźnione wartości innych zmiennych w modelu oraz składnik błędu . Modele VAR nie wymagają tak dużej wiedzy o siłach wpływających na zmienną, jak modele strukturalne z równoczesnymi równaniami . Jedyną wymaganą wcześniejszą wiedzą jest lista zmiennych, co do których można przypuszczać, że wpływają na siebie nawzajem w czasie.

Specyfikacja

Definicja

Model VAR opisuje ewolucję zestawu k zmiennych, zwanych zmiennymi endogenicznymi , w czasie. Każdy okres czasu jest ponumerowany, t = 1, ..., T . Zmienne są zbierane w wektorze , y , T , który ma długość K. (Odpowiednio, wektor ten można opisać jako macierz ( k  × 1)- . ) Wektor jest modelowany jako funkcja liniowa jego poprzedniej wartości. Elementy wektora są określane jako y i , t , czyli obserwacja w czasie t z I zmiennej th. Na przykład, jeśli pierwsza zmienna w modelu mierzy cenę pszenicy w czasie, to rok 11998 wskazywałby cenę pszenicy w 1998 roku.

Modele VAR charakteryzują się kolejnością , która odnosi się do liczby wcześniejszych okresów, z których będzie korzystał model. Kontynuując powyższy przykład, VAR piątego rzędu modelowałby coroczną cenę pszenicy jako kombinację liniową cen pszenicy z ostatnich pięciu lat. Lag jest wartość zmiennej w poprzednim okresie. Ogólnie rzecz biorąc , VAR rzędu p odnosi się do modelu VAR, który obejmuje opóźnienia dla ostatnich p okresów czasu. P p rzędu VAR oznaczona "parametr ( p )", a czasami nazywany "VAR z p opóźnień". P th-order modelu VAR jest zapisywany jako

Zmienne postaci y t −i wskazują, że wartość tej zmiennej i okresy są wcześniejsze i nazywane są „i- tym opóźnieniem” y t . Zmienna c jest k -wektorem stałych służących jako punkt przecięcia modelu. I jest czas niezmienna ( k  ×  k ) -Matrix i e t jest k -wektor o błędach warunkach. Warunki błędu muszą spełniać trzy warunki:

  1. . Każdy termin błędu ma średnią równą zero.
  2. . Współczesna macierz kowariancji składników błędu jest macierzą k  ×  k dodatnio-półokreśloną, oznaczoną jako Ω.
  3. dla dowolnego niezerowego k . Nie ma korelacji w czasie. W szczególności nie ma korelacji szeregowej w kategoriach indywidualnych błędów.

Szczególnej uwagi wymaga proces wyboru maksymalnego opóźnienia p w modelu VAR, ponieważ wnioskowanie jest uzależnione od poprawności wybranego rzędu opóźnień.

Kolejność integracji zmiennych

Zauważ, że wszystkie zmienne muszą być tego samego rzędu całkowania . Odrębne są następujące przypadki:

  • Wszystkie zmienne są I(0) (stacjonarne): jest to w standardowym przypadku, tj. VAR na poziomie
  • Wszystkie zmienne to I( d ) (niestacjonarne) z d  > 0:
    • Zmienne są skointegrowane : składnik korekcji błędu musi być uwzględniony w VAR. Model staje się modelem korekcji błędów wektorowej (VECM), który może być postrzegany jako ograniczona wartość VAR.
    • Zmienne nie są skointegrowane : po pierwsze, zmienne muszą być różnicowane d razy, a jedna z nich ma różnicę VAR.

Zwięzła notacja macierzowa

Można układać wektory w stos, aby zapisać VAR( p ) jako stochastyczne równanie różnicowe macierzowe ze zwięzłym zapisem macierzowym:

Szczegóły dotyczące macierzy znajdują się na osobnej stronie .

Przykład

Aby zapoznać się z ogólnym przykładem VAR( p ) z k zmiennymi, zobacz Ogólny zapis macierzowy VAR(p) .

VAR(1) w dwóch zmiennych może być zapisany w postaci macierzowej (bardziej zwarta notacja) jako

(w którym pojawia się tylko jedna macierz A , ponieważ ten przykład ma maksymalne opóźnienie p równe 1) lub, równoważnie, jako następujący układ dwóch równań

Każda zmienna w modelu ma jedno równanie. Bieżąca (czas t ) obserwacja każdej zmiennej zależy od jej własnych opóźnionych wartości, jak również od opóźnionych wartości każdej innej zmiennej w VAR.

Zapisywanie VAR( p ) jako VAR(1)

VAR z opóźnieniami p można zawsze równoważnie przepisać jako VAR z tylko jednym opóźnieniem, odpowiednio przedefiniowując zmienną zależną. Transformacja sprowadza się do nałożenia opóźnień zmiennej VAR( p ) w nowej zmiennej zależnej VAR(1) i dołączenia tożsamości w celu uzupełnienia liczby równań.

Na przykład model VAR(2)

można przerobić na model VAR(1)

gdzie I jest macierzą tożsamości .

Równoważna forma VAR(1) jest wygodniejsza dla wyprowadzeń analitycznych i pozwala na bardziej zwięzłe instrukcje.

Forma strukturalna a forma zredukowana

WARIANCJA KONSTRUKCYJNA

VAR strukturalny z opóźnień s (czasami w skrócie SVAR ) jest

gdzie c 0 jest  wektorem k × 1 stałych, B i jest macierzą k  ×  k (dla każdego i = 0, ..., p ), a ε t jest  wektorem k × 1 składników błędów . Do głównych ukośne warunki B 0 matrycy (współczynniki na ı XX zmiennej w ı -tego równania) są skalowane 1.

Terminy błędu ε t ( szoki strukturalne ) spełniają warunki (1) - (3) w powyższej definicji, ze szczególnym uwzględnieniem wszystkich elementów poza przekątną macierzy kowariancji . Oznacza to, że szoki strukturalne nie są skorelowane.

Na przykład dwie zmienne strukturalne VAR(1) to:

gdzie

oznacza to, że wariancje szoków strukturalnych są oznaczone ( i = 1, 2), a kowariancja wynosi .

Pisząc wprost pierwsze równanie i przekazując y 2,t po prawej stronie otrzymujemy

Zauważ, że y 2, t może mieć równoczesny wpływ na y 1,t, jeśli B 0;1,2 nie jest zerem. Różni się to od przypadku, gdy B 0 jest macierzą jednostkową (wszystkie elementy niediagonalne mają wartość zero — przypadek w początkowej definicji), gdy y 2, t może bezpośrednio wpływać na y 1, t +1 i kolejne przyszłe wartości, ale nie y 1, t .

Z powodu problemu z identyfikacją parametrów , zwykłe oszacowanie strukturalnego VAR metodą najmniejszych kwadratów dałoby niespójne oszacowania parametrów. Ten problem można rozwiązać, przepisując VAR w zmniejszonej formie.

Z ekonomicznego punktu widzenia, jeśli połączoną dynamikę zbioru zmiennych można przedstawić za pomocą modelu VAR, to forma strukturalna jest obrazem podstawowych, „strukturalnych” relacji ekonomicznych. Dwie cechy formy strukturalnej czynią ją preferowanym kandydatem do reprezentowania leżących u jej podstaw relacji:

1. Terminy błędu nie są skorelowane . Zakłada się, że strukturalne, ekonomiczne szoki, które wpływają na dynamikę zmiennych ekonomicznych, są niezależne , co implikuje zerową korelację między błędami jako pożądaną właściwością. Jest to pomocne przy wyodrębnianiu skutków niepowiązanych ekonomicznie wpływów w VAR. Na przykład nie ma powodu, dla którego szok cen ropy (jako przykład szoku podażowego ) miałby wiązać się ze zmianą preferencji konsumentów w kierunku stylu ubioru (jako przykład szoku popytowego ); dlatego można by oczekiwać, że czynniki te będą statystycznie niezależne.
2. Zmienne mogą mieć równoczesny wpływ na inne zmienne . Jest to pożądana cecha, zwłaszcza przy korzystaniu z danych o niskiej częstotliwości. Na przykład podwyżka stawki podatku pośredniego nie wpłynęłaby na dochody podatkowe w dniu ogłoszenia decyzji, ale można by znaleźć efekt w danych z tego kwartału.

VAR w formie zredukowanej

Przez wstępne pomnożenie strukturalnej VAR przez odwrotność B 0

i oznaczające

otrzymujemy zredukowany rząd p- tego VAR

Zauważ, że w zredukowanej formie wszystkie zmienne po prawej stronie są z góry określone w czasie t . Ponieważ po prawej stronie nie ma zmiennych endogenicznych czasu t , żadna zmienna nie ma bezpośredniego, równoczesnego wpływu na inne zmienne w modelu.

Jednak warunki błędu w zredukowanym VAR są złożeniem szoków strukturalnych e t = B 0 -1 ε t . Zatem wystąpienie jednego szoku strukturalnego ε i,t może potencjalnie prowadzić do wystąpienia szoków we wszystkich błędach e j,t , tworząc w ten sposób równoczesny ruch we wszystkich zmiennych endogenicznych. W konsekwencji macierz kowariancji zredukowanego VAR

może mieć niezerowe elementy poza przekątną, umożliwiając w ten sposób niezerową korelację między warunkami błędu.

Oszacowanie

Estymacja parametrów regresji

Zaczynając od zwięzłej notacji macierzowej (szczegóły w tym załączniku ):

Można to zapisać alternatywnie jako:

gdzie oznacza iloczyn Kroneckera, a Vec wektoryzację wskazanej macierzy.

Ten estymator jest spójny i asymptotycznie skuteczny . Jest on ponadto równy warunkowemu estymatorowi maksymalnej wiarogodności .

  • Ponieważ zmienne objaśniające są takie same w każdym równaniu, wielowymiarowy estymator najmniejszych kwadratów jest równoważny zwykłemu estymatorowi najmniejszych kwadratów zastosowanemu do każdego równania osobno.

Estymacja macierzy kowariancji błędów

Podobnie jak w przypadku standardowym, estymator największej wiarygodności (MLE) macierzy kowariancji różni się od zwykłego estymatora najmniejszych kwadratów (OLS).

estymator MLE:

Estymator MNK: dla modelu ze stałą, k zmiennych i p opóźnień.

W notacji macierzowej daje to:

Estymacja macierzy kowariancji estymatora

Macierz kowariancji parametrów można oszacować jako

Stopnie swobody

Modele autoregresji wektorowej często obejmują estymację wielu parametrów. Na przykład przy siedmiu zmiennych i czterech opóźnieniach każda macierz współczynników dla danej długości opóźnienia wynosi 7 na 7, a wektor stałych ma 7 elementów, więc w sumie oszacowano 49×4 + 7 = 203 parametry, znacznie obniżając te stopnie swobody regresji (liczba punktów danych minus liczba parametrów, które są w przybliżeniu). Może to zaszkodzić dokładności oszacowań parametrów, a tym samym prognozom podawanym przez model.

Interpretacja oszacowanego modelu

Właściwości modelu VAR są zwykle podsumowywane za pomocą analizy strukturalnej z wykorzystaniem przyczynowości Grangera , odpowiedzi impulsowych i rozkładu wariancji błędu prognozy .

Odpowiedź impulsowa

Rozważmy przypadek pierwszego rzędu (tj. z tylko jednym opóźnieniem), z równaniem ewolucji

dla ewoluującego wektora (stanu) i wektora wstrząsów. Aby znaleźć, powiedzmy, wpływ j-tego elementu wektora wstrząsów na i- ty element wektora stanu 2 okresy później, który jest konkretną odpowiedzią impulsową, najpierw napisz powyższe równanie ewolucji opóźnione o jeden okres:

Użyj tego w oryginalnym równaniu ewolucji, aby uzyskać

następnie powtórz, używając dwukrotnie opóźnionego równania ewolucji, aby uzyskać

Z tego wynika , że wpływ j-tego składnika na i- ty składnik jest i, j elementem macierzy

Z tego procesu indukcji widać , że każdy szok będzie miał wpływ na elementy y nieskończenie odległe w czasie, chociaż efekt ten będzie z czasem coraz mniejszy, zakładając, że proces AR jest stabilny — to znaczy, że wszystkie wartości własne macierzy A są mniejsze niż 1 w wartości bezwzględnej .

Prognozowanie z wykorzystaniem szacunkowego modelu VAR

Oszacowany model VAR może być wykorzystany do prognozowania , a jakość prognoz może być oceniana w sposób całkowicie analogiczny do metod stosowanych w jednowymiarowym modelowaniu autoregresyjnym.

Aplikacje

Christopher Sims opowiadał się za modelami VAR, krytykując twierdzenia i wyniki wcześniejszego modelowania w ekonometrii makroekonomicznej . Polecił modele VAR, które wcześniej pojawiały się w statystyce szeregów czasowych i identyfikacji systemów , specjalności statystycznej w teorii sterowania . Sims opowiadał się za modelami VAR jako zapewniającymi wolną od teorii metodę szacowania relacji ekonomicznych, będącą w ten sposób alternatywą dla „niesamowitych ograniczeń identyfikacji” w modelach strukturalnych. Modele VAR są również coraz częściej wykorzystywane w badaniach nad zdrowiem do automatycznej analizy danych z dzienniczka lub danych z czujników.

Oprogramowanie

Zobacz też

Uwagi

Dalsza lektura