Ponowne próbkowanie scyzoryka — Jackknife resampling

W statystykach The jackknife jest resampling technika szczególnie przydatna dla wariancji i stronniczości oszacowania. Nóż składany wyprzedza inne popularne metody ponownego próbkowania, takie jak bootstrap . Estymator parametru scyzoryka znajduje się poprzez systematyczne pomijanie każdej obserwacji ze zbioru danych i obliczenie oszacowania, a następnie znalezienie średniej z tych obliczeń. Biorąc pod uwagę wielkość próbki , oszacowanie scyzoryka znajduje się poprzez agregację oszacowań każdej podpróbki o rozmiarze .

Technika scyzoryka została opracowana przez Maurice'a Quenouille'a (1924-1973) w 1949 i udoskonalona w 1956. John Tukey rozwinął tę technikę w 1958 i zaproponował nazwę „scyzoryk”, ponieważ, podobnie jak fizyczny scyzoryk (kompaktowy składany nóż), jest to proste i gotowe narzędzie, które może improwizować rozwiązanie różnych problemów, nawet jeśli konkretne problemy można skuteczniej rozwiązać za pomocą specjalnie zaprojektowanego narzędzia.

Scyzoryk jest liniowym przybliżeniem bootstrapu .

Oszacowanie

Oszacowanie parametru przez scyzoryk można znaleźć przez oszacowanie parametru dla każdej podpróbki, pomijając i-tą obserwację. Na przykład, jeśli parametrem do oszacowania jest średnia populacji x , obliczamy średnią dla każdej podpróbki składającej się ze wszystkich punktów danych oprócz i :

Te n oszacowań tworzy oszacowanie rozkładu statystyki próby, jeśli została obliczona dla dużej liczby próbek. W szczególności średnia tego rozkładu próbkowania jest średnią z tych n oszacowań:

Można jednoznacznie wykazać, że równa się to zwykłemu oszacowaniu , więc punkt rzeczywisty pojawia się dla momentów wyższych niż średnia. Szacunkowe oszacowanie wariancji estymatora można obliczyć na podstawie wariancji tego rozkładu :

Estymacja i korekta błędu systematycznego

Technikę scyzoryka można wykorzystać do oszacowania obciążenia estymatora obliczonego dla całej próbki. Say jest obliczonym estymatorem interesującego nas parametru na podstawie wszystkich obserwacji. Pozwolić

gdzie jest oszacowanie odsetek na podstawie próbki z í -tej obserwacji usuwane, a to średnia z tych „leave-one-out” szacunków. Oszacowanie odchylenia scyzoryka jest podane przez:

a wynikowe oszacowanie scyzoryka z korekcją odchylenia jest podane przez:

Usuwa to stronniczość w szczególnym przypadku, w którym jest to stronniczość i usuwa ją w innych przypadkach.

Zobacz też

Literatura

Uwagi

Bibliografia