Geostatystyka - Geostatistics

Geostatystyka to gałąź statystyki skupiająca się na zbiorach danych przestrzennych lub czasoprzestrzennych . Pierwotnie opracowany do przewidzenia rozkładów prawdopodobieństwa o gatunkach rudy na wydobycie operacji, jest obecnie stosowana w różnych dziedzinach, w tym geologii naftowej , hydrogeologii , hydrologii , meteorologii , oceanografii , geochemii , geometallurgy , geografii , leśnictwa , kontroli środowiska , ekologii krajobrazu , gleboznawstwa i rolnictwo (zwłaszcza w rolnictwie precyzyjnym ). Geostatystyka znajduje zastosowanie w różnych gałęziach geografii , zwłaszcza w zakresie rozprzestrzeniania się chorób ( epidemiologia ), praktyki handlowej i planowania wojskowego ( logistyka ) oraz rozwoju wydajnych sieci przestrzennych . Algorytmy geostatystyczne są wbudowane w wielu miejscach, w tym w systemach informacji geograficznej (GIS) i środowisku statystycznym R .

Tło

Geostatystyka jest ściśle związana z metodami interpolacji, ale wykracza daleko poza proste problemy interpolacji. Techniki geostatystyczne opierają się na modelach statystycznych opartych na teorii funkcji losowych (lub zmiennych losowych ) do modelowania niepewności związanej z estymacją i symulacją przestrzenną.

Szereg prostszych metod/algorytmów interpolacji, takich jak odwrotne ważenie odległości , interpolacja dwuliniowa i interpolacja najbliższego sąsiedztwa , było dobrze znanych przed geostatystyką. Geostatystyka wykracza poza problem interpolacji, rozpatrując badane zjawisko w nieznanych lokalizacjach jako zbiór skorelowanych zmiennych losowych.

Niech Z ( x ) będzie wartością interesującej nas zmiennej w określonej lokalizacji x . Wartość ta jest nieznana (np. temperatura, opady, poziom piezometryczny , facja geologiczna itp.). Chociaż w lokalizacji x istnieje wartość, którą można zmierzyć, geostatystyka traktuje tę wartość jako losową, ponieważ nie została zmierzona lub nie została jeszcze zmierzona. Jednak losowość Z ( x ) nie jest kompletna, ale jest zdefiniowana przez funkcję rozkładu skumulowanego (CDF), która zależy od pewnych informacji, które są znane o wartości Z ( x ) :

Zazwyczaj, jeśli wartość Z jest znana w miejscach blisko X (lub w sąsiedztwie z X ) można ograniczać w CDF Z ( x ) za pomocą tej okolicy: jeśli zakłada się wysoki ciągłość przestrzennych, Z ( X ) może tylko mają wartości zbliżone do tych, które można znaleźć w sąsiedztwie. Odwrotnie, przy braku ciągłości przestrzennej Z ( x ) może przyjąć dowolną wartość. Ciągłość przestrzenna zmiennych losowych jest opisana przez model ciągłości przestrzennej, który może być funkcją parametryczną w przypadku geostatystyki opartej na wariogramie lub mieć postać nieparametryczną w przypadku innych metod, takich jak symulacja wielopunktowa lub pseudo -techniki genetyczne .

Stosując pojedynczy model przestrzenny w całej dziedzinie, zakłada się, że Z jest procesem stacjonarnym . Oznacza to, że w całej domenie obowiązują te same właściwości statystyczne. Kilka metod geostatystycznych dostarcza sposobów złagodzenia tego założenia o stacjonarności.

W tym kontekście można wyróżnić dwa cele modelowania:

  1. Szacowanie wartości Z ( x ) , zazwyczaj na podstawie oczekiwań , mediany lub modu CDF f ( z , x ) . Jest to zwykle oznaczane jako problem z oszacowaniem.
  2. Próbkowanie z całej funkcji gęstości prawdopodobieństwa f ( z , x ) przez faktyczne rozważenie każdego możliwego wyniku tego w każdej lokalizacji. Odbywa się to zazwyczaj poprzez tworzenie kilku alternatywnych map Z , zwanych realizacjami. Rozważmy domenę zdyskretyzowaną w N węzłach siatki (lub pikselach). Każda realizacja jest próbką pełnej N- wymiarowej funkcji rozkładu połączeń
W tym podejściu potwierdza się obecność wielu rozwiązań problemu interpolacji. Każda realizacja jest rozważana jako możliwy scenariusz tego, jaka może być rzeczywista zmienna. Wszystkie powiązane przepływy pracy uwzględniają następnie zespół realizacji, a co za tym idzie zespół prognoz, które pozwalają na prognozowanie probabilistyczne. Dlatego geostatystyka jest często wykorzystywana do generowania lub aktualizacji modeli przestrzennych podczas rozwiązywania problemów odwrotnych .

Istnieje wiele metod zarówno dla szacowania geostatystycznego, jak i podejścia do wielu realizacji. Kilka książek referencyjnych zawiera obszerny przegląd tej dyscypliny.

Metody

Oszacowanie

Kriging

Kriging to grupa technik geostatystycznych do interpolacji wartości pola losowego (np. wysokość, z, krajobrazu w funkcji położenia geograficznego) w miejscu nieobserwowanym na podstawie obserwacji jego wartości w pobliskich lokalizacjach.

estymacja bayesowska

Wnioskowanie bayesowskie to metoda wnioskowania statystycznego, w której twierdzenie Bayesa służy do aktualizacji modelu prawdopodobieństwa, gdy dostępnych jest więcej dowodów lub informacji. Wnioskowanie bayesowskie odgrywa coraz większą rolę w geostatystyce. Estymacja bayesowska implementuje kriging poprzez proces przestrzenny, najczęściej proces Gaussa , i aktualizuje proces przy użyciu twierdzenia Bayesa do obliczenia jego a posteriori. Wysokowymiarowa geostatystyka bayesowska

Symulacja

Definicje i narzędzia

Główne czasopisma naukowe związane z geostatystyką

Organizacje naukowe związane z geostatystyką

Zobacz też

Uwagi

Bibliografia

  1. Armstrong, M i Champigny, N, 1988, A Study on Kriging Small Blocks, CIM Bulletin, tom 82, nr 923
  2. Armstrong, M, 1992, Wolność słowa? De Geostatisticis, lipiec, nr 14
  3. Champigny, N, 1992, Geostatistics: Narzędzie, które działa , The Northern Miner , 18 maja
  4. Clark I, 1979, Practical Geostatistics , Applied Science Publishers, Londyn
  5. David, M, 1977, Geostatistical Reserve Estimation, Elsevier Scientific Publishing Company, Amsterdam
  6. Hald, A, 1952, Teoria statystyczna z zastosowaniami inżynieryjnymi, John Wiley & Sons, Nowy Jork
  7. Honarkhah, Mehrdad; Caers, Jef (2010). „Symulacja stochastyczna wzorców za pomocą modelowania wzorców na podstawie odległości”. Matematyczne nauki o Ziemi . 42 (5): 487-517. doi : 10.1007/s11004-010-9276-7 . (nagroda za najlepszy papier IAMG 09)
  8. ISO/DIS 11648-1 Statystyczne aspekty pobierania próbek z materiałów sypkich-Część 1: Zasady ogólne
  9. Lipschutz, S, 1968, Teoria i problemy prawdopodobieństwa, McCraw-Hill Book Company, Nowy Jork.
  10. Matheron, G. 1962. Traité de géostatistique appliquée. Tom 1, Editions Technip, Paryż, 334 s.
  11. Matheron, G. 1989. Szacowanie i wybór, Springer-Verlag, Berlin.
  12. McGrew, J. Chapman, & Monroe, Charles B., 2000. Wprowadzenie do rozwiązywania problemów statystycznych w geografii, wydanie drugie, McGraw-Hill, New York.
  13. Merks, JW, 1992, Geostatystyka lub nauka voodoo , The Northern Miner, 18 maja
  14. Merks, JW, Nadużycie statystyki , Biuletyn CIM, styczeń 1993, t. 86, nr 966
  15. Myers, Donald E.; „Co to jest geostatystyka?
  16. Philip, GM i Watson, DF, 1986, Matheronian Geostatistics; Quo Vadis?, Geologia matematyczna, tom 18, nr 1
  17. Pyrcz, MJ and Deutsch, CV, 2014, Geostatistical Reservoir Modeling, wyd. 2, Oxford University Press, Nowy Jork, s. 448
  18. Sharov, A: Ilościowa Ekologia Populacyjna, 1996, https://web.archive.org/web/20020605050231/http://www.ento.vt.edu/~sharov/PopEcol/popecol.html
  19. Shine, JA, Wakefield, GI: Porównanie nadzorowanej klasyfikacji obrazów przy użyciu zestawów treningowych wybranych przez analityków i geostatystycznie, 1999, https://web.archive.org/web/20020424165227/http://www.geovista.psu .edu/sites/geocomp99/Gc99/044/gc_044.htm
  20. Strahler, AH i Strahler A., ​​2006, Wprowadzenie do geografii fizycznej, wyd. 4, Wiley.
  21. Tahmasebi, P., Hezarkhani, A., Sahimi, M., 2012, Wielopunktowe modelowanie geostatystyczne oparte na funkcjach korelacji krzyżowej , Computational Geosciences, 16(3):779-79742.
  22. Volk, W, 1980, Statystyki stosowane dla inżynierów, Krieger Publishing Company, Huntington, Nowy Jork.

Zewnętrzne linki