Mediana — Median

Znalezienie mediany w zbiorach danych o nieparzystej i parzystej liczbie wartości

W statystykach i teorii prawdopodobieństwa The środkowa jest wartość rozdzielania wyższej połowie z dolnej połówki próbką danych , w populacji , lub rozkładu prawdopodobieństwa . W przypadku zbioru danych można ją traktować jako wartość „środkową”. Podstawową cechą mediany w opisywaniu danych w porównaniu ze średnią (często po prostu opisywaną jako „średnia”) jest to, że nie jest ona przekrzywiona przez niewielką część bardzo dużych lub małych wartości, a zatem zapewnia lepszą reprezentację „typowego " wartość. Na przykład mediana dochodu może być lepszym sposobem na zasugerowanie, czym jest „typowy” dochód, ponieważ rozkład dochodów może być bardzo zniekształcony. Mediana ma kluczowe znaczenie w solidnych statystykach , ponieważ jest to najbardziej odporna statystyka , mająca punkt załamania wynoszący 50%: dopóki nie więcej niż połowa danych jest zanieczyszczona, mediana nie jest arbitralnie dużym lub małym wynikiem.

Skończony zbiór danych liczb

Mediana skończonej listy liczb to liczba „środkowa”, gdy liczby te są wymienione w kolejności od najmniejszej do największej.

Jeśli zbiór danych ma nieparzystą liczbę obserwacji, wybierana jest środkowa. Na przykład poniższa lista siedmiu liczb,

1, 3, 3, 6 , 7, 8, 9

ma medianę 6 , która jest czwartą wartością.

Ogólnie rzecz biorąc, za zestaw z elementów, to można zapisać jako:

Zbiór parzystej liczby obserwacji nie ma wyraźnej wartości środkowej, a mediana jest zwykle definiowana jako średnia arytmetyczna z dwóch wartości średnich. Na przykład zestaw danych

1, 2, 3, 4, 5 , 6, 8, 9

ma medianę 4,5 , czyli . (Mówiąc bardziej technicznie, to interpretuje medianę jako w pełni przycięty średni zakres ). Przy tej konwencji medianę można zdefiniować w następujący sposób (dla parzystej liczby obserwacji):

Porównanie wspólnych średnich wartości [1, 2, 2, 3, 4, 7, 9 ]
Rodzaj Opis Przykład Wynik
Średnia arytmetyczna Suma wartości zbioru danych podzielona przez liczbę wartości: (1 + 2 + 2 + 3 + 4 + 7 + 9) / 7 4
Mediana Wartość środkowa oddzielająca większą i mniejszą połówkę zbioru danych 1, 2, 2, 3 , 4, 7, 9 3
Tryb Najczęstsza wartość w zestawie danych 1, 2 , 2 , 3, 4, 7, 9 2

Formalna definicja

Formalnie mediana populacji jest dowolną wartością taką, że co najwyżej połowa populacji jest mniejsza niż proponowana mediana i co najwyżej połowa jest większa niż proponowana mediana. Jak widać powyżej, mediany mogą nie być unikalne. Jeśli każdy zestaw zawiera mniej niż połowę populacji, część populacji jest dokładnie równa unikalnej medianie.

Mediana jest dobrze zdefiniowana dla dowolnych uporządkowanych (jednowymiarowych) danych i jest niezależna od jakiejkolwiek metryki odległości . Medianę można zatem zastosować do klas, które są klasyfikowane, ale nie numeryczne (np. obliczanie mediany ocen, gdy uczniowie są oceniani od A do F), chociaż wynik może znajdować się w połowie między klasami, jeśli liczba przypadków jest parzysta.

Natomiast mediana geometryczna jest określona w dowolnej liczbie wymiarów. Pokrewnym pojęciem, w którym wynik musi odpowiadać członkowi próby, jest medoid .

Nie ma powszechnie akceptowanej standardowej notacji mediany, ale niektórzy autorzy przedstawiają medianę zmiennej x jako lub jako μ 1/2, czasami także M . W każdym z tych przypadków użycie tych lub innych symboli dla mediany musi być wyraźnie zdefiniowane podczas ich wprowadzania.

Mediana jest szczególnym przypadkiem innych sposobów podsumowania typowych wartości związanych z rozkładem statystycznym : jest to 2. kwartyl , 5. decyl i 50. percentyl .

Zastosowania

Mediana może być użyta jako miara lokalizacji, gdy przywiązuje się mniejszą wagę do wartości ekstremalnych, zwykle dlatego, że rozkład jest przekrzywiony , wartości ekstremalne nie są znane lub wartości odstające są niewiarygodne, tj. mogą być błędami pomiaru/transkrypcji.

Rozważmy na przykład multiset

1, 2, 2, 2, 3, 14.

Mediana wynosi w tym przypadku 2 (podobnie jak tryb ) i może być postrzegana jako lepsze wskazanie środka niż średnia arytmetyczna 4, która jest większa niż wszystkie wartości z wyjątkiem jednej. Jednak szeroko cytowana zależność empiryczna, zgodnie z którą średnia jest przesunięta „dalej w ogon” rozkładu niż mediana, nie jest generalnie prawdziwa. Co najwyżej można powiedzieć, że te dwie statystyki nie mogą być „za bardzo odległe”; patrz § Nierówność odnosząca się do środków i median poniżej.

Ponieważ mediana opiera się na danych środkowych w zbiorze, do jej obliczenia nie jest konieczna znajomość wartości wyników ekstremalnych. Na przykład w teście psychologicznym badającym czas potrzebny do rozwiązania problemu, jeśli niewielka liczba osób w ogóle nie rozwiązała problemu w danym czasie, nadal można obliczyć medianę.

Ponieważ mediana jest prosty do zrozumienia i łatwe do obliczenia, a także solidna przybliżeniem średnia , mediana jest popularnym statystyka podsumowanie w statystyki opisowej . W tym kontekście istnieje kilka możliwości wyboru miary zmienności : zakres , zakres międzykwartylowy , średnie odchylenie bezwzględne i mediana bezwzględnego odchylenia .

Ze względów praktycznych często porównuje się różne miary lokalizacji i rozproszenia na podstawie tego, jak dobrze można oszacować odpowiednie wartości populacji na podstawie próbki danych. Mediana, oszacowana na podstawie mediany próby, ma pod tym względem dobre właściwości. Chociaż zwykle nie jest to optymalne przy założeniu danego rozmieszczenia populacji, to jego właściwości są zawsze dość dobre. Na przykład porównanie wydajności kandydatów do estymacji pokazuje, że średnia z próby jest bardziej wydajna statystycznie, gdy — i tylko wtedy — dane nie są zanieczyszczone danymi z rozkładów gruboogonowych lub z mieszanin rozkładów. Nawet wtedy mediana ma wydajność 64% w porównaniu ze średnią minimalną wariancji (dla dużych próbek normalnych), co oznacza, że ​​wariancja mediany będzie ~50% większa niż wariancja średniej.

Rozkłady prawdopodobieństwa

Wizualizacja geometryczna postaci, mediany i średniej dowolnej funkcji gęstości prawdopodobieństwa

Dla dowolnego rozkładu prawdopodobieństwa o wartościach rzeczywistych ze skumulowaną dystrybuantą F , medianę definiuje się jako dowolną liczbę rzeczywistą  m, która spełnia nierówności  

.

Równoważne sformułowanie wykorzystuje zmienną losową X o rozkładzie według F :

Zauważ, że ta definicja nie wymaga, aby X miał absolutnie ciągły rozkład (który ma funkcję gęstości prawdopodobieństwa ƒ ), ani nie wymaga dyskretnego . W pierwszym przypadku nierówności można uaktualnić do równości: spełnia mediana

.

Każdy rozkład prawdopodobieństwa na R ma co najmniej jedną medianę, ale w przypadkach patologicznych może być więcej niż jedna mediana: jeśli F jest stałe 1/2 na przedziale (tak, że ƒ = 0 tam), to każda wartość tego przedziału jest mediana.

Mediany poszczególnych rozkładów

Mediany niektórych typów rozkładów można łatwo obliczyć na podstawie ich parametrów; co więcej, istnieją one nawet dla niektórych rozkładów, którym brakuje dobrze zdefiniowanej średniej, takich jak rozkład Cauchy'ego :

Populacje

Właściwość optymalności

Średni bezwzględny błąd zmiennej rzeczywistej C w stosunku do zmiennej losowej  X jest

Zakładając, że rozkład prawdopodobieństwa X jest taki, że istnieje powyższe oczekiwanie, wtedy m jest medianą X wtedy i tylko wtedy, gdy m jest minimalizatorem średniego błędu bezwzględnego względem X . W szczególności m jest medianą próbki wtedy i tylko wtedy, gdy m minimalizuje średnią arytmetyczną odchyleń bezwzględnych.

Bardziej ogólnie, medianę definiuje się jako minimum

jak omówiono poniżej w części dotyczącej median wielowymiarowych (w szczególności mediany przestrzennej ).

Ta oparta na optymalizacji definicja mediany jest przydatna w statystycznej analizie danych, na przykład w grupowaniu k- median .

Nierówność dotycząca środków i median

Porównanie średniej , mediany i mody dwóch rozkładów logarytmiczno-normalnych o różnej skośności

Jeżeli rozkład ma skończoną wariancję, to odległość między medianą a średnią jest ograniczona przez jedno odchylenie standardowe .

To powiązanie zostało udowodnione przez Mallowsa, który dwukrotnie wykorzystał nierówność Jensena w następujący sposób. Używając |·| dla wartości bezwzględnej mamy

Pierwsza i trzecia nierówność pochodzą z nierówności Jensena zastosowanej do funkcji wartości bezwzględnej i funkcji kwadratowej, z których każda jest wypukła. Druga nierówność wynika z faktu, że mediana minimalizuje odchylenia bezwzględnego funkcji .

Dowód Mallowsa można uogólnić, aby uzyskać wielowymiarową wersję nierówności, po prostu zastępując wartość bezwzględną normą :

gdzie m jest medianą przestrzenną , to znaczy minimalizatorem funkcji Mediana przestrzenna jest unikalna, gdy wymiar zbioru danych wynosi dwa lub więcej.

Alternatywny dowód wykorzystuje jednostronną nierówność Czebyszewa; pojawia się w nierówności w zakresie parametrów lokalizacji i skali . Ta formuła również wynika bezpośrednio z nierówności Cantellego .

Dystrybucje jednomodalne

W przypadku rozkładów unimodalnych można uzyskać ostrzejsze ograniczenie odległości między medianą a średnią:

.

Podobna zależność zachodzi między medianą a modą:

Nierówność Jensena dla median

Nierówność Jensena stwierdza, że ​​dla dowolnej zmiennej losowej X o skończonym oczekiwaniu E [ X ] i dla dowolnej funkcji wypukłej f

Ta nierówność uogólnia się również na medianę. Mówimy, że funkcja f:ℝ→ℝ jest funkcją C, jeśli dla dowolnego t ,

jest przedziałem domkniętym (pozwalającym na zdegenerowanie przypadków pojedynczego punktu lub pustego zbioru ). Każda funkcja C jest wypukła, ale odwrotność nie obowiązuje. Jeśli f jest funkcją C, to

Jeśli mediany nie są niepowtarzalne, stwierdzenie obowiązuje dla odpowiadającej jej supremy.

Mediany dla próbek

Mediana próbki

Efektywne obliczenie mediany próbki

Chociaż sortowanie porównawcze n elementów wymaga operacji Ω ( n log n ) , algorytmy selekcji mogą obliczyć k -ty najmniejszy z n elementów za pomocą tylko Θ ( n ) operacji. Obejmuje to medianę, która jest n/2Statystyka rzędu (lub dla parzystej liczby próbek, średnia arytmetyczna z dwóch statystyk średniego rzędu).

Algorytmy selekcji nadal mają tę wadę, że wymagają pamięci Ω( n ) , to znaczy, że muszą mieć w pamięci pełną próbkę (lub jej część o rozmiarze liniowym). Ponieważ to, jak również wymóg czasu liniowego, mogą być zaporowe, opracowano kilka procedur szacowania mediany. Prosta to mediana reguły trzech, która szacuje medianę jako medianę trzyelementowej podpróby; jest to powszechnie używane jako podprogram w algorytmie szybkiego sortowania, który wykorzystuje oszacowanie mediany wejścia. Bardziej niezawodne estymator jest Tukeya jest ninther , która jest średnią z trzech reguły stosowane przy ograniczonej rekursji: jeśli jest próbka określonymi jako matrycy i

med3( A ) = mediana( A [1], A [n/2], A [ n ]) ,

następnie

dziewiąty( A ) = med3(med3( A [1 ...1/3n ]), med3( A [1/3n ...2/3n ]), med3( A [2/3n ... n ]))

Remedian to estymator w środkowej, która wymaga czasu liniowe, lecz pamięć podzespół liniowy, działających w jednym przejściu na próbki.

Dystrybucja próbek

Rozkłady zarówno średniej próbki, jak i mediany próbki zostały określone przez Laplace'a . Rozkład mediany próby z populacji z funkcją gęstości jest asymptotycznie normalny ze średnią i wariancją

gdzie jest medianą i jest wielkością próby. Poniżej znajduje się nowoczesny dowód. Wynik Laplace'a jest obecnie rozumiany jako szczególny przypadek asymptotycznego rozkładu dowolnych kwantyli .

W przypadku normalnych próbek gęstość wynosi , a zatem w przypadku dużych próbek wariancja mediany jest równa (Patrz także rozdział # Efektywność poniżej).

Wyprowadzenie rozkładu asymptotycznego

Przyjmujemy wielkość próbki jako liczbę nieparzystą i zakładamy, że nasza zmienna jest ciągła; wzór na przypadek zmiennych dyskretnych podano poniżej w § Empiryczna gęstość lokalna . Próbkę można podsumować jako „poniżej średni”, „w środkowej” i „powyżej mediany”, który odpowiada trójmianowym rozkładu z prawdopodobieństwa , i . Dla zmiennej ciągłej prawdopodobieństwo, że wartości wielu próbek będą dokładnie równe medianie wynosi 0, więc można obliczyć gęstość w punkcie bezpośrednio z rozkładu trójmianowego:

.

Teraz przedstawiamy funkcję beta. W przypadku argumentów całkowitych i , można to wyrazić jako . Przypomnij też, że . Użycie tych relacji i ustawienie obu i równe na pozwala na zapisanie ostatniego wyrażenia jako

Stąd funkcja gęstości mediany jest symetrycznym rozkładem beta przesuniętym do przodu przez . Jego średnia, jak byśmy się spodziewali, wynosi 0.5, a jej wariancja to . Zgodnie z regułą łańcucha , odpowiadająca wariancja mediany próbki wynosi

.

Dodatkowe 2 są pomijalne w limicie .

Empiryczna gęstość lokalna

W praktyce funkcje i często nie są znane lub zakładane. Można je jednak oszacować na podstawie obserwowanego rozkładu częstotliwości. W tej sekcji podajemy przykład. Rozważ poniższą tabelę, przedstawiającą próbkę 3800 (o wartościach dyskretnych) obserwacji:

v 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
f(v) 0,000 0,008 0,010 0,013 0,083 0,108 0,328 0,220 0,202 0,023 0,005
F(v) 0,000 0,008 0,018 0,031 0,114 0,222 0,550 0,770 0,972 0,995 1.000

Ponieważ obserwacje są wartościami dyskretnymi, skonstruowanie dokładnego rozkładu mediany nie jest bezpośrednim tłumaczeniem powyższego wyrażenia dla ; można (i zazwyczaj ma) wiele wystąpień mediany w swojej próbce. Musimy więc podsumować wszystkie te możliwości:

Tutaj i jest liczbą punktów ściśle mniejszą niż mediana, a k liczbą ściśle większą.

Korzystając z tych wstępnych badań, można zbadać wpływ wielkości próby na błędy standardowe średniej i mediany. Obserwowana średnia wynosi 3,16, obserwowana surowa mediana wynosi 3, a obserwowana interpolowana mediana wynosi 3,174. Poniższa tabela zawiera kilka statystyk porównawczych.

Wielkość próbki
Statystyczny
3 9 15 21
Oczekiwana wartość mediany 3.198 3.191 3.174 3,161
Błąd standardowy mediany (powyżej wzoru) 0,482 0,305 0,257 0,239
Błąd standardowy mediany (przybliżenie asymptotyczne) 0,879 0,508 0,393 0,332
Błąd standardowy średniej 0,421 0,243 0,188 0,159

Oczekiwana wartość mediany nieznacznie spada wraz ze wzrostem wielkości próby, podczas gdy, jak można się spodziewać, błędy standardowe zarówno mediany, jak i średniej są proporcjonalne do odwrotnego pierwiastka kwadratowego wielkości próby. Aproksymacja asymptotyczna jest błędem po stronie ostrożności poprzez przeszacowanie błędu standardowego.

Estymacja wariancji z danych próbki

Wartość — asymptotyczna wartość gdzie jest medianą populacji — była badana przez kilku autorów. Standardowa metoda „usuń jeden” scyzoryk daje niespójne wyniki. Wykazano, że alternatywa — metoda „usuń k”, w której rośnie wraz z wielkością próbki — jest asymptotycznie spójna. Ta metoda może być kosztowna obliczeniowo w przypadku dużych zbiorów danych. Szacunki ładujący jest znany jako spójne, ale zbiega się bardzo powoli ( zamówienie z ). Zaproponowano inne metody, ale ich zachowanie może się różnić w przypadku dużych i małych próbek.

Efektywność

Wydajność dla próbki środkowej, mierzona jako stosunek wariancja średnią wariancji mediany, w zależności od wielkości próbki i na podłożu rozkładu populacji. Dla próbki o rozmiarze z rozkładu normalnego wydajność dla dużego N wynosi

Wydajność zwykle jako dąży do nieskończoności.

Innymi słowy, względna wariancja mediany będzie , czyli o 57% większa niż wariancja średniej – względny błąd standardowy mediany będzie , czyli 25% większy niż błąd standardowy średniej , (patrz także rozdział #Dystrybucja próbkowania powyżej.).

Inne estymatory

W przypadku rozkładów jednowymiarowych, które są symetryczne wokół jednej mediany, estymator Hodgesa-Lehmanna jest solidnym i wysoce wydajnym estymatorem mediany populacji.

Jeśli dane są reprezentowane przez model statystyczny określający konkretną rodzinę rozkładów prawdopodobieństwa , wówczas oszacowania mediany można uzyskać, dopasowując tę ​​rodzinę rozkładów prawdopodobieństwa do danych i obliczając teoretyczną medianę dopasowanego rozkładu. Interpolacja Pareto jest zastosowaniem tego, gdy zakłada się, że populacja ma rozkład Pareto .

Mediana wielu zmiennych

Wcześniej w tym artykule omówiono medianę jednowymiarową, gdy próba lub populacja miała jeden wymiar. Gdy wymiar jest dwa lub wyższy, istnieje wiele pojęć, które rozszerzają definicję jednowymiarowej mediany; każda taka wielowymiarowa mediana zgadza się z jednowymiarową medianą, gdy wymiar jest dokładnie jeden.

Marginalna mediana

Mediana brzegowa jest określana dla wektorów określonych w odniesieniu do ustalonego zestawu współrzędnych. Mediana marginalna jest definiowana jako wektor, którego składowe są medianami jednowymiarowymi. Mediana marginalna jest łatwa do obliczenia, a jej własności badali Puri i Sen.

Mediana geometryczna

Geometryczna średnia dyskretnego zbioru punktów próbkowania w euklidesowej przestrzeni jest punktem minimalizacji sumy odległości do próbek.

W przeciwieństwie do mediany krańcowej, mediana geometryczna jest ekwiwariantna w odniesieniu do przekształceń podobieństwa euklidesowego, takich jak translacje i rotacje .

Mediana we wszystkich kierunkach

Jeżeli marginalne mediany dla wszystkich układów współrzędnych są zbieżne, to ich wspólne położenie można określić jako „medianę we wszystkich kierunkach”. Pojęcie to jest istotne dla teorii głosowania ze względu na twierdzenie o medianie wyborcy . Jeśli istnieje, mediana we wszystkich kierunkach pokrywa się z medianą geometryczną (przynajmniej dla rozkładów dyskretnych).

Środek

Alternatywnym uogólnienie mediany wyższych wymiarów jest oraz do środka .

Inne koncepcje związane z medianą

Interpolowana mediana

Kiedy mamy do czynienia ze zmienną dyskretną, czasami przydatne jest traktowanie obserwowanych wartości jako punktów środkowych leżących poniżej ciągłych przedziałów. Przykładem tego jest skala Likerta, na której opinie lub preferencje wyrażane są w skali z ustaloną liczbą możliwych odpowiedzi. Jeśli skala składa się z dodatnich liczb całkowitych, obserwację 3 można uznać za reprezentującą przedział od 2,50 do 3,50. Możliwe jest oszacowanie mediany zmiennej bazowej. Jeśli, powiedzmy, 22% obserwacji ma wartość 2 lub niższą, a 55,0% ma wartość 3 lub niższą (więc 33% ma wartość 3), to mediana wynosi 3, ponieważ mediana jest najmniejszą wartością, dla której jest większa niż pół. Ale interpolowana mediana jest gdzieś pomiędzy 2,50 a 3,50. Najpierw do mediany dodajemy połowę szerokości interwału, aby uzyskać górną granicę interwału mediany. Następnie odejmujemy tę proporcję szerokości przedziału, która jest równa proporcji 33%, która leży powyżej znaku 50%. Innymi słowy, dzielimy szerokość przedziału proporcjonalnie do liczby obserwacji. W tym przypadku 33% dzieli się na 28% poniżej mediany i 5% powyżej niej, więc od górnej granicy 3,50 odejmujemy 5/33 szerokości interwału, aby uzyskać interpolowaną medianę 3,35. Bardziej formalnie, jeśli wartości są znane, interpolowaną medianę można obliczyć z

Alternatywnie, jeśli w obserwowanej próbie są wyniki powyżej kategorii mediany, wyniki w niej i wyniki poniżej niej, interpolowana mediana jest podawana przez

Pseudomediana

W przypadku rozkładów jednowymiarowych, które są symetryczne wokół jednej mediany, estymator Hodgesa-Lehmanna jest solidnym i wysoce wydajnym estymatorem mediany populacji; dla rozkładów niesymetrycznych estymator Hodgesa-Lehmanna jest solidnym i wysoce wydajnym estymatorem pseudomediany populacji , która jest medianą rozkładu symetrycznego i która jest zbliżona do mediany populacji. Estymator Hodgesa-Lehmanna uogólniono na rozkłady wielowymiarowe.

Warianty regresji

Thiel-Sen estymator jest sposób wytrzymałej regresji liniowej na podstawie znalezienia mediany tras .

Filtr mediany

W kontekście przetwarzania obrazu z monochromatycznych obrazach rastrowych jest rodzaj hałasu, znany jako szum soli i pieprzu , gdy każdy piksel niezależnie staje się czarny (z niewielkim prawdopodobieństwem) lub biały (z niewielkim prawdopodobieństwem) i pozostaje niezmieniona inaczej (z prawdopodobieństwem bliskim 1). Obraz skonstruowany z median wartości sąsiedztwa (np. kwadrat 3×3) może w tym przypadku skutecznie zredukować szum .

Analiza skupień

W analizie skupień , że K-mediany Clustering algorytm zapewnia sposób definiowania klastrów, w którym kryterium maksymalizowanie odległości między klastrami środki, które stosuje się w k-średnich skupiającej , jest zastąpiony przez maksymalizowanie odległości między klastrami środkowych.

Mediana–linia środkowa

Jest to metoda solidnej regresji. Pomysł pochodzi od Walda w 1940 roku, który zasugerował podzielenie zbioru danych dwuwymiarowych na dwie połowy w zależności od wartości niezależnego parametru : lewą połowę z wartościami mniejszymi niż mediana i prawą połowę z wartościami większymi niż mediana. Zasugerował, aby wziąć środki ze zmiennych zależnych i niezależnych lewej i prawej połowy oraz oszacować nachylenie prostej łączącej te dwa punkty. Linię można następnie dostosować tak, aby pasowała do większości punktów w zestawie danych.

Nair i Shrivastava w 1942 r. zasugerowali podobny pomysł, ale zamiast tego zalecali podzielenie próbki na trzy równe części przed obliczeniem średnich podpróbek. Brown i Mood w 1951 zaproponowali pomysł wykorzystania median dwóch podpróbek, a nie środków. Tukey połączył te pomysły i zalecił podzielenie próby na trzy podpróbki o równej wielkości i oszacowanie linii na podstawie median podprób.

Mediana bezstronnych estymatorów

Dowolny estymator średniej nieobciążonej minimalizuje ryzyko ( stratę oczekiwaną ) w odniesieniu do funkcji straty kwadratu błędu , jak obserwował Gauss . Mediana -unbiased estymator minimalizuje ryzyko pod względem absolutnej odchylenie funkcji strat, co stwierdzono za pomocą Laplace'a . Inne funkcje straty są używane w teorii statystycznej , szczególnie w statystykach odpornych .

Teoria estymatorów nieobciążonych medianą została przywrócona przez George'a W. Browna w 1947 roku:

Oszacowanie parametru jednowymiarowego θ będzie uważane za nieobciążone medianą, jeżeli dla ustalonego θ mediana rozkładu oszacowania ma wartość θ; tj. szacunek równie często zaniża, jak zawyża. Wydaje się, że w większości przypadków wymaganie to spełnia tyle samo, co wymaganie średniej bezstronności i ma dodatkową właściwość, że jest niezmienne w transformacji jeden do jednego.

—  strona 584

Doniesiono o dalszych właściwościach estymatorów nieobciążonych medianą. Estymatory nieobciążone medianą są niezmienne w przypadku przekształceń jeden do jednego .

Istnieją metody konstruowania estymatorów nieobciążonych medianą, które są optymalne (w sensie analogicznym do własności minimalnej wariancji dla estymatorów nieobciążonych średnią). Takie konstrukcje istnieją dla rozkładów prawdopodobieństwa posiadających monotoniczne funkcje wiarogodności . Jedna z takich procedur jest analogią procedury Rao-Blackwella dla estymatorów średniej nieobciążonej: procedura dotyczy mniejszej klasy rozkładów prawdopodobieństwa niż procedura Rao-Blackwella, ale dla większej klasy funkcji straty .

Historia

Wydaje się, że badacze naukowi na starożytnym Bliskim Wschodzie nie korzystali w ogóle ze statystyk podsumowujących, zamiast tego wybierali wartości, które oferowały maksymalną spójność z szerszą teorią, która integrowała szeroką gamę zjawisk. W śródziemnomorskiej (a później europejskiej) społeczności naukowej statystyki takie jak średnia są zasadniczo zjawiskiem średniowiecznym i wczesnonowożytnym. (Historia mediany poza Europą i jej poprzedników pozostaje stosunkowo niezbadana.)

Idea mediany pojawiła się w XIII wieku w Talmudzie , w celu rzetelnej analizy rozbieżnych ocen . Jednak koncepcja nie rozprzestrzeniła się na szerszą społeczność naukową.

Zamiast tego najbliższym przodkiem współczesnej mediany jest średni zakres , wynaleziony przez Al-Biruniego . Przekazanie pracy Al-Biruniego późniejszym uczonym jest niejasne. Al-Biruni zastosował swoją technikę do oznaczania metali, ale po opublikowaniu swojej pracy większość probierców nadal przyjęła najbardziej niekorzystną wartość ze swoich wyników, aby nie wydawali się oszukiwać . Jednak wzmożona nawigacja na morzu w epoce odkrycia oznaczała, że ​​nawigatorzy statków coraz częściej musieli próbować określić szerokość geograficzną w niesprzyjających warunkach pogodowych w stosunku do wrogich brzegów, co prowadziło do ponownego zainteresowania statystykami podsumowującymi. Niezależnie od tego, czy został odkryty na nowo, czy niezależnie wynaleziony, średni zasięg jest zalecany żeglarzom w „Instrukcji podróży Raleigha do Gujany, 1595” Harriota.

Idea mediany po raz pierwszy pojawiła się w książce Edwarda Wrighta z 1599 r. Pewne błędy w nawigacji w części poświęconej nawigacji kompasem . Wright niechętnie odrzucał zmierzone wartości i mógł uważać, że mediana — obejmująca większą część zbioru danych niż średni zakres — była bardziej poprawna. Wright nie podał jednak przykładów użycia swojej techniki, co utrudnia zweryfikowanie, czy opisał współczesne pojęcie mediany. Mediana (w kontekście prawdopodobieństwa) z pewnością pojawiła się w korespondencji Christiaana Huygensa , ale jako przykład statystyki nieodpowiedniej dla praktyki aktuarialnej .

Najwcześniejsze zalecenie dotyczące mediany pochodzi z 1757 roku, kiedy Roger Joseph Boscovich opracował metodę regresji opartą na normie L 1, a zatem domyślnie na medianie. W 1774 roku Laplace wyraził to pragnienie wyraźnie: zasugerował, aby mediana była używana jako standardowy estymator wartości tylnego pliku PDF . Specyficznym kryterium było zminimalizowanie oczekiwanej wielkości błędu; gdzie jest oszacowanie i jest prawdziwą wartością. W tym celu Laplace określił rozkłady zarówno średniej próby, jak i mediany próby na początku XIX wieku. Jednak dekadę później Gauss i Legendre opracowali metodę najmniejszych kwadratów , która minimalizuje uzyskanie średniej. W kontekście regresji innowacja Gaussa i Legendre'a oferuje znacznie łatwiejsze obliczenia. W związku z tym propozycja Laplacesa była generalnie odrzucana do czasu pojawienia się urządzeń obliczeniowych 150 lat później (i nadal jest stosunkowo rzadkim algorytmem).

Antoine Augustin Cournot w 1843 roku jako pierwszy użył terminu mediana ( valeur médiane ) dla wartości dzielącej rozkład prawdopodobieństwa na dwie równe połowy. Gustav Theodor Fechner używał mediany ( Centralwerth ) w zjawiskach socjologicznych i psychologicznych. Wcześniej był używany tylko w astronomii i dziedzinach pokrewnych. Gustav Fechner spopularyzował medianę do formalnej analizy danych, chociaż była używana wcześniej przez Laplace'a, a mediana pojawiła się w podręczniku FY Edgewortha . Francis Galton użył angielskiego terminu mediana w 1881 roku, wcześniej używał terminów o średniej wartości w 1869 roku i medium w 1880 roku.

Statystycy intensywnie zachęcali do korzystania z median w XIX wieku ze względu na intuicyjną przejrzystość i łatwość ręcznego obliczania. Jednak pojęcie mediany nie pasuje do teorii wyższych momentów tak jak średnia arytmetyczna i jest znacznie trudniejsze do obliczenia przez komputer. W rezultacie w XX wieku mediana była stopniowo wypierana jako pojęcie średniej generycznej przez średnią arytmetyczną.

Zobacz też

Uwagi

Bibliografia

Zewnętrzne linki

Ten artykuł zawiera materiał z Median dystrybucji na PlanetMath , który jest objęty licencją Creative Commons Attribution/Share-Alike License .