Przedział tolerancji - Tolerance interval

Przedział tolerancji jest przedział statystyczny , w którym, z pewnym poziomem ufności, określony odsetek z próbą ludności spada. „Dokładniej, przedział tolerancji 100 × p% / 100 × (1 − α) zapewnia granice, w ramach których przynajmniej pewna część (p) populacji mieści się przy danym poziomie ufności (1 − α)”. „A (p, 1 − α) przedział tolerancji (TI) oparty na próbie jest tak skonstruowany, aby obejmował co najmniej część p badanej populacji z ufnością 1 − α; taki TI jest zwykle określany jako p- treść - (1 − α) pokrycie TI. " „A (p, 1 − α) górna granica tolerancji (TL) to po prostu górna granica ufności 1 − α dla 100 p percentyla populacji”.

Przedział tolerancji można traktować jako statystyczną wersję przedziału prawdopodobieństwa . „W przypadku znanych parametrów przedział tolerancji 95% i przedział przewidywania 95% są takie same”. Gdybyśmy znali dokładne parametry populacji, bylibyśmy w stanie obliczyć zakres, w którym mieści się pewna część populacji. Na przykład, jeśli wiemy, że populacja ma rozkład normalny ze średnią i odchyleniem standardowym , wówczas przedział ten obejmuje 95% populacji (1,96 to wynik z dla 95% pokrycia populacji o rozkładzie normalnym).

Jeśli jednak mamy tylko próbkę z populacji, znamy tylko średnią z próby i odchylenie standardowe próby , które są jedynie szacunkami prawdziwych parametrów. W takim przypadku niekoniecznie będzie obejmować 95% populacji ze względu na rozbieżności w tych szacunkach. Przedział tolerancji ogranicza tę wariancję poprzez wprowadzenie poziomu ufności , czyli pewności, z jaką ten przedział faktycznie obejmuje określoną część populacji. W przypadku populacji o rozkładzie normalnym wynik z można przekształcić w „ współczynnik k ” lub współczynnik tolerancji dla danego za pomocą tabel przeglądowych lub kilku formuł aproksymacyjnych. „Gdy stopnie swobody zbliżają się do nieskończoności, przedziały przewidywania i tolerancji stają się równe”.

Formuły

Normalny przypadek

Relacja z innymi interwałami

Przedział tolerancji jest mniej znany niż przedział ufności i przedział przewidywania , sytuacja, na którą ubolewały niektórzy nauczyciele, ponieważ może prowadzić do niewłaściwego wykorzystania innych przedziałów, gdy przedział tolerancji jest bardziej odpowiedni.

Przedział tolerancji różni się od przedziału ufności tym, że przedział ufności ogranicza jednowartościowy parametr populacji (na przykład średnią lub wariancję ) z pewnym poziomem ufności, podczas gdy przedział tolerancji ogranicza zakres wartości danych, który obejmuje określony odsetek wartości populacja. Podczas gdy rozmiar przedziału ufności jest całkowicie spowodowany błędem próbkowania i będzie zbliżał się do przedziału o zerowej szerokości przy prawdziwym parametrze populacji wraz ze wzrostem wielkości próby, rozmiar przedziału tolerancji wynika częściowo z błędu próbkowania, a częściowo z rzeczywistej wariancji w populacji, oraz zbliży się do przedziału prawdopodobieństwa populacji wraz ze wzrostem wielkości próby.

Przedział tolerancji jest powiązany z przedziałem predykcji, ponieważ oba nakładają ograniczenia na zmienność w przyszłych próbkach. Jednak przedział predykcji ogranicza tylko jedną przyszłą próbkę, podczas gdy przedział tolerancji ogranicza całą populację (równoważnie, arbitralna sekwencja przyszłych próbek). Innymi słowy, przedział predykcji obejmuje średnio określoną część populacji , podczas gdy przedział tolerancji obejmuje ją z pewnym poziomem ufności , co sprawia, że ​​przedział tolerancji jest bardziej odpowiedni, jeśli pojedynczy przedział ma wiązać wiele przyszłych próbek.

Przykłady

podaje następujący przykład:

Rozważmy więc raz jeszcze przysłowiowy scenariusz testu przebiegu EPA , w którym kilka nominalnie identycznych samochodów danego modelu jest testowanych w celu uzyskania danych dotyczących przebiegu . Jeśli takie dane są przetwarzane w celu uzyskania 95% przedziału ufności dla średniego przebiegu modelu, można na przykład wykorzystać je do prognozowania średniego lub całkowitego zużycia benzyny dla wyprodukowanej floty takich samochodów w ciągu pierwszych 5000 mil. użytkowania. Taka przerwa nie byłaby jednak zbyt pomocna dla osoby wynajmującej jeden z tych samochodów i zastanawiającej się, czy (pełny) 10-litrowy zbiornik paliwa wystarczy, aby przewieźć go 350 mil do celu. W przypadku tego zadania znacznie bardziej przydatny byłby przedział przewidywania. (Weź pod uwagę różne implikacje bycia „95% pewności”, w przeciwieństwie do „95% pewności” ). Ale ani przedział ufności dla ani przedział przewidywania dla pojedynczego dodatkowego przebiegu nie jest dokładnie tym, czego potrzebuje inżynier projektant obciążony z określeniem, jak dużego zbiornika paliwa model naprawdę potrzebuje, aby zagwarantować, że 99% wyprodukowanych samochodów będzie miało zasięg 400 mil. To, czego inżynier naprawdę potrzebuje, to przedział tolerancji dla ułamka przebiegu takich samochodów.

Inny przykład podaje:

Poziomy ołowiu powietrza zostały zebrane z różnych obszarów w obiekcie. Stwierdzono, że wolnymi od ołowiu poziomy logarytmicznej wyposażone rozkład normalny studzienki (to znaczy, że dane są z rozkład logarytmiczno-normalnego . Let i odpowiednio oznaczają średnie populacji i odchylenie na danych przekształconych logarytmicznie. Jeżeli oznacza odpowiadający losowo zmienna, mamy więc zauważyć, że. jest mediana poziom ołowiu powietrze przedziałem ufności dla. może być skonstruowany w zwykły sposób, w oparciu o t -Dystrybucja , co z kolei zapewni przedział ufności dla średniego poziomu ołowiu Jeśli powietrze. i oznacz średnią z próby i odchylenie standardowe przekształconych logarytmicznie danych dla próby o rozmiarze n, 95% przedział ufności dla jest określony wzorem , gdzie oznacza kwantyl rozkładu t- Studenta wraz ze stopniami swobody. odsetki, aby uzyskać 95% górną granicę ufności dla mediany poziomu przewodzenia w powietrzu. Taka granica jest określona przez . W konsekwencji górna granica ufności 95% dla mediany przewodzenia w powietrzu jest określona przez . Załóżmy teraz, że chcemy przewidzieć przewagę powietrzną poziom na określonym poziomie duży obszar w laboratorium. 95% górny limit prognozy dla poziomu ołowiu przekształconego logarytmicznie jest określony przez . W podobny sposób można obliczyć dwustronny przedział predykcji. Znaczenie i interpretacja tych przedziałów jest dobrze znana. Na przykład, jeśli przedział ufności jest obliczany wielokrotnie z niezależnych próbek, 95% tak obliczonych przedziałów będzie zawierało prawdziwą wartość , w dłuższej perspektywie. Innymi słowy, przedział ma na celu dostarczenie informacji tylko dotyczących parametru . Przedział predykcji ma podobną interpretację i ma na celu dostarczenie informacji dotyczących tylko jednego poziomu odprowadzenia. Załóżmy teraz, że chcemy użyć próby, aby stwierdzić, czy co najmniej 95% poziomów ołowiu w populacji znajduje się poniżej progu. Przedział ufności i przedział predykcji nie mogą odpowiedzieć na to pytanie, ponieważ przedział ufności dotyczy tylko mediany poziomu przewodzenia, a przedział przewidywania dotyczy tylko jednego poziomu przewodzenia. Wymagany jest przedział tolerancji; a dokładniej, górna granica tolerancji. Górną granicę tolerancji należy obliczyć pod warunkiem, że co najmniej 95% poziomów ołowiu w populacji jest poniżej tej granicy, przy pewnym poziomie ufności, powiedzmy 99%.

Obliczenie

Jednostronne normalne przedziały tolerancji mają dokładne rozwiązanie pod względem średniej próbki i wariancji próbki w oparciu o niecentralny rozkład t- Studenta . Dwustronne normalne przedziały tolerancji można uzyskać na podstawie niecentralnego rozkładu chi kwadrat .

Zobacz też

Bibliografia

Dalsza lektura

  • Hahn, Gerald J .; Meeker, William Q .; Escobar, Luis A. (2017). Przedziały statystyczne: przewodnik dla praktyków i naukowców (wyd. 2). John Wiley & Sons, Incorporated. ISBN   978-0-471-68717-7 .