Błąd obserwacji - Observational error

Błąd obserwacji (lub błąd pomiaru ) to różnica między zmierzoną wartością wielkości a jej wartością rzeczywistą. W statystykach błąd nie jest „błędem”. Zmienność jest nieodłączną częścią wyników pomiarów i procesu pomiarowego.

Błędy pomiaru można podzielić na dwie składowe: błąd przypadkowy i błąd systematyczny .

Błędy losowe to błędy pomiaru, które prowadzą do niespójności wartości mierzalnych, gdy wykonywane są powtarzane pomiary stałego atrybutu lub wielkości . Błędy systematyczne to błędy, które nie są ustalane przypadkowo, ale są wprowadzane przez niedokładność (obejmującą proces obserwacji lub pomiaru) nieodłączną dla systemu . Systematyczny błąd może również odnosić się do błędu o niezerowej średniej The efekt , którego nie zmniejsza się, gdy obserwacjeuśrednione .

Nauka i eksperymenty

Gdy takim błędom przypisuje się losowość lub niepewność modelowaną przez teorię prawdopodobieństwa , są one „błędami” w takim sensie, w jakim termin ten jest używany w statystyce ; zobacz błędy i reszty w statystykach .

Za każdym razem, gdy powtarzamy pomiar czułym instrumentem, uzyskujemy nieco inne wyniki. Powszechnie stosowanym modelem statystycznym jest to, że błąd ma dwie addytywne części:

  1. Błąd systematyczny, który występuje zawsze, o tej samej wartości, gdy używamy przyrządu w ten sam sposób i w tym samym przypadku
  2. Błąd przypadkowy, który może się różnić w zależności od obserwacji.

Błąd systematyczny jest czasami nazywany błędem statystycznym . Często można go zmniejszyć za pomocą standardowych procedur. Częścią procesu uczenia się w różnych naukach jest nauka korzystania ze standardowych instrumentów i protokołów, aby zminimalizować błąd systematyczny.

Błąd losowy (lub losowa zmienność ) jest spowodowany czynnikami, które nie mogą lub nie będą kontrolowane. Jednym z możliwych powodów rezygnacji z kontrolowania tych przypadkowych błędów jest to, że kontrolowanie ich za każdym razem, gdy przeprowadza się eksperyment lub wykonuje pomiary, może być zbyt kosztowne. Inne powody mogą być takie, że wszystko, co próbujemy mierzyć, zmienia się w czasie (patrz modele dynamiczne ) lub jest zasadniczo probabilistyczne (jak ma to miejsce w mechanice kwantowej — patrz Pomiar w mechanice kwantowej ). Błąd przypadkowy często występuje, gdy instrumenty są popychane do skrajnych granic ich działania. Na przykład, powszechne jest, że wagi cyfrowe wykazują błąd losowy w najmniej znaczącej cyfrze. Trzy pomiary jednego obiektu mogą odczytać około 0,9111g, 0,9110g i 0,9112g.

Błędy losowe a błędy systematyczne

Błędy pomiaru można podzielić na dwie składowe: błąd przypadkowy i błąd systematyczny.

Błąd przypadkowy jest zawsze obecny w pomiarze. Jest to spowodowane przez z natury nieprzewidywalne fluktuacje w odczytach aparatury pomiarowej lub w interpretacji odczytów instrumentalnych przez eksperymentatora. Błędy losowe pojawiają się jako różne wyniki dla pozornie tego samego powtórzonego pomiaru. Można je oszacować, porównując wiele pomiarów i zmniejszyć, uśredniając wiele pomiarów.

Błąd systematyczny jest przewidywalny i zazwyczaj stały lub proporcjonalny do wartości prawdziwej. Jeśli można zidentyfikować przyczynę błędu systematycznego, zwykle można go wyeliminować. Błędy systematyczne są spowodowane niedoskonałą kalibracją przyrządów pomiarowych lub niedoskonałymi metodami obserwacji lub ingerencją środowiska w proces pomiarowy i zawsze wpływają na wyniki eksperymentu w przewidywalnym kierunku. Przykładem błędu systematycznego w oprzyrządowaniu jest nieprawidłowe zerowanie przyrządu prowadzące do błędu zerowego.

Standard testu wydajności PTC 19.1-2005 „Niepewność testu”, opublikowany przez Amerykańskie Stowarzyszenie Inżynierów Mechaników (ASME), szczegółowo omawia błędy systematyczne i losowe. W rzeczywistości w tych terminach konceptualizuje swoje podstawowe kategorie niepewności.

Błąd przypadkowy może być spowodowany nieprzewidywalnymi fluktuacjami w odczytach aparatury pomiarowej lub w interpretacji przez eksperymentatora odczytu instrumentalnego; wahania te mogą być częściowo spowodowane ingerencją środowiska w proces pomiarowy. Pojęcie błędu losowego jest ściśle związane z pojęciem precyzji . Im wyższa dokładność przyrządu pomiarowego, tym mniejsza zmienność ( odchylenie standardowe ) wahań jego odczytów.

Źródła błędów systematycznych

Niedoskonała kalibracja

Źródłem błędu systematycznego może być niedoskonała kalibracja przyrządów pomiarowych (błąd zerowy), zmiany w środowisku zakłócające proces pomiarowy, a czasami niedoskonałymi metodami obserwacji mogą być albo błąd zerowy, albo błąd procentowy. Jeśli weźmiesz pod uwagę eksperymentatora, który odczytuje okres wahadła kołyszącego się obok znacznika odniesienia : Jeśli jego stoper lub minutnik zaczyna się od 1 sekundy na zegarze, wszystkie jego wyniki będą przesunięte o 1 sekundę (błąd zero) . Jeśli eksperymentator powtórzy to doświadczenie dwadzieścia razy (za każdym razem zaczynając od 1 sekundy), to w obliczonej średniej wyników wystąpi błąd procentowy ; ostateczny wynik będzie nieco większy niż prawdziwy okres.

Odległość mierzona przez radar będzie systematycznie zawyżana, jeśli nie uwzględni się lekkiego spowolnienia fal w powietrzu. Przykładem błędu systematycznego w oprzyrządowaniu jest nieprawidłowe zerowanie przyrządu prowadzące do błędu zerowego.

Błędy systematyczne mogą również występować w wyniku oszacowania opartego na modelu matematycznym lub prawie fizycznym . Przykładowo, szacowana częstotliwość oscylacji z wahadłem będzie systematycznie w błąd, jeśli niewielki ruch podpory nie jest rozliczana.

Ilość

Błędy systematyczne mogą być stałe lub związane (np. proporcjonalnie lub procentowo) z rzeczywistą wartością mierzonej wielkości, a nawet z wartością innej wielkości (na odczyt linijki może mieć wpływ temperatura otoczenia). Gdy jest stała, jest to po prostu spowodowane nieprawidłowym wyzerowaniem przyrządu. Gdy nie jest stały, może zmienić swój znak. Na przykład, jeśli termometr jest dotknięty proporcjonalnym błędem systematycznym równym 2% rzeczywistej temperatury, a rzeczywista temperatura wynosi 200°, 0° lub −100°, zmierzona temperatura wyniesie 204° (błąd systematyczny = + 4°), 0° (zerowy błąd systematyczny) lub -102° (błąd systematyczny = -2°). Zatem temperatura będzie zawyżona, gdy będzie powyżej zera i zaniżona, gdy będzie poniżej zera.

Dryf

Błędy systematyczne zmieniające się w trakcie eksperymentu ( dryf ) są łatwiejsze do wykrycia. Pomiary wskazują trendy w czasie, a nie zmieniają się losowo o średnią . Dryf jest widoczny, jeśli pomiar o stałej wielkości jest powtarzany kilka razy, a pomiary dryfują w jedną stronę podczas eksperymentu. Jeśli następny pomiar jest wyższy niż poprzedni, co może się zdarzyć, gdy przyrząd rozgrzeje się podczas eksperymentu, to mierzona wielkość jest zmienna i możliwe jest wykrycie dryftu poprzez sprawdzenie odczytu zera podczas eksperymentu, jak również na początku eksperyment (w rzeczywistości odczyt zerowy jest pomiarem stałej wielkości). Jeśli odczyt zera jest stale powyżej lub poniżej zera, występuje błąd systematyczny. Jeśli nie da się tego wyeliminować, potencjalnie przez zresetowanie przyrządu bezpośrednio przed eksperymentem, należy na to pozwolić, odejmując jego (ewentualnie zmienną w czasie) wartość od odczytów i biorąc ją pod uwagę przy ocenie dokładności pomiaru.

Jeżeli nie widać żadnego wzoru w serii powtarzanych pomiarów, obecność stałych błędów systematycznych można wykryć tylko wtedy, gdy pomiary są sprawdzane, albo poprzez pomiar znanej wielkości, albo przez porównanie odczytów z odczytami dokonanymi przy użyciu innego przyrządu, o którym wiadomo, że bardziej precyzyjne. Na przykład, jeśli kilka razy pomyślisz o czasie wahadła za pomocą dokładnego stopera , otrzymasz odczyty losowo rozłożone wokół średniej. Mamy nadzieję, że pojawia się błąd systematyczny, jeśli stoper zostanie porównany z „ mówiącym zegarem ” systemu telefonicznego i okaże się, że działa wolno lub szybko. Oczywiście czasy wahadła muszą zostać skorygowane w zależności od tego, jak szybko lub wolno stoper działa.

Przyrządy pomiarowe, takie jak amperomierze i woltomierze, muszą być okresowo sprawdzane pod kątem zgodności ze znanymi normami.

Błędy systematyczne można również wykryć mierząc znane już wielkości. Na przykład, spektrometr wyposażony w siatkę dyfrakcyjną może być sprawdzany poprzez pomiar długości fali linii D widma elektromagnetycznego sodu, które są przy 600 nm i 589,6 nm. Pomiary mogą być wykorzystane do określenia liczby linii na milimetr siatki dyfrakcyjnej, która może być następnie wykorzystana do pomiaru długości fali dowolnej innej linii widmowej.

Bardzo trudno jest uporać się z ciągłymi błędami systematycznymi, ponieważ ich skutki można zaobserwować tylko wtedy, gdy można je usunąć. Takich błędów nie da się usunąć powtarzając pomiary lub uśredniając dużą liczbę wyników. Powszechną metodą usuwania błędu systematycznego jest kalibracja przyrządu pomiarowego.

Źródła błędów losowych

Błąd przypadkowy lub stochastyczny w pomiarze to błąd, który jest losowy z jednego pomiaru do następnego. Błędy stochastyczne mają tendencję do rozkładu normalnego, gdy błąd stochastyczny jest sumą wielu niezależnych błędów losowych z powodu centralnego twierdzenia granicznego . Błędy stochastyczne dodane do równania regresji wyjaśniają zmienność Y , której nie można wyjaśnić zawartymi X- ami.

Ankiety

Termin „błąd obserwacji” jest również czasami używany w odniesieniu do błędów odpowiedzi i niektórych innych rodzajów błędów niezwiązanych z próbkowaniem . W sytuacjach typu ankietowego błędy te mogą być pomyłkami w gromadzeniu danych, obejmującymi zarówno nieprawidłowe rejestrowanie odpowiedzi, jak i prawidłowe rejestrowanie niedokładnej odpowiedzi respondenta. Te źródła błędów niezwiązanych z próbkowaniem omówiono w Salant i Dillman (1994) oraz Bland i Altman (1996).

Błędy te mogą być przypadkowe lub systematyczne. Błędy losowe są spowodowane niezamierzonymi błędami respondentów, ankieterów i/lub koderów. Błąd systematyczny może wystąpić w przypadku systematycznej reakcji respondentów na metodę zastosowaną do sformułowania pytania ankietowego. Zatem dokładne sformułowanie pytania ankietowego jest kluczowe, gdyż wpływa na poziom błędu pomiaru. Badacze mają do dyspozycji różne narzędzia, które mogą im pomóc w określeniu dokładnego sformułowania ich pytań, na przykład oszacowanie jakości pytania za pomocą eksperymentów MTMM . Ta informacja o jakości może być również wykorzystana w celu skorygowania błędu pomiaru .

Wpływ na analizę regresji

Jeśli zmienna zależna w regresji jest mierzony z błędem, analiza regresji i towarzyszące testowanie hipotez nie ulegają zmianie, z tym, że R 2 będzie niższy niż byłoby to w idealnym pomiaru.

Jeśli jednak co najmniej jedna zmienna niezależna jest mierzona z błędem, współczynniki regresji i standardowe testy hipotez są nieważne. Nazywa się to odchyleniem tłumienia .

Zobacz też

Bibliografia

Dalsza lektura