Zakładana średnia - Assumed mean

W statystykach Zakładana średnia to metoda obliczania średniej arytmetycznej i odchylenia standardowego zestawu danych. Ułatwia ręczne obliczanie dokładnych wartości. Jego obecne zainteresowanie ma głównie charakter historyczny, ale można go wykorzystać do szybkiego oszacowania tych statystyk. Istnieją inne metody szybkich obliczeń, które są bardziej odpowiednie dla komputerów, które zapewniają również dokładniejsze wyniki niż metody oczywiste.

Przykład

Po pierwsze: poszukuje się średniej z następujących liczb:

219, 223, 226, 228, 231, 234, 235, 236, 240, 241, 244, 247, 249, 255, 262

Załóżmy, że zaczynamy od wiarygodnego wstępnego przypuszczenia, że ​​średnia wynosi około 240. Następnie odchylenia od tej „założonej” średniej są następujące:

-21, -17, -14, -12, -9, -6, -5, -4, 0, 1, 4, 7, 9, 15, 22

Dodając je, można stwierdzić, że:

22 i -21 prawie się anulują, pozostawiając +1,
15 i -17 prawie się anulują, pozostawiając -2,
9 i -9 anulować,
7 + 4 anuluje −6 − 5,

i tak dalej. Pozostaje nam suma -30. Średnia z tych 15 odchylenia od założonego średniej zatem -30/15 = -2. Dlatego właśnie to musimy dodać do założonej średniej, aby uzyskać poprawną średnią:

poprawna średnia = 240 − 2 = 238.

metoda

Metoda polega na oszacowaniu średniej i zaokrągleniu do wartości łatwej do obliczenia. Ta wartość jest następnie odejmowana od wszystkich wartości próbki. Gdy próbki są klasyfikowane w równych zakresach wielkości, wybierana jest klasa centralna, a liczba zakresów z tej jest wykorzystywana w obliczeniach. Na przykład dla osób o wzroście jako założoną średnią można przyjąć wartość 1,75 m.

Dla zbioru danych o założonej średniej x 0 załóżmy:

Następnie

lub dla odchylenia standardowego próbki przy użyciu poprawki Bessela :

Przykład przy użyciu zakresów klas

W przypadku dużej liczby próbek można szybko i rozsądnie oszacować średnią i odchylenie standardowe, grupując próbki w klasy przy użyciu równych zakresów wielkości. Wprowadza to błąd kwantyzacji, ale zwykle jest wystarczająco dokładny dla większości celów, jeśli używanych jest 10 lub więcej klas.

Na przykład z wyjątkiem

167,8 175,4 176,1 166 174,7 170,2 178,9 180,4 174,6 174,5 182,4 173,4 167,4 170,7 180,6 169,6 176,3 175,1 178,7 167,2 180,2 180,3 164,7 167,9 179,6 164,9 173,2 180,3 168 175,5 172,9 182,2 166,7 172,4 181,9 175,9 176,8 179,6 166 171,5 180,6 175,5 173,2 174,2 174,2 163,3 172,5 163,4 165,9 178,2 174,6 174,3 170,5 169,7 176,2 175,1 177 173,5 173,6 174,3 174,4 171,1 173,3 164,6 173 177,9 166,5 159,6 170,5 174,7 182 172,7 175,9 171,5 167,1 176,9 181,7 170,7 177,5 170,9 178,1 174,3 173,3 169,2 178,2 179,4 187,6 186,4 178,1 174 177,1 163,3 178,1

Minimum i maksimum to 159,6 i 187,6, możemy je pogrupować w następujący sposób zaokrąglając liczby w dół. Wielkość klasy (CS) wynosi 3. Przyjęta średnia jest środkiem przedziału od 174 do 177, czyli 175,5. Różnice liczone są w klasach.

Obserwowane liczby w zakresach
Zasięg liczyć liczyć częstotliwość klasa różnica częstotliwość×różnica częstotliwość×różnica 2
159—161 / 1 -5 -5 25
162—164 //// / 6 -4 −24 96
165—167 //// //// 10 -3 -30 90
168—170 //// //// /// 13 -2 −26 52
171—173 //// //// //// / 16 -1 −16 16
174—176 //// //// //// //// //// 25 0 0 0
177—179 //// //// //// / 16 1 16 16
180—182 //// //// / 11 2 22 44
183—185 0 3 0 0
186—188 // 2 4 8 32
Suma N = 100 A = −55 B = 371

Średnia jest następnie szacowana na

co jest bardzo zbliżone do rzeczywistej średniej 173,846.

Odchylenie standardowe szacuje się jako

Bibliografia