W regresji liniowej , średniej reakcji i przewidzianą odpowiedź są wartości zmiennej zależnej obliczonego na podstawie parametrów regresji i danej wartości zmiennych niezależnych. Wartości tych reakcji są takie same, ale ich wariancje obliczane są różne.
gdzie jest zmienną odpowiedzi , jest zmienna objaśniająca , ε i jest błąd losowy, a i są parametrami. Średnią i przewidywana wartość odpowiedzi dla danej wartości wyjaśniającym x d , podaje
Ponieważ dane w niniejszym kontekście określa się jako ( x , y ) pary dla każdej obserwacji, o średniej odpowiedzi na danej wartości x , powiedzmy x d jest oszacowanie średniej z y wartości w ludności w x wartość x D , to jest . Wariancja średniej odpowiedzi jest podana przez
Wyrażenie to można uprościć
gdzie m jest liczbą punktów danych.
Aby zademonstrować to uproszczenie, można skorzystać z tożsamości
Przewidywana odpowiedź
Przewidzianą odpowiedź rozkład jest przewidziany rozkład reszt w danym punkcie x d . Więc wariancja jest dana przez
Druga część tej wypowiedzi został obliczony dla średnią reakcję. Ponieważ (ustalonym ale nieznanym parametrem, który można oszacować), wariancja przewidzianą odpowiedź jest podana przez
Te przedziały ufności są obliczane jako . Zatem przedział ufności dla przewidzianą odpowiedź jest szersza niż odstęp do średniej odpowiedzi. Jest to oczekiwane intuicyjnie - wariancja populacji wartości nie kurczy się, gdy jeden próbek z nim, ponieważ zmienna losowa ε I nie zmniejsza, ale odchylenie od średniej z nie kurczą się ze zwiększonym pobieraniem próbek, ponieważ zróżnicowanie i spadek, więc średnia odpowiedź (przewidywana wartość odpowiedź) staje się bliższy .
Jest to analogiczne do różnicy między wariancji populacji i wariancji średniej próbki populacji: wariancja populacji jest parametrem i nie zmienia, ale wariancja średniej próbki maleje ze wzrostem próbek.
Ogólne regresji liniowej
Ogólny model liniowy może być zapisana jako
W związku z tym, ponieważ ogólny wyraz dla wariancji średnia odpowiedź jest