Дисперсия случайной ошибки

Материал из Поле цифровой дидактики


Описание Дисперсия случайной ошибки (англ. error variance) — это статистическая мера разброса случайной компоненты регрессионной модели, показывающая степень вариабельности необъясненной части зависимой переменной. В контексте эконометрического моделирования дисперсия случайной ошибки играет фундаментальную роль в оценке качества модели и статистических выводах.
Область знаний Экономика, Статистика
Авторы
Поясняющее видео
Близкие понятия Гомоскедастичность, Гетероскедастичность
Среды и средства для освоения понятия

Определение и математическая формализация

В линейной регрессионной модели случайная ошибка [math]\displaystyle{ \varepsilon_i }[/math] представляет собой разность между наблюдаемым значением зависимой переменной и её теоретическим значением:

[math]\displaystyle{ y_i = \beta_0 + \beta_1 x_i + \varepsilon_i }[/math]

Дисперсия случайной ошибки определяется как:

[math]\displaystyle{ D(\varepsilon_i) = E[(\varepsilon_i - E(\varepsilon_i))^2] = E[\varepsilon_i^2] = \sigma^2 }[/math]

где [math]\displaystyle{ \sigma^2 }[/math] — генеральная (истинная) дисперсия случайной ошибки, которая является неизвестным параметром.

Оценивание дисперсии случайной ошибки

Несмещенная оценка для парной регрессии

Поскольку истинная дисперсия неизвестна, используется её несмещенная выборочная оценка (исправленная дисперсия):

[math]\displaystyle{ S^2 = \frac{1}{n-2} \sum_{i=1}^{n} e_i^2 }[/math]

где [math]\displaystyle{ e_i = y_i - \hat{y}_i }[/math] — остатки регрессии, [math]\displaystyle{ n }[/math] — объем выборки.

Несмещенная оценка для множественной регрессии

Для модели с [math]\displaystyle{ k }[/math] параметрами формула принимает вид:

[math]\displaystyle{ S^2 = \frac{1}{n-k} \sum_{i=1}^{n} e_i^2 }[/math]

Стандартная ошибка регрессии

Извлекая квадратный корень из оценки дисперсии, получаем стандартную ошибку регрессии:

[math]\displaystyle{ SEE = \sqrt{S^2} = \sqrt{\frac{1}{n-k} \sum_{i=1}^{n} e_i^2} }[/math]