Тест Бройша — Пагана
| Описание | Тест Бройша — Пагана (англ. Breusch–Pagan test) используется для обнаружения гетероскедастичности — зависимости дисперсии случайной ошибки от значений регрессоров. В контексте модели «Economic Disparity» тест позволяет проверить, меняется ли разброс ошибок в зависимости от качества земли и других факторов. |
|---|---|
| Область знаний | Экономика, Статистика |
| Авторы | |
| Поясняющее видео | |
| Близкие понятия | Гетероскедастичность |
| Среды и средства для освоения понятия | Economic Disparity |
Идея теста
Оценивается базовая линейная модель [math]\displaystyle{ y_i = \beta_0 + \beta_1 x_i + \varepsilon_i }[/math]
Вычисляются остатки [math]\displaystyle{ e_i = y_i - \hat y_i }[/math] и их квадраты [math]\displaystyle{ e_i^2 }[/math].
Проводится вспомогательная регрессия квадрата остатков на набор регрессоров (например, [math]\displaystyle{ x_i }[/math]): [math]\displaystyle{ e_i^2 = \alpha_0 + \alpha_1 x_i + u_i }[/math]
Статистика теста определяется как [math]\displaystyle{ LM = n \cdot R^2_{\text{aux}} }[/math] где [math]\displaystyle{ n }[/math] — число наблюдений, а [math]\displaystyle{ R^2_{\text{aux}} }[/math] — коэффициент детерминации вспомогательной регрессии.
При отсутствии гетероскедастичности [math]\displaystyle{ LM \sim \chi^2_{k} }[/math], где [math]\displaystyle{ k }[/math] — число регрессоров в вспомогательной модели (без константы).
Формулы
[math]\displaystyle{ e_i = y_i - \hat y_i }[/math]
[math]\displaystyle{ e_i^2 = (y_i - \hat y_i)^2 }[/math]
[math]\displaystyle{ e_i^2 = \alpha_0 + \sum_{j=1}^{k} \alpha_j x_{ij} + u_i }[/math]
[math]\displaystyle{ LM = n \cdot R^2_{\text{aux}} \quad\text{и}\quad LM \sim \chi^2_{k} }[/math]
Пример в R для модели «Economic Disparity»
Предположим, что данные смоделированы и сохранены в таблице `land_data` с переменными `price_observed` и `quality`.
# Установка и загрузка пакета
install.packages("lmtest")
library(lmtest)
# Базовая модель: зависимость наблюдаемой цены от качества
model <- lm(price_observed ~ quality, data = land_data)
# Проведение теста Бройша-Пагана
bp_result <- bptest(model)
# Вывод результатов
print(bp_result)
Результат будет содержать статистику [math]\displaystyle{ LM }[/math] и p-value. Если p-value меньше уровня значимости (обычно 0.05), гипотеза гомоскедастичности отвергается.
Ручная реализация вспомогательной регрессии
# Вычисление остатков и их квадратов
land_data$residuals <- residuals(model)
land_data$res2 <- land_data$residuals^2
# Вспомогательная регрессия на переменную quality
aux_model <- lm(res2 ~ quality, data = land_data)
# Расчет статистики LM
n <- nrow(land_data)
R2_aux <- summary(aux_model)$r.squared
LM <- n * R2_aux
# p-value по распределению хи-квадрат
k <- length(coef(aux_model)) - 1
p_value <- 1 - pchisq(LM, df = k)
cat("LM =", LM, "\n")
cat("df =", k, "\n")
cat("p-value =", p_value, "\n")
Интерпретация для модели «Economic Disparity»
Если дисперсия ошибок не зависит от качества земли, тест вернёт большой p-value и гомоскедастичность не отвергается.
- При гетероскедастичности (например, в богатых кластерах малая дисперсия, а в бедных — большая) p-value будет меньше 0.05, что укажет на необходимость корректировки оценок (например, использование робастных стандартных ошибок).
Проверка гетероскедастичности с помощью теста Бройша — Пагана позволяет повысить надёжность выводов и корректность доверительных интервалов в анализе данных модели «Economic Disparity».
