Тест Бройша — Пагана

Материал из Поле цифровой дидактики


Описание Тест Бройша — Пагана (англ. Breusch–Pagan test) используется для обнаружения гетероскедастичности — зависимости дисперсии случайной ошибки от значений регрессоров. В контексте модели «Economic Disparity» тест позволяет проверить, меняется ли разброс ошибок в зависимости от качества земли и других факторов.
Область знаний Экономика, Статистика
Авторы
Поясняющее видео
Близкие понятия Гетероскедастичность
Среды и средства для освоения понятия Economic Disparity

Идея теста

Оценивается базовая линейная модель [math]\displaystyle{ y_i = \beta_0 + \beta_1 x_i + \varepsilon_i }[/math]

Вычисляются остатки [math]\displaystyle{ e_i = y_i - \hat y_i }[/math] и их квадраты [math]\displaystyle{ e_i^2 }[/math].

Проводится вспомогательная регрессия квадрата остатков на набор регрессоров (например, [math]\displaystyle{ x_i }[/math]): [math]\displaystyle{ e_i^2 = \alpha_0 + \alpha_1 x_i + u_i }[/math]

Статистика теста определяется как [math]\displaystyle{ LM = n \cdot R^2_{\text{aux}} }[/math] где [math]\displaystyle{ n }[/math] — число наблюдений, а [math]\displaystyle{ R^2_{\text{aux}} }[/math] — коэффициент детерминации вспомогательной регрессии.

При отсутствии гетероскедастичности [math]\displaystyle{ LM \sim \chi^2_{k} }[/math], где [math]\displaystyle{ k }[/math] — число регрессоров в вспомогательной модели (без константы).

Формулы

[math]\displaystyle{ e_i = y_i - \hat y_i }[/math]

[math]\displaystyle{ e_i^2 = (y_i - \hat y_i)^2 }[/math]

[math]\displaystyle{ e_i^2 = \alpha_0 + \sum_{j=1}^{k} \alpha_j x_{ij} + u_i }[/math]

[math]\displaystyle{ LM = n \cdot R^2_{\text{aux}} \quad\text{и}\quad LM \sim \chi^2_{k} }[/math]

Пример в R для модели «Economic Disparity»

Предположим, что данные смоделированы и сохранены в таблице `land_data` с переменными `price_observed` и `quality`.

# Установка и загрузка пакета
install.packages("lmtest")
library(lmtest)

# Базовая модель: зависимость наблюдаемой цены от качества
model <- lm(price_observed ~ quality, data = land_data)

# Проведение теста Бройша-Пагана
bp_result <- bptest(model)

# Вывод результатов
print(bp_result)

Результат будет содержать статистику [math]\displaystyle{ LM }[/math] и p-value. Если p-value меньше уровня значимости (обычно 0.05), гипотеза гомоскедастичности отвергается.

Ручная реализация вспомогательной регрессии

# Вычисление остатков и их квадратов
land_data$residuals <- residuals(model)
land_data$res2 <- land_data$residuals^2

# Вспомогательная регрессия на переменную quality
aux_model <- lm(res2 ~ quality, data = land_data)

# Расчет статистики LM
n <- nrow(land_data)
R2_aux <- summary(aux_model)$r.squared
LM <- n * R2_aux

# p-value по распределению хи-квадрат
k <- length(coef(aux_model)) - 1
p_value <- 1 - pchisq(LM, df = k)

cat("LM =", LM, "\n")
cat("df =", k, "\n")
cat("p-value =", p_value, "\n")

Интерпретация для модели «Economic Disparity»

Если дисперсия ошибок не зависит от качества земли, тест вернёт большой p-value и гомоскедастичность не отвергается.

  • При гетероскедастичности (например, в богатых кластерах малая дисперсия, а в бедных — большая) p-value будет меньше 0.05, что укажет на необходимость корректировки оценок (например, использование робастных стандартных ошибок).

Проверка гетероскедастичности с помощью теста Бройша — Пагана позволяет повысить надёжность выводов и корректность доверительных интервалов в анализе данных модели «Economic Disparity».