Статистический критерий

Материал из Поле цифровой дидактики


Описание Статистический критерий — математическое правило, в соответствии с которым принимается или отвергается та или иная статистическая гипотеза с заданным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.
Область знаний Статистика
Авторы
Поясняющее видео
Близкие понятия Эксперимент
Среды и средства для освоения понятия критерий Стьюдента, F-test, ANOVA, Критерий Фишера

Определение

Пусть даны выборка [math]\displaystyle{ \mathbf{X} = (X_1,\ldots,X_n) }[/math] из неизвестного совместного распределения [math]\displaystyle{ \mathbb{P}^{\mathbf{X}} }[/math], и семейство статистических гипотез [math]\displaystyle{ H_0,H_1,\ldots }[/math]. Тогда статистическим критерием называется функция, устанавливающая соответствие между наблюдаемыми величинами и возможными гипотезами:

[math]\displaystyle{ f: \mathbf{X} \to \{H_0,H_1,\ldots\} }[/math].

Таким образом, каждой реализации выборки [math]\displaystyle{ \mathbf{x} = (x_1,\ldots,x_n) }[/math] статистический критерий сопоставляет наиболее подходящую с точки зрения этого критерия гипотезу о распределении, породившем данную реализацию.

Статистические критерии для экономики и эконометрики
Название критерия (варианты) Назначение критерия, когда применять. Применимость к моделям NetLogo Математические формулы
F-тест (Fisher's F-test)
Критерий Фишера
F-статистика
Проверка равенства дисперсий двух выборок, общая значимость регрессионных моделей, сравнение вложенных моделей.

NetLogo модели: Artificial Financial Market (сравнение волатильности), Minimum Wages Model (дисперсии зарплат), Demographic models (доходы домохозяйств)
[math]\displaystyle{ F = \frac{s_1^2}{s_2^2} }[/math]

[math]\displaystyle{ F = \frac{MSB}{MSW} }[/math]
t-тест Стьюдента
Критерий Стьюдента
t-статистика
Проверка значимости коэффициентов регрессии, сравнение средних двух выборок, парный t-тест.

NetLogo модели: Все экономические модели для проверки статистической значимости параметров агентов и их поведения
[math]\displaystyle{ t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} }[/math]

[math]\displaystyle{ t = \frac{\hat{\beta}_j - \beta_{j0}}{SE(\hat{\beta}_j)} }[/math]
Тест Дарбина-Уотсона
Durbin-Watson test
DW-статистика
Обнаружение автокорреляции первого порядка в остатках регрессии. Важен для временных рядов.

NetLogo модели: Все модели с временной динамикой - финансовые рынки, макроэкономические модели, демографические процессы
[math]\displaystyle{ DW = \frac{\sum_{t=2}^{n}(e_t - e_{t-1})^2}{\sum_{t=1}^{n}e_t^2} }[/math]

где [math]\displaystyle{ e_t }[/math] - остатки
Тест Бройша — Пагана
Breusch-Pagan test
BP тест
Обнаружение гетероскедастичности в линейной регрессии. Проверяет постоянство дисперсии остатков.

NetLogo модели: Модели торговли и рынков, где дисперсия может зависеть от размера сделок или агентов
[math]\displaystyle{ LM = nR^2 }[/math]

где [math]\displaystyle{ R^2 }[/math] из регрессии:
[math]\displaystyle{ \hat{u}^2 = \gamma_0 + \gamma_1 x + v }[/math]
Тест Уайта
White test
White тест
Обнаружение гетероскедастичности без предварительных предположений о ее форме. Более общий, чем Тест Бройша — Пагана.

NetLogo модели: Сложные экономические модели с нелинейными взаимодействиями агентов
[math]\displaystyle{ LM = nR^2 }[/math]

из регрессии:
[math]\displaystyle{ \hat{u}^2 = \alpha_0 + \alpha_1 x_1 + \alpha_2 x_1^2 + \alpha_3 x_1 x_2 + ... }[/math]
VIF (Variance Inflation Factor)
Фактор инфляции дисперсии
Обнаружение мультиколлинеарности между объясняющими переменными в регрессии.

NetLogo модели: Модели с множественными характеристиками агентов (доход, образование, возраст), где переменные могут быть взаимосвязаны
[math]\displaystyle{ VIF_j = \frac{1}{1-R_j^2} }[/math]

где [math]\displaystyle{ R_j^2 }[/math] - коэффициент детерминации регрессии [math]\displaystyle{ X_j }[/math] на остальные переменные
Тест Харке — Бера
Jarque-Bera test
JB тест
Проверка нормальности распределения остатков. Основан на асимметрии и эксцессе.

NetLogo модели: Все экономические модели для проверки нормальности распределений доходов, цен, производительности
[math]\displaystyle{ JB = \frac{n}{6}\left(S^2 + \frac{(K-3)^2}{4}\right) }[/math]

где S - асимметрия, K - эксцесс
Тест Шапиро-Уилка
Shapiro-Wilk test
SW тест
Проверка нормальности распределения, особенно эффективен для малых выборок (n < 50).

NetLogo модели: Анализ малых групп агентов или результатов отдельных симуляций
[math]\displaystyle{ W = \frac{(\sum_{i=1}^{n} a_i x_{(i)})^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2} }[/math]

где [math]\displaystyle{ a_i }[/math] - константы, [math]\displaystyle{ x_{(i)} }[/math] - порядковые статистики
Расширенный тест Дики - Фуллера
Augmented Dickey-Fuller (ADF)
ADF тест
Проверка единичного корня в временных рядах. Определение стационарности ряда.

NetLogo модели: Макроэкономические модели, модели финансовых рынков для анализа трендов и циклов
[math]\displaystyle{ \Delta y_t = \alpha + \beta t + \gamma y_{t-1} + \sum_{i=1}^{p} \delta_i \Delta y_{t-i} + \varepsilon_t }[/math]

H₀: γ = 0 (единичный корень)
Тест Филлипса-Перрона
Phillips-Perron (PP)
PP тест
Альтернатива ADF тесту, более устойчив к автокорреляции и гетероскедастичности в остатках.

NetLogo модели: Временные ряды с нерегулярной дисперсией, финансовые модели с волатильностью
[math]\displaystyle{ \Delta y_t = \alpha + \beta t + \gamma y_{t-1} + u_t }[/math]

Статистики модифицируются: [math]\displaystyle{ Z_t, Z_{\pi} }[/math]
KPSS тест
Kwiatkowski-Phillips-Schmidt-Shin
Тест стационарности
Проверка стационарности (H₀: ряд стационарен). Дополняет ADF и PP тесты.

NetLogo модели: Верификация стабильности экономических показателей в долгосрочных симуляциях
[math]\displaystyle{ KPSS = \frac{1}{T^2} \frac{\sum_{t=1}^{T} S_t^2}{\hat{\sigma}^2} }[/math]

где [math]\displaystyle{ S_t = \sum_{i=1}^{t} \hat{e}_i }[/math]
Тест Льюнга-Бокса
Ljung-Box test
Q-статистика
Проверка автокорреляции остатков более высоких порядков. Альтернатива тесту Дурбина-Уотсона.

NetLogo модели: Сложные временные зависимости в моделях адаптивных ожиданий, обучения агентов
[math]\displaystyle{ Q = T(T+2) \sum_{k=1}^{h} \frac{\hat{\rho}_k^2}{T-k} }[/math]

где [math]\displaystyle{ \hat{\rho}_k }[/math] - выборочная автокорреляция порядка k
Хи-квадрат тест
Chi-square test
χ² тест
Проверка независимости категориальных переменных, согласия с теоретическим распределением.

NetLogo модели: Анализ распределения агентов по категориям (профессии, доходные группы), тестирование случайности
[math]\displaystyle{ \chi^2 = \sum_{i=1}^{n} \frac{(O_i - E_i)^2}{E_i} }[/math]

где O_i - наблюдаемые, E_i - ожидаемые частоты
RESET тест
Ramsey's RESET
Regression Specification Error Test
Проверка правильности функциональной формы модели. Обнаруживает пропущенные нелинейности.

NetLogo модели: Проверка адекватности линейных аппроксимаций поведения агентов, когда реальные зависимости нелинейны
Вспомогательная регрессия:
[math]\displaystyle{ y = X\beta + \gamma_1 \hat{y}^2 + \gamma_2 \hat{y}^3 + ... + u }[/math]

H₀: γ₁ = γ₂ = ... = 0
Тест Грейнджера на причинность
Granger Causality test
Проверка причинно-следственных связей между временными рядами.

NetLogo модели: Анализ взаимосвязей между различными агентами или показателями в динамических моделях
[math]\displaystyle{ y_t = \alpha_0 + \sum_{i=1}^{p} \alpha_i y_{t-i} + \sum_{i=1}^{p} \beta_i x_{t-i} + \varepsilon_t }[/math]

H₀: β₁ = β₂ = ... = βₚ = 0
Тест Энгла на ARCH
Engle's ARCH test
ARCH-LM тест
Обнаружение автокоррелированной условной гетероскедастичности. Важен для финансовых временных рядов.

NetLogo модели: Финансовые модели с кластеризацией волатильности, модели рынка недвижимости
Вспомогательная регрессия:
[math]\displaystyle{ \hat{u}_t^2 = \alpha_0 + \alpha_1 \hat{u}_{t-1}^2 + ... + \alpha_q \hat{u}_{t-q}^2 + v_t }[/math]

LM = TR² ~ χ²(q)
Тест Хаусмана
Hausman test
Тест спецификации
Выбор между моделями с фиксированными и случайными эффектами в панельных данных.

NetLogo модели: Панельные модели с повторными наблюдениями за агентами, где нужно решить о природе индивидуальных эффектов
[math]\displaystyle{ H = (\hat{\beta}_{FE} - \hat{\beta}_{RE})' [Var(\hat{\beta}_{FE}) - Var(\hat{\beta}_{RE})]^{-1} (\hat{\beta}_{FE} - \hat{\beta}_{RE}) }[/math]

H ~ χ²(k)
Тест Вальда
Wald test
W-статистика
Проверка линейных и нелинейных ограничений на параметры модели.

NetLogo модели: Тестирование гипотез о равенстве параметров между группами агентов или периодами времени
[math]\displaystyle{ W = (R\hat{\beta} - r)' [R \hat{V}(\hat{\beta}) R']^{-1} (R\hat{\beta} - r) }[/math]

где Rβ = r - ограничения
LM тест (Множители Лагранжа)
Lagrange Multiplier test
Тест отношения правдоподобия
Общий принцип для различных диагностических тестов (гетероскедастичность, автокорреляция, спецификация).

NetLogo модели: Универсальный подход для тестирования различных предположений модели
[math]\displaystyle{ LM = TR^2 }[/math]

где R² из вспомогательной регрессии
LM ~ χ²(df)
Тест Гольдфельда-Квандта
Goldfeld-Quandt test
GQ тест
Альтернативный тест на гетероскедастичность, особенно когда известен источник неоднородности дисперсии.

NetLogo модели: Модели с явными группами агентов разного размера (малые/крупные фирмы)
[math]\displaystyle{ GQ = \frac{SSR_2/df_2}{SSR_1/df_1} }[/math]

где SSR₁, SSR₂ - суммы квадратов остатков в подвыборках