Статистический критерий
Материал из Поле цифровой дидактики
| Описание | Статистический критерий — математическое правило, в соответствии с которым принимается или отвергается та или иная статистическая гипотеза с заданным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими. |
|---|---|
| Область знаний | Статистика |
| Авторы | |
| Поясняющее видео | |
| Близкие понятия | Эксперимент |
| Среды и средства для освоения понятия | критерий Стьюдента, F-test, ANOVA, Критерий Фишера |
Определение
Пусть даны выборка [math]\displaystyle{ \mathbf{X} = (X_1,\ldots,X_n) }[/math] из неизвестного совместного распределения [math]\displaystyle{ \mathbb{P}^{\mathbf{X}} }[/math], и семейство статистических гипотез [math]\displaystyle{ H_0,H_1,\ldots }[/math]. Тогда статистическим критерием называется функция, устанавливающая соответствие между наблюдаемыми величинами и возможными гипотезами:
- [math]\displaystyle{ f: \mathbf{X} \to \{H_0,H_1,\ldots\} }[/math].
Таким образом, каждой реализации выборки [math]\displaystyle{ \mathbf{x} = (x_1,\ldots,x_n) }[/math] статистический критерий сопоставляет наиболее подходящую с точки зрения этого критерия гипотезу о распределении, породившем данную реализацию.
| Статистические критерии для экономики и эконометрики | ||
|---|---|---|
| Название критерия (варианты) | Назначение критерия, когда применять. Применимость к моделям NetLogo | Математические формулы |
| F-тест (Fisher's F-test) Критерий Фишера F-статистика |
Проверка равенства дисперсий двух выборок, общая значимость регрессионных моделей, сравнение вложенных моделей. NetLogo модели: Artificial Financial Market (сравнение волатильности), Minimum Wages Model (дисперсии зарплат), Demographic models (доходы домохозяйств) |
[math]\displaystyle{ F = \frac{s_1^2}{s_2^2} }[/math] [math]\displaystyle{ F = \frac{MSB}{MSW} }[/math] |
| t-тест Стьюдента Критерий Стьюдента t-статистика |
Проверка значимости коэффициентов регрессии, сравнение средних двух выборок, парный t-тест. NetLogo модели: Все экономические модели для проверки статистической значимости параметров агентов и их поведения |
[math]\displaystyle{ t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} }[/math] [math]\displaystyle{ t = \frac{\hat{\beta}_j - \beta_{j0}}{SE(\hat{\beta}_j)} }[/math] |
| Тест Дарбина-Уотсона Durbin-Watson test DW-статистика |
Обнаружение автокорреляции первого порядка в остатках регрессии. Важен для временных рядов. NetLogo модели: Все модели с временной динамикой - финансовые рынки, макроэкономические модели, демографические процессы |
[math]\displaystyle{ DW = \frac{\sum_{t=2}^{n}(e_t - e_{t-1})^2}{\sum_{t=1}^{n}e_t^2} }[/math] где [math]\displaystyle{ e_t }[/math] - остатки |
| Тест Бройша — Пагана Breusch-Pagan test BP тест |
Обнаружение гетероскедастичности в линейной регрессии. Проверяет постоянство дисперсии остатков. NetLogo модели: Модели торговли и рынков, где дисперсия может зависеть от размера сделок или агентов |
[math]\displaystyle{ LM = nR^2 }[/math] где [math]\displaystyle{ R^2 }[/math] из регрессии: [math]\displaystyle{ \hat{u}^2 = \gamma_0 + \gamma_1 x + v }[/math] |
| Тест Уайта White test White тест |
Обнаружение гетероскедастичности без предварительных предположений о ее форме. Более общий, чем Тест Бройша — Пагана. NetLogo модели: Сложные экономические модели с нелинейными взаимодействиями агентов |
[math]\displaystyle{ LM = nR^2 }[/math] из регрессии: [math]\displaystyle{ \hat{u}^2 = \alpha_0 + \alpha_1 x_1 + \alpha_2 x_1^2 + \alpha_3 x_1 x_2 + ... }[/math] |
| VIF (Variance Inflation Factor) Фактор инфляции дисперсии |
Обнаружение мультиколлинеарности между объясняющими переменными в регрессии. NetLogo модели: Модели с множественными характеристиками агентов (доход, образование, возраст), где переменные могут быть взаимосвязаны |
[math]\displaystyle{ VIF_j = \frac{1}{1-R_j^2} }[/math] где [math]\displaystyle{ R_j^2 }[/math] - коэффициент детерминации регрессии [math]\displaystyle{ X_j }[/math] на остальные переменные |
| Тест Харке — Бера Jarque-Bera test JB тест |
Проверка нормальности распределения остатков. Основан на асимметрии и эксцессе. NetLogo модели: Все экономические модели для проверки нормальности распределений доходов, цен, производительности |
[math]\displaystyle{ JB = \frac{n}{6}\left(S^2 + \frac{(K-3)^2}{4}\right) }[/math] где S - асимметрия, K - эксцесс |
| Тест Шапиро-Уилка Shapiro-Wilk test SW тест |
Проверка нормальности распределения, особенно эффективен для малых выборок (n < 50). NetLogo модели: Анализ малых групп агентов или результатов отдельных симуляций |
[math]\displaystyle{ W = \frac{(\sum_{i=1}^{n} a_i x_{(i)})^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2} }[/math] где [math]\displaystyle{ a_i }[/math] - константы, [math]\displaystyle{ x_{(i)} }[/math] - порядковые статистики |
| Расширенный тест Дики - Фуллера Augmented Dickey-Fuller (ADF) ADF тест |
Проверка единичного корня в временных рядах. Определение стационарности ряда. NetLogo модели: Макроэкономические модели, модели финансовых рынков для анализа трендов и циклов |
[math]\displaystyle{ \Delta y_t = \alpha + \beta t + \gamma y_{t-1} + \sum_{i=1}^{p} \delta_i \Delta y_{t-i} + \varepsilon_t }[/math] H₀: γ = 0 (единичный корень) |
| Тест Филлипса-Перрона Phillips-Perron (PP) PP тест |
Альтернатива ADF тесту, более устойчив к автокорреляции и гетероскедастичности в остатках. NetLogo модели: Временные ряды с нерегулярной дисперсией, финансовые модели с волатильностью |
[math]\displaystyle{ \Delta y_t = \alpha + \beta t + \gamma y_{t-1} + u_t }[/math] Статистики модифицируются: [math]\displaystyle{ Z_t, Z_{\pi} }[/math] |
| KPSS тест Kwiatkowski-Phillips-Schmidt-Shin Тест стационарности |
Проверка стационарности (H₀: ряд стационарен). Дополняет ADF и PP тесты. NetLogo модели: Верификация стабильности экономических показателей в долгосрочных симуляциях |
[math]\displaystyle{ KPSS = \frac{1}{T^2} \frac{\sum_{t=1}^{T} S_t^2}{\hat{\sigma}^2} }[/math] где [math]\displaystyle{ S_t = \sum_{i=1}^{t} \hat{e}_i }[/math] |
| Тест Льюнга-Бокса Ljung-Box test Q-статистика |
Проверка автокорреляции остатков более высоких порядков. Альтернатива тесту Дурбина-Уотсона. NetLogo модели: Сложные временные зависимости в моделях адаптивных ожиданий, обучения агентов |
[math]\displaystyle{ Q = T(T+2) \sum_{k=1}^{h} \frac{\hat{\rho}_k^2}{T-k} }[/math] где [math]\displaystyle{ \hat{\rho}_k }[/math] - выборочная автокорреляция порядка k |
| Хи-квадрат тест Chi-square test χ² тест |
Проверка независимости категориальных переменных, согласия с теоретическим распределением. NetLogo модели: Анализ распределения агентов по категориям (профессии, доходные группы), тестирование случайности |
[math]\displaystyle{ \chi^2 = \sum_{i=1}^{n} \frac{(O_i - E_i)^2}{E_i} }[/math] где O_i - наблюдаемые, E_i - ожидаемые частоты |
| RESET тест Ramsey's RESET Regression Specification Error Test |
Проверка правильности функциональной формы модели. Обнаруживает пропущенные нелинейности. NetLogo модели: Проверка адекватности линейных аппроксимаций поведения агентов, когда реальные зависимости нелинейны |
Вспомогательная регрессия: [math]\displaystyle{ y = X\beta + \gamma_1 \hat{y}^2 + \gamma_2 \hat{y}^3 + ... + u }[/math] H₀: γ₁ = γ₂ = ... = 0 |
| Тест Грейнджера на причинность Granger Causality test |
Проверка причинно-следственных связей между временными рядами. NetLogo модели: Анализ взаимосвязей между различными агентами или показателями в динамических моделях |
[math]\displaystyle{ y_t = \alpha_0 + \sum_{i=1}^{p} \alpha_i y_{t-i} + \sum_{i=1}^{p} \beta_i x_{t-i} + \varepsilon_t }[/math] H₀: β₁ = β₂ = ... = βₚ = 0 |
| Тест Энгла на ARCH Engle's ARCH test ARCH-LM тест |
Обнаружение автокоррелированной условной гетероскедастичности. Важен для финансовых временных рядов. NetLogo модели: Финансовые модели с кластеризацией волатильности, модели рынка недвижимости |
Вспомогательная регрессия: [math]\displaystyle{ \hat{u}_t^2 = \alpha_0 + \alpha_1 \hat{u}_{t-1}^2 + ... + \alpha_q \hat{u}_{t-q}^2 + v_t }[/math] LM = TR² ~ χ²(q) |
| Тест Хаусмана Hausman test Тест спецификации |
Выбор между моделями с фиксированными и случайными эффектами в панельных данных. NetLogo модели: Панельные модели с повторными наблюдениями за агентами, где нужно решить о природе индивидуальных эффектов |
[math]\displaystyle{ H = (\hat{\beta}_{FE} - \hat{\beta}_{RE})' [Var(\hat{\beta}_{FE}) - Var(\hat{\beta}_{RE})]^{-1} (\hat{\beta}_{FE} - \hat{\beta}_{RE}) }[/math] H ~ χ²(k) |
| Тест Вальда Wald test W-статистика |
Проверка линейных и нелинейных ограничений на параметры модели. NetLogo модели: Тестирование гипотез о равенстве параметров между группами агентов или периодами времени |
[math]\displaystyle{ W = (R\hat{\beta} - r)' [R \hat{V}(\hat{\beta}) R']^{-1} (R\hat{\beta} - r) }[/math] где Rβ = r - ограничения |
| LM тест (Множители Лагранжа) Lagrange Multiplier test Тест отношения правдоподобия |
Общий принцип для различных диагностических тестов (гетероскедастичность, автокорреляция, спецификация). NetLogo модели: Универсальный подход для тестирования различных предположений модели |
[math]\displaystyle{ LM = TR^2 }[/math] где R² из вспомогательной регрессии LM ~ χ²(df) |
| Тест Гольдфельда-Квандта Goldfeld-Quandt test GQ тест |
Альтернативный тест на гетероскедастичность, особенно когда известен источник неоднородности дисперсии. NetLogo модели: Модели с явными группами агентов разного размера (малые/крупные фирмы) |
[math]\displaystyle{ GQ = \frac{SSR_2/df_2}{SSR_1/df_1} }[/math] где SSR₁, SSR₂ - суммы квадратов остатков в подвыборках |
