Хи-квадрат
| Краткое описание инструмента | Хи-квадрат (χ²) — Chi-Squared статистический критерий для проверки гипотез о соответствии наблюдаемого распределения теоретическому или о независимости категориальных переменных. Используется в социо-экономических исследованиях для анализа частотных данных и взаимосвязей между дискретными характеристиками агентов. |
|---|---|
| Возможности | |
| Трудности использования | |
| Область знаний | Социология, Экономика, Статистика |
| Область применения | |
| Поясняющее видео | |
| Веб-сайт | |
| Пользователи | Учащиеся, Преподаватели |
| Используется для создания (проведения) | Статистический анализ |
| Разработчик | |
| Сообщество вокруг средства | |
| Лицензия | |
| Год первого релиза | |
| Совместное сетевое использование | Нет |
| Какой язык основной | English |
| Есть ли поддержка Искусственным Интеллектом | Нет |
Определение
Критерий хи-квадрат Chi-Squared определяется как сумма квадратов отклонений наблюдаемых частот O_i от ожидаемых E_i, нормированная на E_i: [math]\displaystyle{ \displaystyle \chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i} }[/math] где
- k— число категорий;
- O_i— наблюдаемая частота в категории i;
- E_i — ожидаемая частота в категории i при верности нулевой гипотезы.
Степень свободы: [math]\displaystyle{ \displaystyle \nu = k - 1 }[/math] для проверки соответствия распределения, или [math]\displaystyle{ \displaystyle \nu = (r - 1)(c - 1) }[/math] для таблицы сопряжённости размером r\times c.
Критерии применения
- Проверка соответствия: сравнение эмпирического распределения с теоретическим (равномерным, Парето, др.).
- Тест на независимость: анализ связи двух категориальных переменных (например, принадлежность агента к классу и факт совершения трансфера).
Условия:
- Объём выборки достаточен
- Категории взаимоисключающие и исчерпывающие.
Исследование при помощи калькулятора
Пример расчёта в R
# Пример: проверка независимости двух категориальных переменных
# Данные: матрица наблюдаемых частот
obs <- matrix(c(50, 30,
20, 40),
nrow = 2,
byrow = TRUE)
rownames(obs) <- c("Класс A", "Класс B")
colnames(obs) <- c("Трансфер", "Нет трансфера")
# Расчёт критерия χ²
test <- chisq.test(obs)
print(test)
Вывод покажет значение χ², степень свободы и p-value.
Применение в моделях NetLogo
В агентно-ориентированных экономических моделях целесообразно использовать χ² для анализа взаимосвязей между дискретными категориями поведения и состояний агентов:
- Категории агентов по уровням богатства (низкий/средний/высокий) и факт получения/неполучения трансфера за шаг.
- Изучить, зависит ли вероятность получения трансфера от уровня богатства.
Sugarscape model
- Категории по наличию ресурсов (сахар: да/нет) и статусу репродукции (размножился/не размножился).
- Проверить связь между доступом к ресурсам и репродуктивным успехом агентов.
Urban Suite – Economic Disparity
- Классы агентов по социально-экономическому статусу и выбору района (близко/далеко от работы).
- Исследовать зависимость между статусом и предпочтением местоположения.
Wealth Distribution
- Группы агентов по квантилям богатства (топ 10%, средние, низкие 50%) и участию в торговых операциях (активно/неактивно).
- Проверить, отличается ли активность в торговле между разными квантилями.
Кроме того, в более сложных моделях можно:
- Сравнивать распределение категорий агентов в различных сценариях (например, до и после введения налогов).
- Анализировать эффекты параметров модели (переход языка в Language Change, плотность леса в Fire) на категориальные исходы.
Вывод
Критерий χ² позволяет формально оценивать связи между категориальными переменными и проверять соответствие моделей ожидаемым распределениям. В моделях NetLogo он особенно полезен для анализа поведения агентов по категориям богатства, ресурсов, социального статуса и прочих дискретных состояний, выявляя значимые зависимости внутри симуляции.
