Хи-квадрат

Материал из Поле цифровой дидактики
Краткое описание инструмента Хи-квадрат (χ²) — Chi-Squared статистический критерий для проверки гипотез о соответствии наблюдаемого распределения теоретическому или о независимости категориальных переменных. Используется в социо-экономических исследованиях для анализа частотных данных и взаимосвязей между дискретными характеристиками агентов.
Возможности
Трудности использования
Область знаний Социология, Экономика, Статистика
Область применения
Поясняющее видео
Веб-сайт
Пользователи Учащиеся, Преподаватели
Используется для создания (проведения) Статистический анализ
Разработчик
Сообщество вокруг средства
Лицензия
Год первого релиза
Совместное сетевое использование Нет
Какой язык основной English
Есть ли поддержка Искусственным Интеллектом Нет

Определение

Критерий хи-квадрат Chi-Squared определяется как сумма квадратов отклонений наблюдаемых частот O_i от ожидаемых E_i, нормированная на E_i: [math]\displaystyle{ \displaystyle \chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i} }[/math] где

  • k— число категорий;
  • O_i— наблюдаемая частота в категории i;
  • E_i — ожидаемая частота в категории i при верности нулевой гипотезы.

Степень свободы: [math]\displaystyle{ \displaystyle \nu = k - 1 }[/math] для проверки соответствия распределения, или [math]\displaystyle{ \displaystyle \nu = (r - 1)(c - 1) }[/math] для таблицы сопряжённости размером r\times c.

Критерии применения

  • Проверка соответствия: сравнение эмпирического распределения с теоретическим (равномерным, Парето, др.).
  • Тест на независимость: анализ связи двух категориальных переменных (например, принадлежность агента к классу и факт совершения трансфера).

Условия:

  1. Объём выборки достаточен
  2. Категории взаимоисключающие и исчерпывающие.

Исследование при помощи калькулятора

Пример расчёта в R

# Пример: проверка независимости двух категориальных переменных
# Данные: матрица наблюдаемых частот
obs <- matrix(c(50, 30,
                20, 40),
              nrow = 2,
              byrow = TRUE)
rownames(obs) <- c("Класс A", "Класс B")
colnames(obs) <- c("Трансфер", "Нет трансфера")

# Расчёт критерия χ²
test <- chisq.test(obs)
print(test)

Вывод покажет значение χ², степень свободы и p-value.

В агентно-ориентированных экономических моделях целесообразно использовать χ² для анализа взаимосвязей между дискретными категориями поведения и состояний агентов:

  • Категории агентов по уровням богатства (низкий/средний/высокий) и факт получения/неполучения трансфера за шаг.
  • Изучить, зависит ли вероятность получения трансфера от уровня богатства.

Sugarscape model

  • Категории по наличию ресурсов (сахар: да/нет) и статусу репродукции (размножился/не размножился).
  • Проверить связь между доступом к ресурсам и репродуктивным успехом агентов.

Urban Suite – Economic Disparity

  • Классы агентов по социально-экономическому статусу и выбору района (близко/далеко от работы).
  • Исследовать зависимость между статусом и предпочтением местоположения.

Wealth Distribution

  • Группы агентов по квантилям богатства (топ 10%, средние, низкие 50%) и участию в торговых операциях (активно/неактивно).
  • Проверить, отличается ли активность в торговле между разными квантилями.

Кроме того, в более сложных моделях можно:

  • Сравнивать распределение категорий агентов в различных сценариях (например, до и после введения налогов).
  • Анализировать эффекты параметров модели (переход языка в Language Change, плотность леса в Fire) на категориальные исходы.

Вывод

Критерий χ² позволяет формально оценивать связи между категориальными переменными и проверять соответствие моделей ожидаемым распределениям. В моделях NetLogo он особенно полезен для анализа поведения агентов по категориям богатства, ресурсов, социального статуса и прочих дискретных состояний, выявляя значимые зависимости внутри симуляции.