Economic Disparity/Experiments
- План эксперимента в NetLogo BehaviourSpace над моделью «Экономическое неравенство»
| Шаг | Описание | Значения / параметры |
|---|---|---|
| 1. Подготовка модели | Открыть модель Economic Disparity в NetLogo. Проверить наличие и правильность настройки слоев для сбора переменных price_observed и quality. | - |
| 2. Настройка BehaviourSpace | Запустить BehaviourSpace из меню Tools → BehaviourSpace. Создать новый эксперимент. | Имя эксперимента: EconomicDisparity_Experiment |
| 3. Определение параметров для варьирования (факторов) | Выбрать параметры, которые будут изменяться в процессе эксперимента, с примерами значений для каждого. | |
| Параметр | Значения | |
| max-jobs | 5, 10, 15 | |
| poor-price-priority | -1, 0, 1 | |
| rich-quality-priority | -1, 0, 1 | |
| death-rate | 2, 4, 6 | |
| poor-per-step | 1, 5, 10 | |
| rich-per-step | 1, 5, 10 | |
| residents-per-job | 50, 100, 150 | |
| number-of-tests | 5, 15, 30 |
|- | 4. Определение команды Setup | Команда, которая инициализирует модель перед запуском | setup |- | 5. Определение команды Go | Команда, запускающая один цикл модели | go |- | 6. Условие остановки эксперимента | Останавливать симуляцию через определённое количество тактов (ticks) | ticks >= 200 |- | 7. Выбор метрик для сбора и сохранения | Какие переменные нужно сохранять в CSV для дальнейшего анализа | mean [price] of patches (сохраняется как price_observed); mean [quality] of patches (сохраняется как quality) |- | 8. Периодичность записи данных | Частота записи данных в CSV-файл (например, после каждого 20-го такта) | every 20 ticks |- | 9. Количество повторов (runs) | Количество повторений эксперимента для статистической значимости | не менее 30 |- | 10. Сохранение результатов | Оптимальный формат файла и путь сохранения для интеграции с R-скриптом | CSV с разделителем ";" включая параметры эксперимента |- | 11. Обработка данных после выгрузки | Удалить первые 6 строк с описанием и оставить только ключевые переменные для анализа (например, price_observed и quality) | Выполняется отдельно в R |- | 12. Подключение к дальнейшему анализу | Использовать полученный CSV в R-скрипте, где проводится регрессионный анализ и построение графиков | "(См. соответствующий R-скрипт для анализа в Wiki)" |}
Этот план продуман так, чтобы охватить все этапы: от подготовки модели до получения чистого набора данных для последующего эконометрического анализа в R. Метрики и параметры выбраны из исходного списка, сгруппированы для удобства проведения повторных экспериментов и сравнений.
[1](https://ccl.northwestern.edu/netlogo/models/UrbanSuite-EconomicDisparity) [2](https://ccl.northwestern.edu/netlogo/2.0.0/docs/behaviorspace.html) [3](https://www.youtube.com/watch?v=amD-pyNAqrc) [4](https://docs.netlogo.org/behaviorspace.html) [5](https://www.yildizoglu.fr/cef-2015/NetLogo-cef-2015-chapter-2-netlogo-ho.pdf) [6](https://webspace.science.uu.nl/~vrees101/tips/empirical.php) [7](https://www.youtube.com/watch?v=LJLzuyyVm04) [8](https://ccl.northwestern.edu/netlogo/bind/watch/modelslibrary.html)
Цель эксперимента — собрать данные по взаимосвязи между наблюдаемыми ценами земельных участков и их качеством в разных сценариях при переселении агентов.
1. Подготовка модели
```
- Входные параметры (factors):
- `POOR-PER-STEP`: 1, 5, 10
- `RICH-PER-STEP`: 1, 5, 10
- `NUMBER-OF-TESTS`: 5, 20, 50
- **Метрики для сбора (metrics):**
- `mean [price] of patches` → сохраняется как `price_observed`
- `mean [quality] of patches` → сохраняется как `quality`
- **Номер запуска (run count):** 30
- **Интервал записи:** каждый 20 ticks (всего 10 точек на запуск)
- **Формат выходного файла:** CSV, с сохранением всех колонок:
```
run_number;poor-per-step;rich-per-step;number-of-tests;tick;price_observed;quality
```
Проведение эксперимента
- Запустить BehaviourSpace, дождаться окончания.
- Полученный файл `LandPriceQuality.csv` содержит примерно
```
run_number;poor-per-step;rich-per-step;number-of-tests;tick;price_observed;quality
1;1;1;5;0;1.00;1.00
1;1;1;5;20;1.05;1.05
…
30;10;10;50;200;2.30;2.30
```
R-скрипт для анализа данных
# Загрузка библиотек
library(readr)
library(ggplot2)
library(dplyr)
library(lmtest)
# Чтение данных, пропуская первые 6 строк с описанием
land_data_raw <- read.csv("LandPriceQuality.csv",
sep = ";",
skip = 6,
header = TRUE,
stringsAsFactors = FALSE)
# Оставляем только нужные переменные
land_data <- land_data_raw %>%
select(price_observed, quality)
# Предварительный просмотр
head(land_data)
# price_observed quality
# 1 1.00 1.00
# 2 1.05 1.05
# ...
# 1. Оценка линейной регрессии
model <- lm(price_observed ~ quality, data = land_data)
summary(model)
# 2. Тест Бройша–Пагана на гетероскедастичность
bptest(model)
# 3. Визуализация зависимости
ggplot(land_data, aes(x = quality, y = price_observed)) +
geom_point(alpha = 0.4) +
geom_smooth(method = "lm", color = "blue", se = FALSE) +
labs(
title = "Зависимость наблюдаемой цены от качества участка",
x = "Качество участка",
y = "Наблюдаемая цена"
)
# 4. Сохранение итогового набора данных для дальнейшего анализа
write.csv(land_data, "LandPriceQuality_clean.csv", row.names = FALSE)
# Оценка простой линейной регрессии price_observed ~ quality
model <- lm(price_observed ~ quality, data = land_data)
summary(model)
# Проверка гетероскедастичности (тест Бройша–Пагана)
library(lmtest)
bptest(model)
# Визуализация зависимости
ggplot(land_data, aes(x = quality, y = price_observed)) +
geom_point(alpha = 0.3) +
geom_smooth(method = "lm", color = "blue") +
facet_grid(poor.per.step ~ rich.per.step) +
labs(
title = "Зависимость наблюдаемой цены от качества участка",
x = "Качество участка",
y = "Наблюдаемая цена"
)
# Сохранение объединённой таблицы сводных статистик
summary_table <- land_data %>%
group_by(poor.per.step, rich.per.step, number.of.tests) %>%
summarize(
mean_price = mean(price_observed),
sd_price = sd(price_observed),
mean_quality = mean(quality),
sd_quality = sd(quality),
.groups = "drop"
)
write.csv(summary_table, "LandPriceQuality_summary.csv", row.names = FALSE)
# Результаты регрессии по подгруппам
group_models <- land_data %>%
group_by(poor.per.step, rich.per.step, number.of.tests) %>%
nest() %>%
mutate(
fit = map(data, ~ lm(price_observed ~ quality, data = .x)),
tidied = map(fit, tidy)
) %>%
unnest(tidied) %>%
select(poor.per.step, rich.per.step, number.of.tests, term, estimate, p.value)
write.csv(group_models, "LandPriceQuality_group_regression.csv", row.names = FALSE)
Структура итоговой CSV-таблицы
```csv run_number;poor-per-step;rich-per-step;number-of-tests;tick;price_observed;quality 1;1;1;5;0;1.00;1.00 1;1;1;5;20;1.05;1.05 ... 30;10;10;50;200;2.30;2.30 ```
Эту таблицу можно загрузить в R как `land_data` и применять к ней приведённый скрипт для оценки регрессий, тестов гетероскедастичности и построения визуализаций.
