Регрессионная модель
Материал из Поле цифровой дидактики
| Описание | Регрессионная модель — это статистический инструмент, который помогает нам предсказывать значение одной переменной, исходя из значений других переменных. Это способ найти закономерность в данных и использовать её для предсказания будущих значений. В статье описано, как построить регрессионную модель и провести регрессионный анализ (на примере Language Change) |
|---|---|
| Область знаний | Статистика, Моделирование |
| Область использования (ISTE) | |
| Возрастная категория | 17
|
| Поясняющее видео | |
| Близкие рецепту понятия | Регрессия, Переменная, Остаток |
| Среды и средства для приготовления рецепта: | R, BehaviorSpace, NetLogo, Language Change, StatKey |
Регрессионная модель
Регрессионная модель описывает связь между переменными с помощью уравнения. Самая простая форма — линейная регрессия: [math]\displaystyle{ Y = \beta_0 + \beta_1 \cdot X + \varepsilon }[/math]
- Где
- Y — переменная, которую мы хотим предсказать (зависимая переменная)
- X — переменная, которую мы используем для предсказания (независимая переменная)
- β₀ (бета ноль) — свободный член (значение Y, когда X = 0)
- β₁ (бета один) — коэффициент при X (показывает, насколько Y изменится при увеличении X на единицу)
- ε (эпсилон) — ошибка модели (то, что модель не может объяснить)
Как построить регрессионную модель
- На примере данных из Language Change
- https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/Lang_Change_1440.csv
Спроектировать вычислительный эксперимент
- на примере модели Language Change
Определить независимые и зависимые переменные
Независимые переменные
- alpha (Вероятность адаптации/обучения) Диапазон: 0.025, 0.03, 0.035, 0.04 Смысл: вероятность того, что агент заимствует языковую форму от соседа при контакте. Гипотеза: большее alpha → быстрее распространяется инновация → выше LCI
- gamma (Вероятность спонтанной инновации/мутации) Диапазон: 0.02, 0.03, 0.04 Смысл: вероятность того, что агент независимо создаст новую языковую форму, не контактируя с соседями. Социально-экономический аналог: экзогенные инновации, креативность, предпринимательские инициативы. Гипотеза: gamma — критический фактор в модели, усиливает распространение инновации
- logistic? (Логистический vs экспоненциальный рост) Категория: TRUE / FALSE - - TRUE → логистический рост - Гипотеза: при logistic = TRUE инновация распространяется медленнее → ниже LCI
Зависимые переменные
Первая зависимая переменная: mean_state (LCI) = mean [state] of nodes [math]\displaystyle{ LCI = \text{mean}_i [state_i] = \frac{1}{N}\sum_{i=1}^{N} state_i, \quad N=100 }[/math]
- LCI (Language Change Index) — индекс изменения языка — среднее значение языкового состояния по всей популяции агентов
- Смысл: показывает средний уровень распространения языковой инновации в сообществе
- Диапазон: от 0 до 1, где 1 означает полное распространение инновации на всё сообщество, а 0 означает сохранение исходного состояния
- LCI отражает коллективный исход языкового процесса — насколько успешно языковая инновация завладела сообществом. Это макроскопический показатель, который агрегирует микроскопические решения каждого агента о принятии или отклонении инновации.
Вторая зависимая переменная (в модели фиксируется, но не используется в регрессии):
- count nodes with [state > 0.9] / count nodes — доля агентов, полностью принявших инновацию. Это показатель радикального принятия — какая часть сообщества достигла высокого уровня (>0.9) принятия инновации.
[math]\displaystyle{ Adoption\_Rate = \frac{|\{i: state_i \gt 0.9\}|}{N} \times 100\% }[/math]
Factorial Design
| Параметр | Уровни | Количество значений | Всего комбинаций |
|---|---|---|---|
| percent-grammar-1 | 55, 60, 65 | 3 | 3 |
| logistic? | TRUE, FALSE | 2 | 2 |
| alpha | 0.025, 0.03, 0.035, 0.04 | 4 | 4 |
| gamma | 0.02, 0.03, 0.04 | 3 | 3 |
| threshold-val | 0 | 1 | 1 |
| sink-state-1? | TRUE | 1 | 1 |
| update-algorithm | "reward" | 1 | 1 |
| num-nodes | 100 | 1 | 1 |
| ИТОГО экспериментальных сценариев: | 3 × 2 × 4 × 3 = 72 | ||
Вырастить данные в агент-ориентированной модели
- Запустить вашу модель NetLogo с использованием BehaviorSpace.
- Вырастить данные и записать csv
- Разместить данные на GitHub и сделать доступными - https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/Lang_Change_1440.csv
