Множественная регрессия
| Описание | Множественной называют линейную регрессию, в модели которой число независимых переменных две или более. В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях. В общем, множественная регрессия позволяет исследователю задать вопрос (и, вероятно, получить ответ) о том, "что является лучшим предиктором для...":
Термин "множественная" указывает на наличие нескольких предикторов или регрессоров, которые используются в модели. Множественная линейная регрессия позволяет одновременно оценить влияние нескольких независимых переменных (предикторов) на зависимую переменную. В отличие от простой регрессии (один предиктор), множественная регрессия учитывает одновременное влияние всех факторов, контролируя эффект остальных переменных. |
|---|---|
| Область знаний | Математика, Психология, Социология, Экономика |
| Авторы | |
| Поясняющее видео | https://www.youtube.com/watch?v=i-Qmi-7M3N4 |
| Близкие понятия | Регрессия, Регрессионный анализ, Регрессор, Предиктор, Wealth Distribution |
| Среды и средства для освоения понятия | R, J, Python, Snap!, ChatGPT |
Общий вид
Множественная линейная регрессия позволяет одновременно оценить влияние нескольких независимых переменных (предикторов) на зависимую переменную. В отличие от простой регрессии (один предиктор), множественная регрессия учитывает одновременное влияние всех факторов, контролируя эффект остальных переменных.
Базовая модель множественной регрессии имеет вид:
[math]\displaystyle{ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_k X_k + \varepsilon }[/math]
где [math]\displaystyle{ \beta_i }[/math] — параметры регрессии, [math]\displaystyle{ \varepsilon }[/math] — случайная ошибка.
Практический пример с Wealth Distribution
Множественная линейная регрессия: комплексный анализ факторов неравенства в агентной модели Wealth Distribution
- NetLogo Wealth Distribution 07122025 датасет - готовый набор данных для анализа
- https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/data_model_07_12.csv
Уравнение регрессии
[math]\displaystyle{ \text{gini} = \beta_0 + \beta_1 \cdot \text{max.vision} + \beta_2 \cdot \text{percent.best.land} + \beta_3 \cdot \text{metabolism.max} + \beta_4 \cdot \text{grain.growth.interval} + \varepsilon }[/math]
- gini — коэффициент Джини (зависимая переменная, мера неравенства)
- max.vision — максимальная дальность видения агентов (4, 6, 8, 10, 12, 14)
- percent.best.land — процент участков с лучшей почвой (5, 10, 15, 20)
- metabolism.max — максимальный метаболизм агентов (10, 15)
- grain.growth.interval — интервал роста зерна (1-10)
- ε — случайная ошибка (остатки модели)
- β₀, β₁, β₂, β₃, β₄ — коэффициенты регрессии (оцениваемые параметры)
Размер выборки N = 480 наблюдений (475 степеней свободы для остатков + 5 оцениваемых параметров):
- 6 уровней max.vision × 4 уровня percent.best.land × 2 уровня metabolism.max × 10 уровней grain.growth.interval = 480 уникальных комбинаций параметров
