Множественная регрессия

Материал из Поле цифровой дидактики


Описание Множественной называют линейную регрессию, в модели которой число независимых переменных две или более. В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях. В общем, множественная регрессия позволяет исследователю задать вопрос (и, вероятно, получить ответ) о том, "что является лучшим предиктором для...":
  • какие факторы являются лучшими предикторами успешной учебы в средней школе
  • какие индивидуальные качества позволяют лучше предсказать степень социальной адаптации индивида. Социологи, вероятно, хотели бы найти те
  • какие социальные индикаторы, которые лучше других предсказывают результат адаптации новой иммигрантской группы и степень ее слияния с обществом.

Термин "множественная" указывает на наличие нескольких предикторов или регрессоров, которые используются в модели. Множественная линейная регрессия позволяет одновременно оценить влияние нескольких независимых переменных (предикторов) на зависимую переменную. В отличие от простой регрессии (один предиктор), множественная регрессия учитывает одновременное влияние всех факторов, контролируя эффект остальных переменных.

Область знаний Математика, Психология, Социология, Экономика
Авторы
Поясняющее видео https://www.youtube.com/watch?v=i-Qmi-7M3N4
Близкие понятия Регрессия, Регрессионный анализ, Регрессор, Предиктор, Wealth Distribution
Среды и средства для освоения понятия R, J, Python, Snap!, ChatGPT


Общий вид

Множественная линейная регрессия позволяет одновременно оценить влияние нескольких независимых переменных (предикторов) на зависимую переменную. В отличие от простой регрессии (один предиктор), множественная регрессия учитывает одновременное влияние всех факторов, контролируя эффект остальных переменных.

Базовая модель множественной регрессии имеет вид:

[math]\displaystyle{ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_k X_k + \varepsilon }[/math]

где [math]\displaystyle{ \beta_i }[/math] — параметры регрессии, [math]\displaystyle{ \varepsilon }[/math] — случайная ошибка.

Практический пример с Wealth Distribution

Множественная линейная регрессия: комплексный анализ факторов неравенства в агентной модели Wealth Distribution


Уравнение регрессии

[math]\displaystyle{ \text{gini} = \beta_0 + \beta_1 \cdot \text{max.vision} + \beta_2 \cdot \text{percent.best.land} + \beta_3 \cdot \text{metabolism.max} + \beta_4 \cdot \text{grain.growth.interval} + \varepsilon }[/math]

  • gini — коэффициент Джини (зависимая переменная, мера неравенства)
  • max.vision — максимальная дальность видения агентов (4, 6, 8, 10, 12, 14)
  • percent.best.land — процент участков с лучшей почвой (5, 10, 15, 20)
  • metabolism.max — максимальный метаболизм агентов (10, 15)
  • grain.growth.interval — интервал роста зерна (1-10)
  • ε — случайная ошибка (остатки модели)
  • β₀, β₁, β₂, β₃, β₄ — коэффициенты регрессии (оцениваемые параметры)

Размер выборки N = 480 наблюдений (475 степеней свободы для остатков + 5 оцениваемых параметров):

  • 6 уровней max.vision × 4 уровня percent.best.land × 2 уровня metabolism.max × 10 уровней grain.growth.interval = 480 уникальных комбинаций параметров