Множественная регрессия: различия между версиями
Patarakin (обсуждение | вклад) Нет описания правки |
Patarakin (обсуждение | вклад) |
||
| (не показано 11 промежуточных версий этого же участника) | |||
| Строка 5: | Строка 5: | ||
* какие социальные индикаторы, которые лучше других предсказывают результат адаптации новой иммигрантской группы и степень ее слияния с обществом. | * какие социальные индикаторы, которые лучше других предсказывают результат адаптации новой иммигрантской группы и степень ее слияния с обществом. | ||
Термин "множественная" указывает на наличие нескольких предикторов или регрессоров, которые используются в модели. | Термин "множественная" указывает на наличие нескольких предикторов или регрессоров, которые используются в модели. Множественная линейная регрессия позволяет одновременно оценить влияние нескольких независимых переменных (предикторов) на зависимую переменную. В отличие от простой регрессии (один предиктор), множественная регрессия учитывает одновременное влияние всех факторов, контролируя эффект остальных переменных. | ||
|Field_of_knowledge=Математика, Психология, Социология | |Field_of_knowledge=Математика, Психология, Социология, Экономика | ||
|Clarifying_video=https://www.youtube.com/watch?v=i-Qmi-7M3N4 | |Clarifying_video=https://www.youtube.com/watch?v=i-Qmi-7M3N4 | ||
|similar_concepts=Регрессия, Регрессионный анализ | |similar_concepts=Регрессия, Регрессионный анализ, Регрессор, Предиктор, Wealth Distribution | ||
|Environment=R, J, Python, Snap!, ChatGPT | |Environment=R, J, Python, Snap!, ChatGPT | ||
}} | }} | ||
== Общий вид == | |||
Множественная линейная регрессия позволяет одновременно оценить влияние нескольких независимых переменных (предикторов) на зависимую переменную. В отличие от простой регрессии (один [[предиктор]]), множественная регрессия учитывает одновременное влияние всех факторов, контролируя эффект остальных переменных. | |||
[[ | Базовая модель [[множественная регрессия|множественной регрессии]] имеет вид: | ||
<math>Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_k X_k + \varepsilon</math> | |||
где <math>\beta_i</math> — параметры регрессии, <math>\varepsilon</math> — случайная ошибка. | |||
== Практический пример с [[Wealth Distribution]] == | |||
Множественная линейная регрессия: комплексный анализ факторов неравенства в агентной модели [[Wealth Distribution]] | |||
* '''[[NetLogo Wealth Distribution 07122025]] датасет''' - готовый набор данных для анализа | |||
* https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/data_model_07_12.csv | |||
=== Уравнение регрессии === | |||
<math display="block"> | |||
\text{gini} = \beta_0 + \beta_1 \cdot \text{max.vision} + \beta_2 \cdot \text{percent.best.land} + \beta_3 \cdot \text{metabolism.max} + \beta_4 \cdot \text{grain.growth.interval} + \varepsilon | |||
</math> | |||
* gini — коэффициент Джини (зависимая переменная, мера неравенства) | |||
* max.vision — максимальная дальность видения агентов (4, 6, 8, 10, 12, 14) | |||
* percent.best.land — процент участков с лучшей почвой (5, 10, 15, 20) | |||
* metabolism.max — максимальный метаболизм агентов (10, 15) | |||
* grain.growth.interval — интервал роста зерна (1-10) | |||
* ε — случайная ошибка ([[остатки]] модели) | |||
* β₀, β₁, β₂, β₃, β₄ — коэффициенты регрессии (оцениваемые параметры) | |||
Размер выборки N = 480 наблюдений (475 степеней свободы для остатков + 5 оцениваемых параметров): | |||
* 6 уровней max.vision × 4 уровня percent.best.land × 2 уровня metabolism.max × 10 уровней grain.growth.interval = 480 уникальных комбинаций параметров | |||
Текущая версия от 18:00, 12 декабря 2025
| Описание | Множественной называют линейную регрессию, в модели которой число независимых переменных две или более. В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях. В общем, множественная регрессия позволяет исследователю задать вопрос (и, вероятно, получить ответ) о том, "что является лучшим предиктором для...":
Термин "множественная" указывает на наличие нескольких предикторов или регрессоров, которые используются в модели. Множественная линейная регрессия позволяет одновременно оценить влияние нескольких независимых переменных (предикторов) на зависимую переменную. В отличие от простой регрессии (один предиктор), множественная регрессия учитывает одновременное влияние всех факторов, контролируя эффект остальных переменных. |
|---|---|
| Область знаний | Математика, Психология, Социология, Экономика |
| Авторы | |
| Поясняющее видео | https://www.youtube.com/watch?v=i-Qmi-7M3N4 |
| Близкие понятия | Регрессия, Регрессионный анализ, Регрессор, Предиктор, Wealth Distribution |
| Среды и средства для освоения понятия | R, J, Python, Snap!, ChatGPT |
Общий вид
Множественная линейная регрессия позволяет одновременно оценить влияние нескольких независимых переменных (предикторов) на зависимую переменную. В отличие от простой регрессии (один предиктор), множественная регрессия учитывает одновременное влияние всех факторов, контролируя эффект остальных переменных.
Базовая модель множественной регрессии имеет вид:
[math]\displaystyle{ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_k X_k + \varepsilon }[/math]
где [math]\displaystyle{ \beta_i }[/math] — параметры регрессии, [math]\displaystyle{ \varepsilon }[/math] — случайная ошибка.
Практический пример с Wealth Distribution
Множественная линейная регрессия: комплексный анализ факторов неравенства в агентной модели Wealth Distribution
- NetLogo Wealth Distribution 07122025 датасет - готовый набор данных для анализа
- https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/data_model_07_12.csv
Уравнение регрессии
[math]\displaystyle{ \text{gini} = \beta_0 + \beta_1 \cdot \text{max.vision} + \beta_2 \cdot \text{percent.best.land} + \beta_3 \cdot \text{metabolism.max} + \beta_4 \cdot \text{grain.growth.interval} + \varepsilon }[/math]
- gini — коэффициент Джини (зависимая переменная, мера неравенства)
- max.vision — максимальная дальность видения агентов (4, 6, 8, 10, 12, 14)
- percent.best.land — процент участков с лучшей почвой (5, 10, 15, 20)
- metabolism.max — максимальный метаболизм агентов (10, 15)
- grain.growth.interval — интервал роста зерна (1-10)
- ε — случайная ошибка (остатки модели)
- β₀, β₁, β₂, β₃, β₄ — коэффициенты регрессии (оцениваемые параметры)
Размер выборки N = 480 наблюдений (475 степеней свободы для остатков + 5 оцениваемых параметров):
- 6 уровней max.vision × 4 уровня percent.best.land × 2 уровня metabolism.max × 10 уровней grain.growth.interval = 480 уникальных комбинаций параметров
