Мультиколлинеарность

Материал из Поле цифровой дидактики


Описание Мультиколлинеарность в эконометрике — это ситуация, когда одна или несколько независимых переменных регрессионной модели являются линейно зависимыми или сильно коррелированными между собой. Такой эффект затрудняет оценку индивидуального влияния каждой переменной на зависимую и приводит к неустойчивым, высоко варьирующимся коэффициентам и завышенным стандартным ошибкам. Мультиколлинеарность — важное свойство, которое необходимо учитывать при построении эконометрических моделей на основе данных из агентных моделей NetLogo, чтобы избежать ошибочной интерпретации значимости переменных и нестабильных оценок коэффициентов.
Область знаний Экономика, Статистика, Моделирование
Авторы
Поясняющее видео
Близкие понятия
Среды и средства для освоения понятия Economic Disparity

Мультиколлинеарность в эконометрике — это ситуация, когда одна или несколько независимых переменных регрессионной модели являются линейно зависимыми или сильно коррелированными между собой. Такой эффект затрудняет оценку индивидуального влияния каждой переменной на зависимую и приводит к неустойчивым, высоко варьирующимся коэффициентам и завышенным стандартным ошибкам.

Формально, если в модели

[math]\displaystyle{ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_k X_k + \varepsilon, }[/math]

то мультиколлинеарность возникает, если для некоторых $$j \neq m$$ существует приближенная линейная связь:

[math]\displaystyle{ X_j \approx \gamma_0 + \gamma_1 X_1 + \cdots + \gamma_{j-1} X_{j-1} + \gamma_{j+1} X_{j+1} + \cdots + \gamma_k X_k. }[/math]


Пример из модели «Экономическое неравенство» (Economic Disparity)

В данной модели цена (price) и качество (quality) земельных участков связаны почти тождественно — изменения качества синхронно отражаются в цене:

[math]\displaystyle{ P_{i,t} \approx Q_{i,t}, }[/math]

что формирует сильную корреляцию между этими переменными. Если включить одновременно и цену, и качество как независимые переменные в регрессию, то возникнет мультиколлинеарность.

1. **В модели сегрегации Шеллинга (Schelling Segregation)** Если параметры, оценивающие похожесть соседей и их долю, сильно коррелируют, например:

[math]\displaystyle{ S_1(i) = \frac{\#\{\text{своих соседей}\}}{\#\{\text{всех соседей}\}}, \quad S_2(i) = \text{доля соседей определённого типа}, }[/math]

то это вызывает мультиколлинеарность при попытке включить обе переменные в одну модель.


Таким образом, мультиколлинеарность — важное свойство, которое необходимо учитывать при построении эконометрических моделей на основе данных из агентных моделей NetLogo, чтобы избежать ошибочной интерпретации значимости переменных и нестабильных оценок коэффициентов.

Пример из модели «Экономическое неравенство» (Economic Disparity)

В данной модели цена (price) и качество (quality) земельных участков связаны почти тождественно — изменения качества синхронно отражаются в цене:

[math]\displaystyle{ P_{i,t} \approx Q_{i,t}, }[/math]

что формирует сильную корреляцию между этими переменными. Если включить одновременно и цену, и качество как независимые переменные в регрессию, то возникнет мультиколлинеарность.


Другие примеры из моделей NetLogo

В модели сегрегации Шеллинга Segregation (model) Если параметры, оценивающие похожесть соседей и их долю, сильно коррелируют, например:

[math]\displaystyle{ S_1(i) = \frac{\#\{\text{своих соседей}\}}{\#\{\text{всех соседей}\}}, \quad S_2(i) = \text{доля соседей определённого типа}, }[/math]

то это вызывает мультиколлинеарность при попытке включить обе переменные в одну модель.