Матрица корреляций

Материал из Поле цифровой дидактики


Описание Матрица корреляций (correlation matrix) — квадратная таблица, отображающая попарные коэффициенты корреляции между множественными переменными в наборе данных. Матрица корреляций предоставляет компактное представление взаимосвязей между переменными и является фундаментальным инструментом в анализе многомерных данных.
Область знаний Математика, Экономика, Статистика
Авторы
Поясняющее видео
Близкие понятия Матрица
Среды и средства для освоения понятия

Математическое представление:

Для набора данных с p переменными матрица корреляций R представляет собой симметричную матрицу размера p × p:

[math]\displaystyle{ R = \begin{bmatrix} 1 & r_{12} & r_{13} & \cdots & r_{1p} \\ r_{21} & 1 & r_{23} & \cdots & r_{2p} \\ r_{31} & r_{32} & 1 & \cdots & r_{3p} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ r_{p1} & r_{p2} & r_{p3} & \cdots & 1 \end{bmatrix} }[/math]

где [math]\displaystyle{ r_{ij} }[/math] — коэффициент корреляции между переменными i и j.

Ключевые свойства матрицы корреляций

Симметричность

Матрица корреляций является симметричной относительно главной диагонали: [math]\displaystyle{ r_{ij} = r_{ji} }[/math]. Это означает, что корреляция между переменной X и переменной Y равна корреляции между Y и X.

Следствие для визуализации: Из-за симметричности достаточно отображать только верхнюю или нижнюю треугольную часть матрицы, что делает визуализацию более компактной и читаемой.

Главная диагональ

Все элементы на главной диагонали равны 1, так как каждая переменная имеет совершенную корреляцию с самой собой: [math]\displaystyle{ r_{ii} = 1 }[/math] для всех i.

Практическое значение: При визуализации и анализе главная диагональ обычно игнорируется или исключается из расчетов, поскольку не несет информации о связях между разными переменными.

Диапазон значений

Все недиагональные элементы матрицы корреляций находятся в диапазоне от −1 до +1: [math]\displaystyle{ -1 \leq r_{ij} \leq 1 }[/math] для [math]\displaystyle{ i \neq j }[/math].

Интерпретация
  • [math]\displaystyle{ r_{ij} \approx +1 }[/math]: сильная положительная корреляция
  • [math]\displaystyle{ r_{ij} \approx 0 }[/math]: отсутствие линейной корреляции
  • [math]\displaystyle{ r_{ij} \approx -1 }[/math]: сильная отрицательная корреляция