QQ Graph

Материал из Поле цифровой дидактики
Описание График Квантиль-Квантиль (QQ Graph) График квантиль-квантиль (англ. Quantile-Quantile Plot или Q-Q Plot) — это графический метод статистического анализа, предназначенный для визуального сравнения распределений двух наборов данных путем построения их квантилей. В большинстве случаев QQ график используется для проверки соответствия данных теоретическому (в том числе нормальному) распределению.
Область знаний
Область использования (ISTE)
Возрастная категория


Поясняющее видео
Близкие рецепту понятия
Среды и средства для приготовления рецепта:

Квантиль — это значение, которое заданная случайная величина не превышает с фиксированной вероятностью alpha. Например:

  • 0.25-квантиль (первый квартиль) — значение, ниже которого находится 25% данных
  • 0.5-квантиль (медиана) — значение, ниже которого находится 50% данных
  • 0.95-квантиль — значение, ниже которого находится 95% данных

QQ график создается по следующему алгоритму:

      1. Этап 1: Подготовка данных
  1. Сортировка исходного набора данных в возрастающем порядке
  2. Расчет эмпирических квантилей
  • Эмпирические квантили вычисляются на основе отсортированных данных. Для каждого наблюдения (i) вычисляется вероятность: [math]\displaystyle{ p_i = \frac{i}{n+1} }[/math]
  • Теоретические квантили извлекаются из функции, обратной функции распределения (квантиль-функции). Для нормального распределения используется обратная функция стандартного нормального распределения.

На график добавляется линия тренда (обычно прямая линия), которая проходит через первый и третий квартили эмпирического распределения. Если два сравниваемых распределения подобны, то точки на QQ графике приблизительно лежат на прямой линии. Это связано с тем, что для идеально совпадающих распределений квантили теоретического и эмпирического распределений должны быть пропорциональны с коэффициентом/ Линейная зависимость вида: [math]\displaystyle{ X_{(i)} = \mu + \sigma \cdot q_{\text{теор}}(p_i) }[/math]

В регрессионном анализе одним из ключевых предположений является нормальность распределения ошибок (остатков). QQ график позволяет визуально оценить это предположение.

  1. Построить регрессионную модель
  2. Вычислить остатки [math]\displaystyle{ (e_i = Y_i - \hat{Y}_i) }[/math]
  3. Построить QQ график для остатков
  4. Оценить соответствие точек прямой линии