QQ Graph
| Описание | График Квантиль-Квантиль (QQ Graph) График квантиль-квантиль (англ. Quantile-Quantile Plot или Q-Q Plot) — это графический метод статистического анализа, предназначенный для визуального сравнения распределений двух наборов данных путем построения их квантилей. В большинстве случаев QQ график используется для проверки соответствия данных теоретическому (в том числе нормальному) распределению. |
|---|---|
| Область знаний | |
| Область использования (ISTE) | |
| Возрастная категория |
|
| Поясняющее видео | |
| Близкие рецепту понятия | |
| Среды и средства для приготовления рецепта: |
Квантиль — это значение, которое заданная случайная величина не превышает с фиксированной вероятностью alpha. Например:
- 0.25-квантиль (первый квартиль) — значение, ниже которого находится 25% данных
- 0.5-квантиль (медиана) — значение, ниже которого находится 50% данных
- 0.95-квантиль — значение, ниже которого находится 95% данных
QQ график создается по следующему алгоритму:
- Этап 1: Подготовка данных
- Сортировка исходного набора данных в возрастающем порядке
- Расчет эмпирических квантилей
- Эмпирические квантили вычисляются на основе отсортированных данных. Для каждого наблюдения (i) вычисляется вероятность: [math]\displaystyle{ p_i = \frac{i}{n+1} }[/math]
- Теоретические квантили извлекаются из функции, обратной функции распределения (квантиль-функции). Для нормального распределения используется обратная функция стандартного нормального распределения.
На график добавляется линия тренда (обычно прямая линия), которая проходит через первый и третий квартили эмпирического распределения. Если два сравниваемых распределения подобны, то точки на QQ графике приблизительно лежат на прямой линии. Это связано с тем, что для идеально совпадающих распределений квантили теоретического и эмпирического распределений должны быть пропорциональны с коэффициентом/ Линейная зависимость вида: [math]\displaystyle{ X_{(i)} = \mu + \sigma \cdot q_{\text{теор}}(p_i) }[/math]
В регрессионном анализе одним из ключевых предположений является нормальность распределения ошибок (остатков). QQ график позволяет визуально оценить это предположение.
- Построить регрессионную модель
- Вычислить остатки [math]\displaystyle{ (e_i = Y_i - \hat{Y}_i) }[/math]
- Построить QQ график для остатков
- Оценить соответствие точек прямой линии
