QQ Graph: различия между версиями
Patarakin (обсуждение | вклад) Нет описания правки |
Patarakin (обсуждение | вклад) Нет описания правки |
||
| (не показаны 2 промежуточные версии этого же участника) | |||
| Строка 13: | Строка 13: | ||
# Сортировка исходного набора данных в возрастающем порядке | # Сортировка исходного набора данных в возрастающем порядке | ||
# Расчет эмпирических квантилей | # Расчет эмпирических квантилей | ||
<math> | * Эмпирические квантили вычисляются на основе отсортированных данных. Для каждого наблюдения (i) вычисляется вероятность: <math>p_i = \frac{i}{n+1}</math> | ||
p_i = \frac{i}{n+1} | * Теоретические квантили извлекаются из функции, обратной функции распределения (квантиль-функции). Для нормального распределения используется обратная функция стандартного нормального распределения. | ||
</math> | |||
На график добавляется линия тренда (обычно прямая линия), которая проходит через первый и третий квартили эмпирического распределения. | |||
Если два сравниваемых распределения подобны, то точки на QQ графике приблизительно лежат на прямой линии. Это связано с тем, что для идеально совпадающих распределений квантили теоретического и эмпирического распределений должны быть пропорциональны с коэффициентом/ Линейная зависимость вида: <math> | |||
X_{(i)} = \mu + \sigma \cdot q_{\text{теор}}(p_i)</math> | |||
В регрессионном анализе одним из ключевых предположений является нормальность распределения ошибок (остатков). QQ график позволяет визуально оценить это предположение. | |||
# Построить [[регрессионную модель]] | |||
# Вычислить остатки <math>(e_i = Y_i - \hat{Y}_i) </math> | |||
# Построить QQ график для остатков | |||
# Оценить соответствие точек прямой линии | |||
Текущая версия от 14:07, 11 декабря 2025
| Описание | График Квантиль-Квантиль (QQ Graph) График квантиль-квантиль (англ. Quantile-Quantile Plot или Q-Q Plot) — это графический метод статистического анализа, предназначенный для визуального сравнения распределений двух наборов данных путем построения их квантилей. В большинстве случаев QQ график используется для проверки соответствия данных теоретическому (в том числе нормальному) распределению. |
|---|---|
| Область знаний | |
| Область использования (ISTE) | |
| Возрастная категория |
|
| Поясняющее видео | |
| Близкие рецепту понятия | |
| Среды и средства для приготовления рецепта: |
Квантиль — это значение, которое заданная случайная величина не превышает с фиксированной вероятностью alpha. Например:
- 0.25-квантиль (первый квартиль) — значение, ниже которого находится 25% данных
- 0.5-квантиль (медиана) — значение, ниже которого находится 50% данных
- 0.95-квантиль — значение, ниже которого находится 95% данных
QQ график создается по следующему алгоритму:
- Этап 1: Подготовка данных
- Сортировка исходного набора данных в возрастающем порядке
- Расчет эмпирических квантилей
- Эмпирические квантили вычисляются на основе отсортированных данных. Для каждого наблюдения (i) вычисляется вероятность: [math]\displaystyle{ p_i = \frac{i}{n+1} }[/math]
- Теоретические квантили извлекаются из функции, обратной функции распределения (квантиль-функции). Для нормального распределения используется обратная функция стандартного нормального распределения.
На график добавляется линия тренда (обычно прямая линия), которая проходит через первый и третий квартили эмпирического распределения. Если два сравниваемых распределения подобны, то точки на QQ графике приблизительно лежат на прямой линии. Это связано с тем, что для идеально совпадающих распределений квантили теоретического и эмпирического распределений должны быть пропорциональны с коэффициентом/ Линейная зависимость вида: [math]\displaystyle{ X_{(i)} = \mu + \sigma \cdot q_{\text{теор}}(p_i) }[/math]
В регрессионном анализе одним из ключевых предположений является нормальность распределения ошибок (остатков). QQ график позволяет визуально оценить это предположение.
- Построить регрессионную модель
- Вычислить остатки [math]\displaystyle{ (e_i = Y_i - \hat{Y}_i) }[/math]
- Построить QQ график для остатков
- Оценить соответствие точек прямой линии
