Выброс: различия между версиями
Материал из Поле цифровой дидактики
Patarakin (обсуждение | вклад) Нет описания правки |
Patarakin (обсуждение | вклад) Нет описания правки |
||
| Строка 4: | Строка 4: | ||
|Environment=Boxplot, StatKey | |Environment=Boxplot, StatKey | ||
}} | }} | ||
'''Правило большого остатка:''' стандартизованный остаток считается большим (потенциальный [[выброс]]), если <math>|e_i^{\text{std}}| > 3</math>. | '''Правило большого остатка:''' стандартизованный [[остаток]] считается большим (потенциальный [[выброс]]), если <math>|e_i^{\text{std}}| > 3</math>. | ||
'''Расстояние Кука''' (Cook's distance) определяет, насколько '''влиятельное''' наблюдение — насколько его удаление изменит коэффициенты регрессии: | '''Расстояние Кука''' (Cook's distance) определяет, насколько '''влиятельное''' наблюдение — насколько его удаление изменит коэффициенты регрессии: | ||
Текущая версия от 18:22, 26 декабря 2025
| Описание | Выброс — это наблюдение, значение которого заметно отличается от остальных данных. Выброс может привести к большому остатку, но не всегда. |
|---|---|
| Область знаний | Статистика |
| Авторы | |
| Поясняющее видео | |
| Близкие понятия | |
| Среды и средства для освоения понятия | Boxplot, StatKey |
Правило большого остатка: стандартизованный остаток считается большим (потенциальный выброс), если [math]\displaystyle{ |e_i^{\text{std}}| \gt 3 }[/math].
Расстояние Кука (Cook's distance) определяет, насколько влиятельное наблюдение — насколько его удаление изменит коэффициенты регрессии:
[math]\displaystyle{ D_i = \frac{e_i^2}{p \cdot \text{MSE}} \cdot \frac{h_i}{(1 - h_i)} }[/math]
где:
- [math]\displaystyle{ p }[/math] — количество параметров модели
- [math]\displaystyle{ h_i }[/math] — leverage («рычаг» наблюдения)
Правило: если [math]\displaystyle{ D_i \gt \frac{4}{n} }[/math], наблюдение считается влиятельным и требует внимания.
