Выброс
Материал из Поле цифровой дидактики
| Описание | Выброс — это наблюдение, значение которого заметно отличается от остальных данных. Выброс может привести к большому остатку, но не всегда. |
|---|---|
| Область знаний | Статистика |
| Авторы | |
| Поясняющее видео | |
| Близкие понятия | |
| Среды и средства для освоения понятия | Boxplot, StatKey |
Правило большого остатка: стандартизованный остаток считается большим (потенциальный выброс), если [math]\displaystyle{ |e_i^{\text{std}}| \gt 3 }[/math].
Расстояние Кука (Cook's distance) определяет, насколько влиятельное наблюдение — насколько его удаление изменит коэффициенты регрессии:
[math]\displaystyle{ D_i = \frac{e_i^2}{p \cdot \text{MSE}} \cdot \frac{h_i}{(1 - h_i)} }[/math]
где:
- [math]\displaystyle{ p }[/math] — количество параметров модели
- [math]\displaystyle{ h_i }[/math] — leverage («рычаг» наблюдения)
Правило: если [math]\displaystyle{ D_i \gt \frac{4}{n} }[/math], наблюдение считается влиятельным и требует внимания.
