Обсуждение:StatKey
StatKey Results Glossary: Интерпретация результатов статистического анализа
Этот шаблон содержит определения, интерпретацию и примеры для результатов, которые выдаёт StatKey при анализе данных.
📊 РАЗДЕЛ 1: ОПИСАТЕЛЬНАЯ СТАТИСТИКА
Mean (Среднее)
Определение: Сумма всех значений, делённая на количество наблюдений.
[math]\displaystyle{ \bar{X} = \frac{\sum_{i=1}^{n} X_i}{n} }[/math]
Интерпретация: Центральное значение. Говорит, где находится "центр тяжести" данных.
Пример из Teacher Satisfaction:
- mean-satisfaction-all = 0.546 → Средняя удовлетворенность учителей 54.6%
- Sch_Quality_Variation = 0.400 → В среднем вариация качества школ 40%
Когда использовать: Всегда, как первый показатель распределения.
Когда осторожно: Если есть выбросы, среднее может быть искажено (используйте медиану).
---
Median (Медиана)
Определение: Значение, которое делит упорядоченный набор данных пополам (50-й перцентиль).
Интерпретация: "Середина" данных. 50% значений ниже медианы, 50% выше.
Пример:
- median = 0.547 → 50% учителей имеют удовлетворенность < 54.7%, 50% > 54.7%
Когда использовать: Если распределение не нормально или есть выбросы.
Сравнение Mean vs Median: ``` Если mean ≈ median → распределение симметричное Если mean >> median → выбросы в верхней части (асимметрия вправо) Если mean << median → выбросы в нижней части (асимметрия влево) ```
Ваш пример: mean = 0.546, median = 0.547 → почти равны → распределение примерно симметрично
---
Standard Deviation (Стандартное отклонение)
Определение: Мера вариабельности. Среднее расстояние от каждого значения до среднего.
[math]\displaystyle{ s = \sqrt{\frac{\sum_{i=1}^{n} (X_i - \bar{X})^2}{n-1}} }[/math]
Интерпретация:
- Маленькое стандартное отклонение → данные плотно сгруппированы вокруг среднего
- Большое стандартное отклонение → данные разбросаны
Правило 68-95-99.7 (для нормального распределения):
- В диапазоне mean ± 1×stdev находится ~68% данных
- В диапазоне mean ± 2×stdev находится ~95% данных
- В диапазоне mean ± 3×stdev находится ~99.7% данных
Ваш пример:
- mean-satisfaction = 0.546, stdev = 0.038
- Диапазон (mean ± stdev) = [0.508, 0.584] содержит ~68% учителей
Когда использовать: Для оценки разброса и для построения доверительных интервалов.
---
Sample Size (Размер выборки, n)
Определение: Количество наблюдений в датасете.
Интерпретация:
- Большой n → более надежные результаты, узкие доверительные интервалы
- Маленький n → менее надежные результаты, широкие доверительные интервалы
Математическая зависимость: [math]\displaystyle{ \text{Стандартная ошибка} = \frac{\text{stdev}}{\sqrt{n}} }[/math]
Если увеличить n в 4 раза → стандартная ошибка уменьшится в 2 раза!
Ваш пример: n = 1250 → большая выборка → надежные результаты ✓
Минимальный размер выборки:
- Для бутстрэпа: n ≥ 30
- Для хороших результатов: n ≥ 100
- Для очень надежных результатов: n ≥ 1000
---
📈 РАЗДЕЛ 2: ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ
Confidence Interval (95% CI)
Определение: Диапазон значений, который с вероятностью 95% содержит истинный параметр генеральной совокупности.
[math]\displaystyle{ CI = \text{Estimate} \pm z_{\alpha/2} \times \text{SE} }[/math]
где SE = стандартная ошибка.
Интерпретация: Если повторить эксперимент 100 раз и построить CI для каждого, примерно 95 из них будут содержать истинное значение.
Что НЕ означает: "Вероятность того, что параметр в интервале — 95%" (параметр — константа, не случайная величина)
Пример из вашего анализа:
- Исходное среднее: mean = 0.546
- 95% CI (примерный): [0.544, 0.548]
- Интерпретация: Истинная средняя удовлетворенность находится между 54.4% и 54.8%
Узкий vs широкий интервал: ``` Узкий CI [0.544, 0.548] → высокая точность ✓ Широкий CI [0.500, 0.600] → низкая точность ✗
Ширина зависит от: - Размера выборки (больше n → уже интервал) - Стандартного отклонения (больше stdev → шире интервал) - Уровня доверия (99% интервал шире 95%) ```
Когда использовать: Всегда вместо точечной оценки. Интервалы информативнее!
---
Bootstrap Confidence Interval
Определение: Доверительный интервал, построенный методом бутстрэп (переборка с возвращением).
Как это работает: 1. Берете исходную выборку размером n 2. Генерируете B новых выборок (обычно B=1000 или 5000) путём переборки с возвращением 3. Для каждой выборки вычисляете статистику (среднее, медиану, корреляцию и т.д.) 4. Сортируете B статистик и берёте 2.5% и 97.5% перцентили
Преимущества бутстрэпа:
- Работает для любой статистики (не только для среднего!)
- Не требует предположения о нормальности
- Видно истинное распределение, не теоретическое
Пример:
- Загрузили 1250 значений удовлетворенности
- Сгенерировали 1000 бутстрэп-выборок
- Для каждой вычислили среднее
- Получили распределение 1000 средних
- 95% CI = [0.544, 0.548]
StatKey показывает:
- Dotplot с 1000 точек (бутстрэп-статистик)
- Красные линии на 2.5% и 97.5% перцентилях
- Числовые значения CI в таблице результатов
---
🔗 РАЗДЕЛ 3: СВЯЗЬ МЕЖДУ ПЕРЕМЕННЫМИ
Correlation (Коэффициент корреляции Пирсона)
Определение: Мера линейной связи между двумя количественными переменными.
[math]\displaystyle{ r = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sqrt{\sum (X_i - \bar{X})^2 \sum (Y_i - \bar{Y})^2}} }[/math]
Диапазон: от -1 до +1
Интерпретация:
| r | Интерпретация | Пример |
|---|---|---|
| 0.9–1.0 | Очень сильная положительная | Рост и вес (почти всегда выше люди тяжелее) |
| 0.7–0.9 | Сильная положительная | Sch_Quality_Variation vs mean-satisfaction (r=0.807) ✓ |
| 0.5–0.7 | Умеренная положительная | Образование и доход |
| 0.3–0.5 | Слабая положительная | Упражнения и долголетие |
| 0.1–0.3 | Очень слабая положительная | Практически нет видимой связи |
| ±0.05 | Почти нет связи | academic-mobility-radius vs mean-satisfaction (r=0.00026) ✗ |
| -0.1–-0.3 | Очень слабая отрицательная | Практически нет видимой связи |
| -0.5–-0.7 | Умеренная отрицательная | Цена и спрос |
| -0.7–-0.9 | Сильная отрицательная | Курение и здоровье |
| -0.9–-1.0 | Очень сильная отрицательная | X и (100-X) |
Что корреляция НЕ показывает:
- Она не показывает причину и следствие!
- r = 0.8 между A и B НЕ означает, что A вызывает B
Ваши примеры: ``` academic-mobility-radius vs mean-satisfaction: r = 0.00026 ❌ Нет связи academic-mobility-radius vs teacher-turnover-rate: r = -0.039 ❌ Нет связи Sch_Quality_Variation vs mean-satisfaction-all: r = 0.807 ✓ Сильная связь! ```
Когда использовать: Для быстрой оценки связи между двумя переменными.
---
Slope (Коэффициент наклона в регрессии)
Определение: Коэффициент при независимой переменной в линейной регрессии.
[math]\displaystyle{ Y = \text{Intercept} + \text{Slope} \times X }[/math]
Интерпретация: На каждое увеличение X на 1 единицу, Y изменяется на Slope единиц.
Ваш пример: ``` mean-satisfaction = 0.51 + 0.266 × Sch_Quality_Variation
Slope = 0.266 означает: Если Sch_Quality_Variation увеличится на 0.1 (с 0.3 на 0.4):
ΔY = 0.266 × 0.1 = 0.0266 mean-satisfaction вырастет на 2.66 процентных пункта
```
Пример расчёта: ``` При Sch_Quality_Variation = 0.3:
Y = 0.51 + 0.266 × 0.3 = 0.51 + 0.0798 = 0.5898 ≈ 59%
При Sch_Quality_Variation = 0.5:
Y = 0.51 + 0.266 × 0.5 = 0.51 + 0.1330 = 0.643 ≈ 64.3%
Разница: 64.3% - 59% = 5.3 процентных пункта ```
Знак Slope:
- Slope > 0 → положительная связь (X растет → Y растет)
- Slope < 0 → отрицательная связь (X растет → Y падает)
- Slope ≈ 0 → почти нет связи
Связь с Correlation: [math]\displaystyle{ \text{Slope} = r \times \frac{\text{stdev}_Y}{\text{stdev}_X} }[/math]
Если r = 0, то Slope = 0. Если r большой, то Slope больше (при равных стандартных отклонениях).
Когда использовать: Для предсказания и для понимания размера эффекта.
---
Intercept (Пересечение с осью Y)
Определение: Значение Y, когда X = 0.
[math]\displaystyle{ Y = \text{Intercept} + \text{Slope} \times X }[/math]
Интерпретация: Базовое значение зависимой переменной при нулевом значении независимой.
Ваш пример: ``` mean-satisfaction = 0.51 + 0.266 × Sch_Quality_Variation
↑
Intercept = 0.51
Если Sch_Quality_Variation = 0:
mean-satisfaction = 0.51 = 51%
Это означает: базовая удовлетворенность (без вариации качества) = 51% ```
Когда использовать: Интерпретируйте только если X = 0 имеет смысл!
Пример осторожности:
- Если X = "возраст учителя" (диапазон 25–65 лет)
- Intercept = значение при возрасте 0 (это не имеет смысла!)
---
🎲 РАЗДЕЛ 4: ПРОВЕРКА ГИПОТЕЗ
P-value
Определение: Вероятность получить наблюдаемые данные (или более экстремальные), если нулевая гипотеза верна.
Интерпретация:
- p < 0.05 → результат статистически значим (отвергаем H₀)
- p ≥ 0.05 → результат статистически не значим (не отвергаем H₀)
Что НЕ означает p-value:
- p = 0.03 НЕ означает "вероятность того, что результат верный — 97%"
- p-value говорит о данных, ДАНных нулевую гипотезу, а не о правильности гипотезы
Пример: ``` Нулевая гипотеза H₀: "Корреляция между Sch_Quality_Variation и
mean-satisfaction = 0 (нет связи)"
Если p < 0.0001 → очень маловероятно, что такая сильная корреляция
возникла случайно → отвергаем H₀ → связь значима!
```
Интерпретация p-value в StatKey: ``` p < 0.001 → очень сильное свидетельство ✓✓✓ p < 0.01 → сильное свидетельство ✓✓ p < 0.05 → умеренное свидетельство ✓ p ≥ 0.05 → нет свидетельства ✗ ```
---
Test Statistic (Тестовая статистика)
Определение: Число, используемое для проверки гипотезы.
Зависит от типа теста:
- t-тест → t-statistic
- Корреляция → z-statistic или t-statistic
- Пропорции → z-statistic
- Хи-квадрат → χ²-statistic
Интерпретация: Чем больше абсолютное значение, тем меньше p-value, тем сильнее свидетельство против H₀.
Пример: ``` Если t = 25.5, это очень большое значение → p-value будет очень маленькой Если t = 0.5, это маленькое значение → p-value будет большой ```
---
📊 РАЗДЕЛ 5: СРАВНЕНИЕ ГРУПП
Difference in Means (Разность средних)
Определение: Разность средних значений двух групп.
[math]\displaystyle{ \text{Difference} = \bar{X}_1 - \bar{X}_2 }[/math]
Интерпретация: Насколько одна группа отличается от другой.
Ваш пример (гипотетический): ``` Группа 1 (radius = 5): mean = 0.550 Группа 2 (radius = 50): mean = 0.620 Разность = 0.620 - 0.550 = 0.070 = 7.0 процентных пункта
Интерпретация: Учителя с высокой мобильностью на 7% более довольны ```
Доверительный интервал для разности: ``` 95% CI для разности = [0.05, 0.12]
Интерпретация: - Минимальное увеличение = 5 процентных пункта - Максимальное увеличение = 12 процентных пункта - Мы 95% уверены в этом диапазоне ```
Правило значимости: ``` Если 95% CI для разности НЕ включает 0:
[0.05, 0.12] → разность ЗНАЧИМА ✓ [-0.02, 0.10] → разность НЕ значима ✗ (включает 0)
```
---
Standard Error (Стандартная ошибка)
Определение: Стандартное отклонение выборочного распределения статистики.
[math]\displaystyle{ SE = \frac{s}{\sqrt{n}} }[/math]
Интерпретация: Насколько надежна наша оценка. Маленькая SE → надежная оценка.
Ваш пример: ``` mean-satisfaction = 0.546 SE = 0.0011
Интерпретация: Если повторить эксперимент много раз, среднее будет варьироваться с стандартным отклонением 0.0011
Это очень маленькое число → оценка очень надежна! ```
Связь с размером выборки: ``` SE ∝ 1/√n
Если увеличить n в 4 раза → SE уменьшится в 2 раза Если увеличить n в 100 раз → SE уменьшится в 10 раз ```
---
📈 РАЗДЕЛ 6: ИНТЕРПРЕТАЦИОННЫЕ ТАБЛИЦЫ
Таблица 1: Интерпретация корреляции
| Корреляция (r) | Интерпретация | Пример | Статус |
|---|---|---|---|
| 0.9–1.0 | Очень сильная положительная | Рост и вес | ✓✓✓ |
| 0.7–0.9 | Сильная положительная | Качество школ и удовлетворенность | ✓✓✓ |
| 0.5–0.7 | Умеренная положительная | Образование и доход | ✓✓ |
| 0.3–0.5 | Слабая положительная | Физическая активность и здоровье | ✓ |
| 0.1–0.3 | Очень слабая положительная | Цвет машины и цена | ≈ |
| ±0.05 | Практически нет связи | Мобильность и удовлетворенность | ✗ |
| -0.1–-0.3 | Очень слабая отрицательная | Цвет одежды и рост | ≈ |
| -0.3–-0.5 | Слабая отрицательная | Упражнения и вес | ✓ |
| -0.5–-0.7 | Умеренная отрицательная | Цена и спрос | ✓✓ |
| -0.7–-0.9 | Сильная отрицательная | Курение и здоровье | ✓✓✓ |
| -0.9–-1.0 | Очень сильная отрицательная | X и (100-X) | ✓✓✓ |
---
Таблица 2: Интерпретация размера выборки
| n (размер) | Оценка | Доверительность | Когда использовать |
|---|---|---|---|
| n < 30 | Ненадежная | Низкая | Только пилотные исследования |
| 30 ≤ n < 100 | Приемлемая | Средняя | Разведочный анализ |
| 100 ≤ n < 500 | Хорошая | Хорошая | Обычные исследования |
| 500 ≤ n < 1000 | Очень хорошая | Высокая | Важные исследования |
| n ≥ 1000 | Отличная | Очень высокая | Критические решения ✓ |
Ваш случай: n = 1250 → отличная оценка ✓
---
Таблица 3: Доверительные интервалы — руководство по интерпретации
| Сценарий | CI | Интерпретация | Действие |
|---|---|---|---|
| Узкий интервал | [0.544, 0.548] | Высокая точность, стабильная система | ✓ Рекомендуется |
| Средний интервал | [0.530, 0.562] | Умеренная точность | Считается приемлемо |
| Широкий интервал | [0.400, 0.700] | Низкая точность, неопределённость | ✗ Нужно больше данных |
| Интервал включает 0 | [-0.02, 0.08] | Эффект может быть ≤ 0 | ✗ Не значим |
| Интервал не включает 0 | [0.05, 0.12] | Эффект определённо > 0 | ✓ Значим |
---
Таблица 4: Сравнение вашего исследования
| Переменная (X) | Переменная (Y) | Корреляция | Интерпретация | Вывод |
|---|---|---|---|---|
| academic-mobility-radius | mean-satisfaction-all | 0.00026 | Практически нет связи | ✗ Не влияет |
| academic-mobility-radius | teacher-turnover-rate | -0.039 | Практически нет связи | ✗ Не влияет |
| Sch_Quality_Variation | mean-satisfaction-all | 0.807 | Сильная положительная | ✓ Сильно влияет! |
---
🎓 РАЗДЕЛ 7: ПРИМЕРЫ ИНТЕРПРЕТАЦИИ
Пример 1: Анализ mean-satisfaction (одна переменная)
Результаты StatKey: ``` Variable: mean-satisfaction-all Mean = 0.546 Median = 0.547 Std Dev = 0.038 Sample Size = 1250 95% Bootstrap CI = [0.544, 0.548] ```
Интерпретация:
1. Среднее и медиана (0.546 ≈ 0.547): Распределение симметричное, нет выбросов 2. Стандартное отклонение (0.038): Удовлетворенность варьируется примерно ±3.8 процентных пункта 3. Размер выборки (1250): Большая выборка, надежные результаты 4. 95% CI ([0.544, 0.548]): Узкий интервал → система стабильна
Вывод для политики: > "Удовлетворенность учителей стабильна на уровне 54.6% (между 54.4% и 54.8%). Это означает, что система предсказуема, но удовлетворенность низкая — нужны реформы."
---
Пример 2: Сравнение двух групп (гипотетический)
Результаты StatKey: ``` Group 1 (radius = 5): n = 625, mean = 0.550 Group 2 (radius = 50): n = 625, mean = 0.620 Difference = 0.070 95% Bootstrap CI for Difference = [0.050, 0.090] ```
Интерпретация:
1. Разность средних (0.070 = 7%): Группа 2 на 7 процентных пункта выше 2. Доверительный интервал ([0.050, 0.090]): Интервал НЕ включает 0 → разность ЗНАЧИМА 3. Минимальный эффект (5%): Даже в худшем сценарии эффект есть 4. Максимальный эффект (9%): В лучшем сценарии эффект больше
Вывод для политики: > "Увеличение радиуса мобильности с 5 км на 50 км увеличивает удовлетворенность на 5–9 процентных пункта. Эффект значим и надежен."
---
Пример 3: Корреляционный анализ (ваш реальный пример)
Результаты StatKey: ``` Variable 1: Sch_Quality_Variation (Mean = 0.400, SD = 0.224) Variable 2: mean-satisfaction-all (Mean = 0.616, SD = 0.074) Sample Size = 1000
Correlation = 0.807 Slope = 0.266 Intercept = 0.51 ```
Интерпретация:
1. Корреляция (r = 0.807): СИЛЬНАЯ положительная связь → качество школ сильно влияет на удовлетворенность 2. Наклон (0.266): На каждое увеличение качества на 0.1 (10%), удовлетворенность растет на 2.66% 3. Перехват (0.51): Базовая удовлетворенность (если нет вариации качества) = 51%
Пример расчёта: ``` При Sch_Quality_Variation = 0.3:
Y = 0.51 + 0.266 × 0.3 = 0.590 (59.0%)
При Sch_Quality_Variation = 0.6:
Y = 0.51 + 0.266 × 0.6 = 0.670 (67.0%)
Эффект: от 59% до 67% = 8 процентных пункта! ```
Вывод для политики: > "Качество школ — главный рычаг системы (r = 0.807). Если мы увеличим вариацию качества школ (одни хорошие, другие плохие), удовлетворенность учителей вырастет. Это странный результат, но он надежен."
---
📋 РАЗДЕЛ 8: ЧЕК-ЛИСТ ИНТЕРПРЕТАЦИИ
При анализе одной переменной
Сделайте эти проверки:
- [ ] Mean vs Median: Они близки? Если нет → есть выбросы или асимметрия - [ ] Standard Deviation: Мало (< 0.1 от mean) или много (> 0.3 от mean)? - [ ] Sample Size: n ≥ 100? Если нет → результаты ненадежны - [ ] 95% CI: Узкий или широкий? Узкий → стабильно, широкий → неопределённость - [ ] Скос распределения: Посмотрите на гистограмму (есть ли выбросы?)
---
При анализе двух переменных
Сделайте эти проверки:
- [ ] Correlation: |r| > 0.3? Если нет → связи нет, stop здесь - [ ] Slope: Положительный или отрицательный? Соответствует интуиции? - [ ] Intercept: Имеет ли смысл при X = 0? - [ ] Sample Size: n ≥ 100? Если нет → результаты ненадежны - [ ] 95% CI для slope: Включает ли 0? Если да → не значим
---
При сравнении групп
Сделайте эти проверки:
- [ ] Means по группам: Визуально разные? - [ ] Sizes по группам: Примерно одинаковые? - [ ] Difference: На сколько процентов отличаются? - [ ] 95% CI для разности: Включает ли 0? Если нет → значимо! - [ ] Effect size: Маленький (< 2%), средний (2–5%), большой (> 5%)?
---
📚 РАЗДЕЛ 9: ЧАСТЫЕ ОШИБКИ ИНТЕРПРЕТАЦИИ
Ошибка 1: Путаница Mean и Median
Неправильно: "Медиана = среднее значение" (это правда только в синониме)
Правильно: "Медиана = 50-й перцентиль = значение, которое делит данные пополам"
---
Ошибка 2: Интерпретация p-value
Неправильно: "p = 0.03 означает, что гипотеза верна на 97%"
Правильно: "p = 0.03 означает, что если нулевая гипотеза верна, данные такие или более экстремальные появляются в 3% случаев"
---
Ошибка 3: Корреляция = причинность
Неправильно: "r = 0.8 между X и Y означает, что X вызывает Y"
Правильно: "r = 0.8 означает, что X и Y сильно связаны, но причина может быть обратной, третьей переменной или совпадением"
---
Ошибка 4: Игнорирование размера выборки
Неправильно: "n = 20, но среднее = 100, значит все значения ≈ 100"
Правильно: "n = 20 маленькая выборка, доверительный интервал будет очень широким"
---
Ошибка 5: Интерпретация интервала вероятностно
Неправильно: "95% CI [0.544, 0.548] означает вероятность 95%, что истинное значение в интервале"
Правильно: "95% CI означает, что если повторить эксперимент 100 раз, примерно 95 интервалов будут содержать истинное значение"
---
🔗 РАЗДЕЛ 10: ССЫЛКИ И ДОПОЛНИТЕЛЬНЫЕ РЕСУРСЫ
- Bootstrap — подробное объяснение метода бутстрэпа
- Confidence_Interval — полная статья о доверительных интервалах
- Central_Limit_Theorem — теоретическая основа для интервалов
- StatKey — инструмент для анализа
- Teacher_Satisfaction_(model) — пример применения в моделировании
📺 ВИДЕО-РЕСУРСЫ
- Lock5 Textbook Videos: https://www.lock5stat.com/videos.html
- StatKey Tutorial: https://www.lock5stat.com/StatKey/index.html
- Bootstrap Introduction: https://youtu.be/... (ссылка на видео)
---
