Обсуждение:StatKey

Материал из Поле цифровой дидактики

StatKey Results Glossary: Интерпретация результатов статистического анализа

Этот шаблон содержит определения, интерпретацию и примеры для результатов, которые выдаёт StatKey при анализе данных.

📊 РАЗДЕЛ 1: ОПИСАТЕЛЬНАЯ СТАТИСТИКА

Mean (Среднее)

Определение: Сумма всех значений, делённая на количество наблюдений.

[math]\displaystyle{ \bar{X} = \frac{\sum_{i=1}^{n} X_i}{n} }[/math]

Интерпретация: Центральное значение. Говорит, где находится "центр тяжести" данных.

Пример из Teacher Satisfaction:

  • mean-satisfaction-all = 0.546 → Средняя удовлетворенность учителей 54.6%
  • Sch_Quality_Variation = 0.400 → В среднем вариация качества школ 40%

Когда использовать: Всегда, как первый показатель распределения.

Когда осторожно: Если есть выбросы, среднее может быть искажено (используйте медиану).

---

Median (Медиана)

Определение: Значение, которое делит упорядоченный набор данных пополам (50-й перцентиль).

Интерпретация: "Середина" данных. 50% значений ниже медианы, 50% выше.

Пример:

  • median = 0.547 → 50% учителей имеют удовлетворенность < 54.7%, 50% > 54.7%

Когда использовать: Если распределение не нормально или есть выбросы.

Сравнение Mean vs Median: ``` Если mean ≈ median → распределение симметричное Если mean >> median → выбросы в верхней части (асимметрия вправо) Если mean << median → выбросы в нижней части (асимметрия влево) ```

Ваш пример: mean = 0.546, median = 0.547 → почти равны → распределение примерно симметрично

---

Standard Deviation (Стандартное отклонение)

Определение: Мера вариабельности. Среднее расстояние от каждого значения до среднего.

[math]\displaystyle{ s = \sqrt{\frac{\sum_{i=1}^{n} (X_i - \bar{X})^2}{n-1}} }[/math]

Интерпретация:

  • Маленькое стандартное отклонение → данные плотно сгруппированы вокруг среднего
  • Большое стандартное отклонение → данные разбросаны

Правило 68-95-99.7 (для нормального распределения):

  • В диапазоне mean ± 1×stdev находится ~68% данных
  • В диапазоне mean ± 2×stdev находится ~95% данных
  • В диапазоне mean ± 3×stdev находится ~99.7% данных

Ваш пример:

  • mean-satisfaction = 0.546, stdev = 0.038
  • Диапазон (mean ± stdev) = [0.508, 0.584] содержит ~68% учителей

Когда использовать: Для оценки разброса и для построения доверительных интервалов.

---

Sample Size (Размер выборки, n)

Определение: Количество наблюдений в датасете.

Интерпретация:

  • Большой n → более надежные результаты, узкие доверительные интервалы
  • Маленький n → менее надежные результаты, широкие доверительные интервалы

Математическая зависимость: [math]\displaystyle{ \text{Стандартная ошибка} = \frac{\text{stdev}}{\sqrt{n}} }[/math]

Если увеличить n в 4 раза → стандартная ошибка уменьшится в 2 раза!

Ваш пример: n = 1250 → большая выборка → надежные результаты ✓

Минимальный размер выборки:

  • Для бутстрэпа: n ≥ 30
  • Для хороших результатов: n ≥ 100
  • Для очень надежных результатов: n ≥ 1000

---

📈 РАЗДЕЛ 2: ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ

Confidence Interval (95% CI)

Определение: Диапазон значений, который с вероятностью 95% содержит истинный параметр генеральной совокупности.

[math]\displaystyle{ CI = \text{Estimate} \pm z_{\alpha/2} \times \text{SE} }[/math]

где SE = стандартная ошибка.

Интерпретация: Если повторить эксперимент 100 раз и построить CI для каждого, примерно 95 из них будут содержать истинное значение.

Что НЕ означает: "Вероятность того, что параметр в интервале — 95%" (параметр — константа, не случайная величина)

Пример из вашего анализа:

  • Исходное среднее: mean = 0.546
  • 95% CI (примерный): [0.544, 0.548]
  • Интерпретация: Истинная средняя удовлетворенность находится между 54.4% и 54.8%

Узкий vs широкий интервал: ``` Узкий CI [0.544, 0.548] → высокая точность ✓ Широкий CI [0.500, 0.600] → низкая точность ✗

Ширина зависит от: - Размера выборки (больше n → уже интервал) - Стандартного отклонения (больше stdev → шире интервал) - Уровня доверия (99% интервал шире 95%) ```

Когда использовать: Всегда вместо точечной оценки. Интервалы информативнее!

---

Bootstrap Confidence Interval

Определение: Доверительный интервал, построенный методом бутстрэп (переборка с возвращением).

Как это работает: 1. Берете исходную выборку размером n 2. Генерируете B новых выборок (обычно B=1000 или 5000) путём переборки с возвращением 3. Для каждой выборки вычисляете статистику (среднее, медиану, корреляцию и т.д.) 4. Сортируете B статистик и берёте 2.5% и 97.5% перцентили

Преимущества бутстрэпа:

  • Работает для любой статистики (не только для среднего!)
  • Не требует предположения о нормальности
  • Видно истинное распределение, не теоретическое

Пример:

  • Загрузили 1250 значений удовлетворенности
  • Сгенерировали 1000 бутстрэп-выборок
  • Для каждой вычислили среднее
  • Получили распределение 1000 средних
  • 95% CI = [0.544, 0.548]

StatKey показывает:

  • Dotplot с 1000 точек (бутстрэп-статистик)
  • Красные линии на 2.5% и 97.5% перцентилях
  • Числовые значения CI в таблице результатов

---

🔗 РАЗДЕЛ 3: СВЯЗЬ МЕЖДУ ПЕРЕМЕННЫМИ

Correlation (Коэффициент корреляции Пирсона)

Определение: Мера линейной связи между двумя количественными переменными.

[math]\displaystyle{ r = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sqrt{\sum (X_i - \bar{X})^2 \sum (Y_i - \bar{Y})^2}} }[/math]

Диапазон: от -1 до +1

Интерпретация:

r Интерпретация Пример
0.9–1.0 Очень сильная положительная Рост и вес (почти всегда выше люди тяжелее)
0.7–0.9 Сильная положительная Sch_Quality_Variation vs mean-satisfaction (r=0.807)
0.5–0.7 Умеренная положительная Образование и доход
0.3–0.5 Слабая положительная Упражнения и долголетие
0.1–0.3 Очень слабая положительная Практически нет видимой связи
±0.05 Почти нет связи academic-mobility-radius vs mean-satisfaction (r=0.00026) ✗
-0.1–-0.3 Очень слабая отрицательная Практически нет видимой связи
-0.5–-0.7 Умеренная отрицательная Цена и спрос
-0.7–-0.9 Сильная отрицательная Курение и здоровье
-0.9–-1.0 Очень сильная отрицательная X и (100-X)

Что корреляция НЕ показывает:

  • Она не показывает причину и следствие!
  • r = 0.8 между A и B НЕ означает, что A вызывает B

Ваши примеры: ``` academic-mobility-radius vs mean-satisfaction: r = 0.00026 ❌ Нет связи academic-mobility-radius vs teacher-turnover-rate: r = -0.039 ❌ Нет связи Sch_Quality_Variation vs mean-satisfaction-all: r = 0.807 ✓ Сильная связь! ```

Когда использовать: Для быстрой оценки связи между двумя переменными.

---

Slope (Коэффициент наклона в регрессии)

Определение: Коэффициент при независимой переменной в линейной регрессии.

[math]\displaystyle{ Y = \text{Intercept} + \text{Slope} \times X }[/math]

Интерпретация: На каждое увеличение X на 1 единицу, Y изменяется на Slope единиц.

Ваш пример: ``` mean-satisfaction = 0.51 + 0.266 × Sch_Quality_Variation

Slope = 0.266 означает: Если Sch_Quality_Variation увеличится на 0.1 (с 0.3 на 0.4):

 ΔY = 0.266 × 0.1 = 0.0266
 mean-satisfaction вырастет на 2.66 процентных пункта

```

Пример расчёта: ``` При Sch_Quality_Variation = 0.3:

 Y = 0.51 + 0.266 × 0.3 = 0.51 + 0.0798 = 0.5898 ≈ 59%

При Sch_Quality_Variation = 0.5:

 Y = 0.51 + 0.266 × 0.5 = 0.51 + 0.1330 = 0.643 ≈ 64.3%

Разница: 64.3% - 59% = 5.3 процентных пункта ```

Знак Slope:

  • Slope > 0 → положительная связь (X растет → Y растет)
  • Slope < 0 → отрицательная связь (X растет → Y падает)
  • Slope ≈ 0 → почти нет связи

Связь с Correlation: [math]\displaystyle{ \text{Slope} = r \times \frac{\text{stdev}_Y}{\text{stdev}_X} }[/math]

Если r = 0, то Slope = 0. Если r большой, то Slope больше (при равных стандартных отклонениях).

Когда использовать: Для предсказания и для понимания размера эффекта.

---

Intercept (Пересечение с осью Y)

Определение: Значение Y, когда X = 0.

[math]\displaystyle{ Y = \text{Intercept} + \text{Slope} \times X }[/math]

Интерпретация: Базовое значение зависимой переменной при нулевом значении независимой.

Ваш пример: ``` mean-satisfaction = 0.51 + 0.266 × Sch_Quality_Variation

                   ↑
                Intercept = 0.51

Если Sch_Quality_Variation = 0:

 mean-satisfaction = 0.51 = 51%

Это означает: базовая удовлетворенность (без вариации качества) = 51% ```

Когда использовать: Интерпретируйте только если X = 0 имеет смысл!

Пример осторожности:

  • Если X = "возраст учителя" (диапазон 25–65 лет)
  • Intercept = значение при возрасте 0 (это не имеет смысла!)

---

🎲 РАЗДЕЛ 4: ПРОВЕРКА ГИПОТЕЗ

P-value

Определение: Вероятность получить наблюдаемые данные (или более экстремальные), если нулевая гипотеза верна.

Интерпретация:

  • p < 0.05 → результат статистически значим (отвергаем H₀)
  • p ≥ 0.05 → результат статистически не значим (не отвергаем H₀)

Что НЕ означает p-value:

  • p = 0.03 НЕ означает "вероятность того, что результат верный — 97%"
  • p-value говорит о данных, ДАНных нулевую гипотезу, а не о правильности гипотезы

Пример: ``` Нулевая гипотеза H₀: "Корреляция между Sch_Quality_Variation и

                      mean-satisfaction = 0 (нет связи)"

Если p < 0.0001 → очень маловероятно, что такая сильная корреляция

                  возникла случайно → отвергаем H₀ → связь значима!

```

Интерпретация p-value в StatKey: ``` p < 0.001 → очень сильное свидетельство ✓✓✓ p < 0.01 → сильное свидетельство ✓✓ p < 0.05 → умеренное свидетельство ✓ p ≥ 0.05 → нет свидетельства ✗ ```

---

Test Statistic (Тестовая статистика)

Определение: Число, используемое для проверки гипотезы.

Зависит от типа теста:

  • t-тест → t-statistic
  • Корреляция → z-statistic или t-statistic
  • Пропорции → z-statistic
  • Хи-квадрат → χ²-statistic

Интерпретация: Чем больше абсолютное значение, тем меньше p-value, тем сильнее свидетельство против H₀.

Пример: ``` Если t = 25.5, это очень большое значение → p-value будет очень маленькой Если t = 0.5, это маленькое значение → p-value будет большой ```

---

📊 РАЗДЕЛ 5: СРАВНЕНИЕ ГРУПП

Difference in Means (Разность средних)

Определение: Разность средних значений двух групп.

[math]\displaystyle{ \text{Difference} = \bar{X}_1 - \bar{X}_2 }[/math]

Интерпретация: Насколько одна группа отличается от другой.

Ваш пример (гипотетический): ``` Группа 1 (radius = 5): mean = 0.550 Группа 2 (radius = 50): mean = 0.620 Разность = 0.620 - 0.550 = 0.070 = 7.0 процентных пункта

Интерпретация: Учителя с высокой мобильностью на 7% более довольны ```

Доверительный интервал для разности: ``` 95% CI для разности = [0.05, 0.12]

Интерпретация: - Минимальное увеличение = 5 процентных пункта - Максимальное увеличение = 12 процентных пункта - Мы 95% уверены в этом диапазоне ```

Правило значимости: ``` Если 95% CI для разности НЕ включает 0:

 [0.05, 0.12]     → разность ЗНАЧИМА ✓
 [-0.02, 0.10]    → разность НЕ значима ✗ (включает 0)

```

---

Standard Error (Стандартная ошибка)

Определение: Стандартное отклонение выборочного распределения статистики.

[math]\displaystyle{ SE = \frac{s}{\sqrt{n}} }[/math]

Интерпретация: Насколько надежна наша оценка. Маленькая SE → надежная оценка.

Ваш пример: ``` mean-satisfaction = 0.546 SE = 0.0011

Интерпретация: Если повторить эксперимент много раз, среднее будет варьироваться с стандартным отклонением 0.0011

Это очень маленькое число → оценка очень надежна! ```

Связь с размером выборки: ``` SE ∝ 1/√n

Если увеличить n в 4 раза → SE уменьшится в 2 раза Если увеличить n в 100 раз → SE уменьшится в 10 раз ```

---

📈 РАЗДЕЛ 6: ИНТЕРПРЕТАЦИОННЫЕ ТАБЛИЦЫ

Таблица 1: Интерпретация корреляции

Корреляция (r) Интерпретация Пример Статус
0.9–1.0 Очень сильная положительная Рост и вес ✓✓✓
0.7–0.9 Сильная положительная Качество школ и удовлетворенность ✓✓✓
0.5–0.7 Умеренная положительная Образование и доход ✓✓
0.3–0.5 Слабая положительная Физическая активность и здоровье
0.1–0.3 Очень слабая положительная Цвет машины и цена
±0.05 Практически нет связи Мобильность и удовлетворенность
-0.1–-0.3 Очень слабая отрицательная Цвет одежды и рост
-0.3–-0.5 Слабая отрицательная Упражнения и вес
-0.5–-0.7 Умеренная отрицательная Цена и спрос ✓✓
-0.7–-0.9 Сильная отрицательная Курение и здоровье ✓✓✓
-0.9–-1.0 Очень сильная отрицательная X и (100-X) ✓✓✓

---

Таблица 2: Интерпретация размера выборки

n (размер) Оценка Доверительность Когда использовать
n < 30 Ненадежная Низкая Только пилотные исследования
30 ≤ n < 100 Приемлемая Средняя Разведочный анализ
100 ≤ n < 500 Хорошая Хорошая Обычные исследования
500 ≤ n < 1000 Очень хорошая Высокая Важные исследования
n ≥ 1000 Отличная Очень высокая Критические решения

Ваш случай: n = 1250 → отличная оценка ✓

---

Таблица 3: Доверительные интервалы — руководство по интерпретации

Сценарий CI Интерпретация Действие
Узкий интервал [0.544, 0.548] Высокая точность, стабильная система ✓ Рекомендуется
Средний интервал [0.530, 0.562] Умеренная точность Считается приемлемо
Широкий интервал [0.400, 0.700] Низкая точность, неопределённость ✗ Нужно больше данных
Интервал включает 0 [-0.02, 0.08] Эффект может быть ≤ 0 ✗ Не значим
Интервал не включает 0 [0.05, 0.12] Эффект определённо > 0 ✓ Значим

---

Таблица 4: Сравнение вашего исследования

Переменная (X) Переменная (Y) Корреляция Интерпретация Вывод
academic-mobility-radius mean-satisfaction-all 0.00026 Практически нет связи ✗ Не влияет
academic-mobility-radius teacher-turnover-rate -0.039 Практически нет связи ✗ Не влияет
Sch_Quality_Variation mean-satisfaction-all 0.807 Сильная положительная ✓ Сильно влияет!

---

🎓 РАЗДЕЛ 7: ПРИМЕРЫ ИНТЕРПРЕТАЦИИ

Пример 1: Анализ mean-satisfaction (одна переменная)

Результаты StatKey: ``` Variable: mean-satisfaction-all Mean = 0.546 Median = 0.547 Std Dev = 0.038 Sample Size = 1250 95% Bootstrap CI = [0.544, 0.548] ```

Интерпретация:

1. Среднее и медиана (0.546 ≈ 0.547): Распределение симметричное, нет выбросов 2. Стандартное отклонение (0.038): Удовлетворенность варьируется примерно ±3.8 процентных пункта 3. Размер выборки (1250): Большая выборка, надежные результаты 4. 95% CI ([0.544, 0.548]): Узкий интервал → система стабильна

Вывод для политики: > "Удовлетворенность учителей стабильна на уровне 54.6% (между 54.4% и 54.8%). Это означает, что система предсказуема, но удовлетворенность низкая — нужны реформы."

---

Пример 2: Сравнение двух групп (гипотетический)

Результаты StatKey: ``` Group 1 (radius = 5): n = 625, mean = 0.550 Group 2 (radius = 50): n = 625, mean = 0.620 Difference = 0.070 95% Bootstrap CI for Difference = [0.050, 0.090] ```

Интерпретация:

1. Разность средних (0.070 = 7%): Группа 2 на 7 процентных пункта выше 2. Доверительный интервал ([0.050, 0.090]): Интервал НЕ включает 0 → разность ЗНАЧИМА 3. Минимальный эффект (5%): Даже в худшем сценарии эффект есть 4. Максимальный эффект (9%): В лучшем сценарии эффект больше

Вывод для политики: > "Увеличение радиуса мобильности с 5 км на 50 км увеличивает удовлетворенность на 5–9 процентных пункта. Эффект значим и надежен."

---

Пример 3: Корреляционный анализ (ваш реальный пример)

Результаты StatKey: ``` Variable 1: Sch_Quality_Variation (Mean = 0.400, SD = 0.224) Variable 2: mean-satisfaction-all (Mean = 0.616, SD = 0.074) Sample Size = 1000

Correlation = 0.807 Slope = 0.266 Intercept = 0.51 ```

Интерпретация:

1. Корреляция (r = 0.807): СИЛЬНАЯ положительная связь → качество школ сильно влияет на удовлетворенность 2. Наклон (0.266): На каждое увеличение качества на 0.1 (10%), удовлетворенность растет на 2.66% 3. Перехват (0.51): Базовая удовлетворенность (если нет вариации качества) = 51%

Пример расчёта: ``` При Sch_Quality_Variation = 0.3:

 Y = 0.51 + 0.266 × 0.3 = 0.590 (59.0%)

При Sch_Quality_Variation = 0.6:

 Y = 0.51 + 0.266 × 0.6 = 0.670 (67.0%)

Эффект: от 59% до 67% = 8 процентных пункта! ```

Вывод для политики: > "Качество школ — главный рычаг системы (r = 0.807). Если мы увеличим вариацию качества школ (одни хорошие, другие плохие), удовлетворенность учителей вырастет. Это странный результат, но он надежен."

---

📋 РАЗДЕЛ 8: ЧЕК-ЛИСТ ИНТЕРПРЕТАЦИИ

При анализе одной переменной

Сделайте эти проверки:

- [ ] Mean vs Median: Они близки? Если нет → есть выбросы или асимметрия - [ ] Standard Deviation: Мало (< 0.1 от mean) или много (> 0.3 от mean)? - [ ] Sample Size: n ≥ 100? Если нет → результаты ненадежны - [ ] 95% CI: Узкий или широкий? Узкий → стабильно, широкий → неопределённость - [ ] Скос распределения: Посмотрите на гистограмму (есть ли выбросы?)

---

При анализе двух переменных

Сделайте эти проверки:

- [ ] Correlation: |r| > 0.3? Если нет → связи нет, stop здесь - [ ] Slope: Положительный или отрицательный? Соответствует интуиции? - [ ] Intercept: Имеет ли смысл при X = 0? - [ ] Sample Size: n ≥ 100? Если нет → результаты ненадежны - [ ] 95% CI для slope: Включает ли 0? Если да → не значим

---

При сравнении групп

Сделайте эти проверки:

- [ ] Means по группам: Визуально разные? - [ ] Sizes по группам: Примерно одинаковые? - [ ] Difference: На сколько процентов отличаются? - [ ] 95% CI для разности: Включает ли 0? Если нет → значимо! - [ ] Effect size: Маленький (< 2%), средний (2–5%), большой (> 5%)?

---

📚 РАЗДЕЛ 9: ЧАСТЫЕ ОШИБКИ ИНТЕРПРЕТАЦИИ

Ошибка 1: Путаница Mean и Median

Неправильно: "Медиана = среднее значение" (это правда только в синониме)

Правильно: "Медиана = 50-й перцентиль = значение, которое делит данные пополам"

---

Ошибка 2: Интерпретация p-value

Неправильно: "p = 0.03 означает, что гипотеза верна на 97%"

Правильно: "p = 0.03 означает, что если нулевая гипотеза верна, данные такие или более экстремальные появляются в 3% случаев"

---

Ошибка 3: Корреляция = причинность

Неправильно: "r = 0.8 между X и Y означает, что X вызывает Y"

Правильно: "r = 0.8 означает, что X и Y сильно связаны, но причина может быть обратной, третьей переменной или совпадением"

---

Ошибка 4: Игнорирование размера выборки

Неправильно: "n = 20, но среднее = 100, значит все значения ≈ 100"

Правильно: "n = 20 маленькая выборка, доверительный интервал будет очень широким"

---

Ошибка 5: Интерпретация интервала вероятностно

Неправильно: "95% CI [0.544, 0.548] означает вероятность 95%, что истинное значение в интервале"

Правильно: "95% CI означает, что если повторить эксперимент 100 раз, примерно 95 интервалов будут содержать истинное значение"

---

🔗 РАЗДЕЛ 10: ССЫЛКИ И ДОПОЛНИТЕЛЬНЫЕ РЕСУРСЫ

  • Bootstrap — подробное объяснение метода бутстрэпа
  • Confidence_Interval — полная статья о доверительных интервалах
  • Central_Limit_Theorem — теоретическая основа для интервалов
  • StatKey — инструмент для анализа
  • Teacher_Satisfaction_(model) — пример применения в моделировании

📺 ВИДЕО-РЕСУРСЫ

---