Удовлетворённость учителей исследование
Исследование удовлетворённости учителей (Teacher Satisfaction)
| Description | |
|---|---|
| Teacher Satisfaction |
Аннотация
В данном проекте анализируется модель Teacher Satisfaction — агентная симуляция рынка труда учителей. В этой модели учителя выбирают школу на основе трёх критериев: зарплата, качество школы и расстояние до работы. Если учитель недоволен, он увольняется и ищет другое место. Саму модель мы не запускали, а использовали готовые датасеты, выложенные авторами на GitHub. Наша задача — с помощью регрессионного анализа проверить три гипотезы о том, какие факторы на самом деле влияют на удовлетворённость учителей и текучесть кадров.
Цель работы
Выявить, какие из трёх факторов (зарплата, мобильность учителей, разброс качества между школами) статистически значимо влияют на удовлетворённость учителей и текучесть кадров в рамках модели Teacher Satisfaction.
Рабочие гипотезы
Гипотеза 1 (Дериволкова Алина) — Влияние зарплаты на удовлетворённость
H₀: Базовая зарплата не влияет на среднюю удовлетворённость учителей.
H₁: Увеличение базовой зарплаты повышает среднюю удовлетворённость учителей.
Гипотеза 2 (Горынин Леонид) — Влияние мобильности на текучесть
H₀: Радиус мобильности учителей не влияет на текучесть кадров.
H₁: Чем больше радиус мобильности (готовность ехать дальше), тем ниже текучесть кадров.
Гипотеза 3 (Гловели Джемма) — Влияние качества школ на неравенство
H₀: Разброс качества между школами не влияет на неравенство удовлетворённости учителей.
H₁: Чем больше школы различаются по качеству, тем выше неравенство в удовлетворённости учителей.
Модель и данные
Модель Teacher Satisfaction реализована в среде NetLogo. Она симулирует поведение учителей и школ: учителя ищут работу, ориентируясь на зарплату, качество и расстояние; школы нанимают учителей. Если удовлетворённость учителя падает ниже порогового значения, он увольняется.
Для анализа мы не запускали модель самостоятельно, а взяли готовые датасеты из репозитория авторов. Эти файлы содержат результаты многократных прогонов модели при разных комбинациях параметров. Всего мы использовали три файла:
- `TS_Salary.csv` — данные о зарплате и удовлетворённости
- `TS_Mobil_Satisf.csv` — данные о мобильности и текучести
- `TS_S_Quality.csv` — данные о вариативности качества школ и неравенстве удовлетворённости
Инструменты и метод
Для анализа мы использовали Microsoft Excel (пакет анализа, инструмент «Регрессия»). Для каждой гипотезы была построена парная линейная регрессия вида:
Y = α + β·X + ε
где Y — зависимая переменная, X — независимая переменная, β — коэффициент регрессии (показывает направление и силу связи), α — свободный член, ε — случайная ошибка.
Для каждой модели мы оценивали три ключевых показателя:
- Коэффициент β — положительный или отрицательный (направление связи)
- R-квадрат — доля дисперсии Y, которую объясняет X
- P-значение — статистическая значимость (если меньше 0.05, связь не случайна)
Результаты регрессионного анализа
Результат 1: Влияние зарплаты на удовлетворённость
Спецификация модели:
- Y = `mean-satisfaction-all` (средняя удовлетворённость)
- X = `Base_Salary` (базовая зарплата)
Результаты регрессии:
| Показатель | Значение |
|---|---|
| R-квадрат | 0,000256 |
| Коэффициент при зарплате | 0,000000457 |
| P-значение (Значимость F) | 0,5715 |
| Количество наблюдений | 1249 |
Вывод: Гипотеза не подтвердилась. Коэффициент практически равен нулю, p-value = 0,57 (намного выше порога 0,05), R-квадрат почти ноль. Это означает, что в данной модели зарплата не влияет на удовлетворённость учителей.
---
Результат 2: Влияние мобильности на текучесть
Спецификация модели:
- Y = `teacher-turnover-rate` (текучесть кадров)
- X = `academic-mobility-radius` (радиус мобильности)
Результаты регрессии:
| Показатель | Значение |
|---|---|
| R-квадрат | 0,00149 |
| Коэффициент при мобильности | -0,0000898 |
| P-значение (Значимость F) | 0,1727 |
| Количество наблюдений | 1249 |
Вывод: Гипотеза не подтвердилась. Коэффициент отрицательный (это соответствует ожидаемому направлению: чем выше мобильность, тем ниже текучесть), но p-value = 0,173 > 0,05, поэтому результат статистически не значим. R-квадрат очень маленький, что говорит об очень слабой связи.
---
Результат 3: Влияние вариативности качества школ на неравенство
Спецификация модели:
- Y = `satisfaction-inequality` (неравенство удовлетворённости)
- X = `Sch_Quality_Variation` (разброс качества между школами)
Результаты регрессии:
| Показатель | Значение |
|---|---|
| R-квадрат | 0,1637 |
| Коэффициент при вариативности качества | -0,0867 |
| P-значение (Значимость F) | 1,24 × 10⁻⁴⁰ (< 0,001) |
| Количество наблюдений | 999 |
Вывод: Гипотеза подтвердилась (связь статистически значима, p < 0,001). Однако коэффициент оказался отрицательным, а не положительным. Это значит, что при увеличении разброса качества между школами неравенство удовлетворённости снижается. R-квадрат = 0,164 — модель объясняет около 16% дисперсии.
Почему так получилось: Возможное объяснение — учителя из школ с низким качеством увольняются из-за неудовлетворённости и покидают рынок. В итоге в системе остаются в основном те, кто работает в хороших или средних школах, и разрыв в удовлетворённости сокращается.
---
Сводная таблица результатов
| Гипотеза | Ожидаемый знак | Полученный знак | p-value | R² | Статус |
|---|---|---|---|---|---|
| H1: зарплата → удовлетворённость | + | ≈0 | 0,57 | 0,000 | не подтверждена |
| H2: мобильность → текучесть | – | – | 0,17 | 0,001 | не подтверждена |
| H3: качество школ → неравенство | + | – | < 0,001 | 0,164 | подтверждена (обратная связь) |
Общее заключение
Из трёх проверенных факторов только один показал статистически значимое влияние — это вариативность качества школ. Но это влияние оказалось обратным: чем больше школы различаются по качеству, тем ниже неравенство в удовлетворённости. Вероятно, потому что учителя из плохих школ уходят, и остаются только те, кто в целом доволен.
Зарплата и мобильность учителей в данной модели не влияют на удовлетворённость и текучесть. Это может означать, что ключевые механизмы модели завязаны не на этих параметрах, а на чём-то другом — например, на соотношении зарплаты и качества школы, а не на их абсолютных значениях.
Участники и распределение ролей
- Гловели Джемма — постановка гипотез, загрузка и подготовка данных, регрессионный анализ в Excel, интерпретация коэффициентов
- Горынин Леонид — визуализация результатов: построение точечных диаграмм с линиями тренда для трёх гипотез, подготовка графиков
- Дериволкова Алина — оформление отчёта на вики-странице, форматирование таблиц и графиков, итоговая редакция
Ссылки
- Практикум по эконометрике (syllabus)
- Социально-экономическая статистика и эконометрика (syllabus)
- Teacher Satisfaction (model) — описание агентной модели
- Wilensky, U. (1999). NetLogo. http://ccl.northwestern.edu/netlogo/
- Репозиторий с данными: https://github.com/patarakin/stat-data
