Teacher Satisfaction
Teacher Satisfaction: эконометрический анализ рынка труда учителей
Аннотация
В проекте исследуется модель Teacher Satisfaction — агентно-ориентированная симуляция рынка труда преподавателей. Учителя-агенты выбирают работу на основе зарплаты, качества школы и расстояния. Удовлетворённость учителя (от 0 до 1) определяет, останется ли он на месте или уволится. Для анализа использованы готовые датасеты, полученные авторами модели в среде NetLogo (BehaviorSpace) и выложенные на GitHub. Проведён эконометрический анализ влияния трёх факторов (зарплата, мобильность учителей, вариативность качества школ) на удовлетворённость, текучесть кадров и неравенство в удовлетворённости.
Цель работы
С помощью регрессионного анализа количественно оценить, как базовая зарплата, радиус мобильности учителей и разброс качества между школами влияют на среднюю удовлетворённость учителей, уровень текучести кадров и неравенство в удовлетворённости в системе образования.
Рабочие гипотезы
Гипотеза 1 (Дериволкова Алина) — Влияние зарплаты на удовлетворённость
H₀: Базовая зарплата (Base_Salary) не оказывает значимого влияния на среднюю удовлетворённость учителей (mean-satisfaction-all).
H₁: Увеличение базовой зарплаты статистически значимо повышает среднюю удовлетворённость учителей.
Гипотеза 2 (Горынин Леонид) — Влияние мобильности на текучесть кадров
H₀: Радиус мобильности учителей (academic-mobility-radius) не влияет на уровень текучести кадров (teacher-turnover-rate).
H₁: Увеличение радиуса мобильности (готовность ехать дальше) статистически значимо снижает текучесть кадров.
Гипотеза 3 (Гловели Джемма) — Влияние вариативности качества школ на неравенство удовлетворённости
H₀: Разброс в качестве школ (Sch_Quality_Variation) не влияет на неравенство удовлетворённости учителей (satisfaction-inequality).
H₁: Увеличение разброса качества между школами статистически значимо усиливает неравенство в удовлетворённости.
Модель Teacher Satisfaction (NetLogo)
Модель Teacher Satisfaction реализована в среде NetLogo. Она представляет собой агентно-ориентированную симуляцию рынка труда учителей. Каждый учитель-агент обладает следующими характеристиками:
- Удовлетворённость (0–1) — зависит от зарплаты, качества школы и расстояния до работы
- Мобильность — радиус, в котором учитель готов искать работу
- Статус — работает в школе или безработный
Школы различаются по качеству (0–1) и предлагаемой зарплате. Если удовлетворённость учителя падает ниже заданного порога (Satisfaction_threshold), он увольняется и ищет новое место. Модель демонстрирует эффект стратификации: хорошие школы заполняются довольными учителями, плохие остаются с вакансиями или неудовлетворённым персоналом.
Важно для нашего исследования: сама модель не запускалась нами. Мы использовали уже готовые датасеты, полученные авторами модели в результате экспериментов в среде BehaviorSpace (многократные прогоны модели при разных значениях параметров). Наша работа сосредоточена на эконометрическом анализе этих готовых данных.
Полное описание модели доступно на странице Teacher Satisfaction (model).
Инструменты и параметры модели
Инструменты
- Моделирование: NetLogo (модель Teacher Satisfaction) — использована только для генерации исходных данных
- Анализ данных: Microsoft Excel (пакет анализа, инструмент «Регрессия»)
- Визуализация: Точечные диаграммы с линиями тренда (Excel)
- Данные: готовые CSV-датасеты из открытого репозитория
Теоретический базис — закон Парето и теория рынка труда
В модели реализуется механизм стратификации учителей: хорошие школы заполняются лучшими кадрами, плохие школы остаются с неудовлетворёнными учителями, что соответствует закону Парето (20% школ получают 80% качественных учителей).
Собираемые данные для анализа
Для анализа использованы готовые датасеты, выложенные авторами модели на GitHub:
| Файл | Ссылка | Переменные |
|---|---|---|
| TS_Salary.csv | https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/TS_Salary.csv | Base_Salary, mean-satisfaction-all и др. |
| TS_Mobil_Satisf.csv | https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/TS_Mobil_Satisf.csv | academic-mobility-radius, teacher-turnover-rate и др. |
| TS_S_Quality.csv | https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/TS_S_Quality.csv | Sch_Quality_Variation, satisfaction-inequality и др. |
Метод анализа
Анализ данных проводился в Microsoft Excel с использованием инструмента «Регрессия» (пакет анализа). Для каждой гипотезы была построена парная линейная регрессия вида:
Y = α + β·X + ε
где:
- Y — зависимая переменная
- X — независимая переменная
- β — коэффициент регрессии (направление и сила связи)
- α — свободный член
- ε — случайная ошибка
Для каждой модели оценивались:
- Коэффициент β — знак и величина влияния X на Y
- R-квадрат — доля дисперсии Y, объяснённая X
- P-значение (Значимость F) — статистическая значимость модели (порог α = 0,05)
Результаты эконометрического анализа
Результат 1: Гипотеза H1 (зарплата → удовлетворённость)
Спецификация модели:
- Y = mean-satisfaction-all (средняя удовлетворённость)
- X = Base_Salary (базовая зарплата)
Таблица результатов регрессии:
| Показатель | Значение |
|---|---|
| R-квадрат | 0,000256 |
| Коэффициент при Base_Salary | 0,000000457 |
| P-значение (Значимость F) | 0,5715 |
| Количество наблюдений | 1249 |
График зависимости:
Вывод по H1: Гипотеза не подтверждается. Коэффициент при зарплате близок к нулю, p-value = 0,57 > 0,05, R² ≈ 0. В данной модели зарплата не оказывает статистически значимого влияния на удовлетворённость учителей.
---
Результат 2: Гипотеза H2 (мобильность → текучесть)
Спецификация модели:
- Y = teacher-turnover-rate (текучесть кадров)
- X = academic-mobility-radius (радиус мобильности)
Таблица результатов регрессии:
| Показатель | Значение |
|---|---|
| R-квадрат | 0,00149 |
| Коэффициент при academic-mobility-radius | -0,0000898 (отрицательный) |
| P-значение (Значимость F) | 0,1727 |
| Количество наблюдений | 1249 |
График зависимости:
Вывод по H2: Гипотеза не подтверждается на уровне значимости 0,05. Хотя коэффициент отрицательный (что соответствует ожидаемому направлению связи: рост мобильности → снижение текучести), p-value = 0,173 > 0,05, поэтому результат не может считаться статистически значимым. R² = 0,0015 указывает на очень слабую связь.
---
Результат 3: Гипотеза H3 (качество школ → неравенство)
Спецификация модели:
- Y = satisfaction-inequality (неравенство удовлетворённости)
- X = Sch_Quality_Variation (вариативность качества школ)
Таблица результатов регрессии:
| Показатель | Значение |
|---|---|
| R-квадрат | 0,1637 |
| Коэффициент при Sch_Quality_Variation | -0,0867 (отрицательный) |
| P-значение (Значимость F) | 1,24 × 10⁻⁴⁰ (< 0,001) |
| Количество наблюдений | 999 |
График зависимости:
Вывод по H3: Гипотеза подтверждается (связь статистически значима, p < 0,001). Однако, вопреки ожиданиям, коэффициент оказался отрицательным: увеличение вариативности качества школ приводит к снижению неравенства удовлетворённости. R² = 0,164 означает, что модель объясняет около 16% дисперсии зависимой переменной.
Интерпретация отрицательного коэффициента:
Возможное объяснение — учителя из низкокачественных школ увольняются из-за низкой удовлетворённости и покидают рынок. В результате в системе остаются только учителя, работающие в комфортных условиях, что снижает общее неравенство удовлетворённости.
---
Общий вывод по всем гипотезам
| Гипотеза | Ожидаемый знак | Полученный знак | p-value | R² | Вердикт |
|---|---|---|---|---|---|
| H1: зарплата → удовлетворённость | + | ≈0 | 0,57 | 0,000 | не подтверждена |
| H2: мобильность → текучесть | – | – | 0,17 | 0,001 | не подтверждена |
| H3: качество школ → неравенство | + | – | < 0,001 | 0,164 | подтверждена (обратная связь) |
Заключение:
В рамках модели Teacher Satisfaction зарплата и мобильность учителей не оказывают статистически значимого влияния на удовлетворённость и текучесть кадров. Ключевым фактором, влияющим на рынок труда учителей, является качество школы: увеличение разброса между школами по этому параметру парадоксальным образом снижает неравенство в удовлетворённости, возможно, за счёт ухода недовольных учителей из плохих школ. Для повышения удовлетворённости учителей и снижения текучести необходимо в первую очередь улучшать условия работы в школах, а не только повышать зарплату.
Участники и распределение ролей
- Гловели Джемма — постановка гипотез, загрузка и подготовка данных, регрессионный анализ в Excel (пакет анализа), интерпретация коэффициентов
- Горынин Леонид — визуализация результатов: построение точечных диаграмм с линиями тренда для трёх гипотез, подготовка графиков для отчёта
- Дериволкова Алина — оформление отчёта на вики-странице, форматирование таблиц и графиков, итоговая редакция
Ссылки
- Практикум по эконометрике (syllabus)
- Социально-экономическая статистика и эконометрика (syllabus)
- Teacher Satisfaction (model) — описание агентной модели
- Wilensky, U. (1999). NetLogo. http://ccl.northwestern.edu/netlogo/
- Репозиторий с данными: https://github.com/patarakin/stat-data
