Удовлетворённость учителей исследование: различия между версиями

Материал из Поле цифровой дидактики
Нет описания правки
Нет описания правки
Строка 48: Строка 48:
Для анализа мы использовали Microsoft Excel (пакет анализа, инструмент «Регрессия»). Для каждой гипотезы была построена парная линейная регрессия вида:
Для анализа мы использовали Microsoft Excel (пакет анализа, инструмент «Регрессия»). Для каждой гипотезы была построена парная линейная регрессия вида:


**Y = α + β·X + ε**
'''Y = α + β·X + ε'''


где Y — зависимая переменная, X — независимая переменная, β — коэффициент регрессии (показывает направление и силу связи), α — свободный член, ε — случайная ошибка.
где Y — зависимая переменная, X — независимая переменная, β — коэффициент регрессии (показывает направление и силу связи), α — свободный член, ε — случайная ошибка.


Для каждой модели мы оценивали три ключевых показателя:
Для каждой модели мы оценивали три ключевых показателя:
* **Коэффициент β** — положительный или отрицательный (направление связи)
* '''Коэффициент β''' — положительный или отрицательный (направление связи)
* **R-квадрат** — доля дисперсии Y, которую объясняет X
* '''R-квадрат''' — доля дисперсии Y, которую объясняет X
* **P-значение** — статистическая значимость (если меньше 0.05, связь не случайна)
* '''P-значение''' — статистическая значимость (если меньше 0.05, связь не случайна)


== Результаты регрессионного анализа ==
== Результаты регрессионного анализа ==
Строка 61: Строка 61:
=== Результат 1: Влияние зарплаты на удовлетворённость ===
=== Результат 1: Влияние зарплаты на удовлетворённость ===


**Спецификация модели:**
'''Спецификация модели:'''
* Y = `mean-satisfaction-all` (средняя удовлетворённость)
* Y = `mean-satisfaction-all` (средняя удовлетворённость)
* X = `Base_Salary` (базовая зарплата)
* X = `Base_Salary` (базовая зарплата)


**Результаты регрессии:**
'''Результаты регрессии:'''


{| class="wikitable"
{| class="wikitable"
Строка 79: Строка 79:
|}
|}


**График:** [[Файл:Зп_на_удвл_гр.jpg|600px]]
'''График:'''
[[Файл:Зп_на_удвл_гр.jpg|600px]]


**Вывод:** Гипотеза не подтвердилась. Коэффициент практически равен нулю, p-value = 0,57 (намного выше порога 0,05), R-квадрат почти ноль. Это означает, что в данной модели зарплата не влияет на удовлетворённость учителей.
'''Вывод:''' Гипотеза не подтвердилась. Коэффициент практически равен нулю, p-value = 0,57 (намного выше порога 0,05), R-квадрат почти ноль. Это означает, что в данной модели зарплата не влияет на удовлетворённость учителей.


---
---
Строка 87: Строка 88:
=== Результат 2: Влияние мобильности на текучесть ===
=== Результат 2: Влияние мобильности на текучесть ===


**Спецификация модели:**
'''Спецификация модели:'''
* Y = `teacher-turnover-rate` (текучесть кадров)
* Y = `teacher-turnover-rate` (текучесть кадров)
* X = `academic-mobility-radius` (радиус мобильности)
* X = `academic-mobility-radius` (радиус мобильности)


**Результаты регрессии:**
'''Результаты регрессии:'''


{| class="wikitable"
{| class="wikitable"
Строка 105: Строка 106:
|}
|}


**График:** [[Файл:Мобил_гр.jpg|600px]]
'''График:'''
[[Файл:Мобил_гр.jpg|600px]]


**Вывод:** Гипотеза не подтвердилась. Коэффициент отрицательный (это соответствует ожидаемому направлению: чем выше мобильность, тем ниже текучесть), но p-value = 0,173 > 0,05, поэтому результат статистически не значим. R-квадрат очень маленький, что говорит об очень слабой связи.
'''Вывод:''' Гипотеза не подтвердилась. Коэффициент отрицательный (это соответствует ожидаемому направлению: чем выше мобильность, тем ниже текучесть), но p-value = 0,173 > 0,05, поэтому результат статистически не значим. R-квадрат очень маленький, что говорит об очень слабой связи.


---
---
Строка 113: Строка 115:
=== Результат 3: Влияние вариативности качества школ на неравенство ===
=== Результат 3: Влияние вариативности качества школ на неравенство ===


**Спецификация модели:**
'''Спецификация модели:'''
* Y = `satisfaction-inequality` (неравенство удовлетворённости)
* Y = `satisfaction-inequality` (неравенство удовлетворённости)
* X = `Sch_Quality_Variation` (разброс качества между школами)
* X = `Sch_Quality_Variation` (разброс качества между школами)


**Результаты регрессии:**
'''Результаты регрессии:'''


{| class="wikitable"
{| class="wikitable"
Строка 131: Строка 133:
|}
|}


**График:** [[Файл:Кач_шк_гр.jpg|600px]]
'''График:'''
[[Файл:Кач_шк_гр.jpg|600px]]


**Вывод:** Гипотеза подтвердилась (связь статистически значима, p < 0,001). Однако коэффициент оказался отрицательным, а не положительным. Это значит, что при увеличении разброса качества между школами неравенство удовлетворённости снижается. R-квадрат = 0,164 — модель объясняет около 16% дисперсии.
'''Вывод:''' Гипотеза подтвердилась (связь статистически значима, p < 0,001). Однако коэффициент оказался отрицательным, а не положительным. Это значит, что при увеличении разброса качества между школами неравенство удовлетворённости снижается. R-квадрат = 0,164 — модель объясняет около 16% дисперсии.


**Почему так получилось:** Возможное объяснение — учителя из школ с низким качеством увольняются из-за неудовлетворённости и покидают рынок. В итоге в системе остаются в основном те, кто работает в хороших или средних школах, и разрыв в удовлетворённости сокращается.
'''Почему так получилось:''' Возможное объяснение — учителя из школ с низким качеством увольняются из-за неудовлетворённости и покидают рынок. В итоге в системе остаются в основном те, кто работает в хороших или средних школах, и разрыв в удовлетворённости сокращается.


---
---


## Сводная таблица результатов
== Сводная таблица результатов ==


{| class="wikitable"
{| class="wikitable"
Строка 151: Строка 154:
|}
|}


## Общее заключение
== Общее заключение ==


Из трёх проверенных факторов только один показал статистически значимое влияние — это вариативность качества школ. Но это влияние оказалось обратным: чем больше школы различаются по качеству, тем ниже неравенство в удовлетворённости. Вероятно, потому что учителя из плохих школ уходят, и остаются только те, кто в целом доволен.
Из трёх проверенных факторов только один показал статистически значимое влияние — это вариативность качества школ. Но это влияние оказалось обратным: чем больше школы различаются по качеству, тем ниже неравенство в удовлетворённости. Вероятно, потому что учителя из плохих школ уходят, и остаются только те, кто в целом доволен.
Строка 157: Строка 160:
Зарплата и мобильность учителей в данной модели не влияют на удовлетворённость и текучесть. Это может означать, что ключевые механизмы модели завязаны не на этих параметрах, а на чём-то другом — например, на соотношении зарплаты и качества школы, а не на их абсолютных значениях.
Зарплата и мобильность учителей в данной модели не влияют на удовлетворённость и текучесть. Это может означать, что ключевые механизмы модели завязаны не на этих параметрах, а на чём-то другом — например, на соотношении зарплаты и качества школы, а не на их абсолютных значениях.


## Участники и распределение ролей
== Участники и распределение ролей ==


* **Гловели Джемма** — постановка гипотез, загрузка и подготовка данных, регрессионный анализ в Excel, интерпретация коэффициентов
* '''Гловели Джемма''' — постановка гипотез, загрузка и подготовка данных, регрессионный анализ в Excel, интерпретация коэффициентов
* **Горынин Леонид** — визуализация результатов: построение точечных диаграмм с линиями тренда для трёх гипотез, подготовка графиков
* '''Горынин Леонид''' — визуализация результатов: построение точечных диаграмм с линиями тренда для трёх гипотез, подготовка графиков
* **Дериволкова Алина** — оформление отчёта на вики-странице, форматирование таблиц и графиков, итоговая редакция
* '''Дериволкова Алина''' — оформление отчёта на вики-странице, форматирование таблиц и графиков, итоговая редакция


## Ссылки
== Ссылки ==


* [[Практикум по эконометрике (syllabus)]]
* [[Практикум по эконометрике (syllabus)]]
Строка 170: Строка 173:
* Wilensky, U. (1999). NetLogo. http://ccl.northwestern.edu/netlogo/
* Wilensky, U. (1999). NetLogo. http://ccl.northwestern.edu/netlogo/
* Репозиторий с данными: https://github.com/patarakin/stat-data
* Репозиторий с данными: https://github.com/patarakin/stat-data
----


[[Категория:Работы по эконометрике]]
[[Категория:Работы по эконометрике]]

Версия от 14:40, 10 июня 2026

Исследование удовлетворённости учителей (Teacher Satisfaction)

 Description
Teacher Satisfaction

Аннотация

В данном проекте анализируется модель Teacher Satisfaction — агентная симуляция рынка труда учителей. В этой модели учителя выбирают школу на основе трёх критериев: зарплата, качество школы и расстояние до работы. Если учитель недоволен, он увольняется и ищет другое место. Саму модель мы не запускали, а использовали готовые датасеты, выложенные авторами на GitHub. Наша задача — с помощью регрессионного анализа проверить три гипотезы о том, какие факторы на самом деле влияют на удовлетворённость учителей и текучесть кадров.

Цель работы

Выявить, какие из трёх факторов (зарплата, мобильность учителей, разброс качества между школами) статистически значимо влияют на удовлетворённость учителей и текучесть кадров в рамках модели Teacher Satisfaction.

Рабочие гипотезы

Гипотеза 1 (Дериволкова Алина) — Влияние зарплаты на удовлетворённость

H₀: Базовая зарплата не влияет на среднюю удовлетворённость учителей.

H₁: Увеличение базовой зарплаты повышает среднюю удовлетворённость учителей.

Гипотеза 2 (Горынин Леонид) — Влияние мобильности на текучесть

H₀: Радиус мобильности учителей не влияет на текучесть кадров.

H₁: Чем больше радиус мобильности (готовность ехать дальше), тем ниже текучесть кадров.

Гипотеза 3 (Гловели Джемма) — Влияние качества школ на неравенство

H₀: Разброс качества между школами не влияет на неравенство удовлетворённости учителей.

H₁: Чем больше школы различаются по качеству, тем выше неравенство в удовлетворённости учителей.

Модель и данные

Модель Teacher Satisfaction реализована в среде NetLogo. Она симулирует поведение учителей и школ: учителя ищут работу, ориентируясь на зарплату, качество и расстояние; школы нанимают учителей. Если удовлетворённость учителя падает ниже порогового значения, он увольняется.

Для анализа мы не запускали модель самостоятельно, а взяли готовые датасеты из репозитория авторов. Эти файлы содержат результаты многократных прогонов модели при разных комбинациях параметров. Всего мы использовали три файла:

  • `TS_Salary.csv` — данные о зарплате и удовлетворённости
  • `TS_Mobil_Satisf.csv` — данные о мобильности и текучести
  • `TS_S_Quality.csv` — данные о вариативности качества школ и неравенстве удовлетворённости

Инструменты и метод

Для анализа мы использовали Microsoft Excel (пакет анализа, инструмент «Регрессия»). Для каждой гипотезы была построена парная линейная регрессия вида:

Y = α + β·X + ε

где Y — зависимая переменная, X — независимая переменная, β — коэффициент регрессии (показывает направление и силу связи), α — свободный член, ε — случайная ошибка.

Для каждой модели мы оценивали три ключевых показателя:

  • Коэффициент β — положительный или отрицательный (направление связи)
  • R-квадрат — доля дисперсии Y, которую объясняет X
  • P-значение — статистическая значимость (если меньше 0.05, связь не случайна)

Результаты регрессионного анализа

Результат 1: Влияние зарплаты на удовлетворённость

Спецификация модели:

  • Y = `mean-satisfaction-all` (средняя удовлетворённость)
  • X = `Base_Salary` (базовая зарплата)

Результаты регрессии:

Показатель Значение
R-квадрат 0,000256
Коэффициент при зарплате 0,000000457
P-значение (Значимость F) 0,5715
Количество наблюдений 1249

График:

Вывод: Гипотеза не подтвердилась. Коэффициент практически равен нулю, p-value = 0,57 (намного выше порога 0,05), R-квадрат почти ноль. Это означает, что в данной модели зарплата не влияет на удовлетворённость учителей.

---

Результат 2: Влияние мобильности на текучесть

Спецификация модели:

  • Y = `teacher-turnover-rate` (текучесть кадров)
  • X = `academic-mobility-radius` (радиус мобильности)

Результаты регрессии:

Показатель Значение
R-квадрат 0,00149
Коэффициент при мобильности -0,0000898
P-значение (Значимость F) 0,1727
Количество наблюдений 1249

График:

Вывод: Гипотеза не подтвердилась. Коэффициент отрицательный (это соответствует ожидаемому направлению: чем выше мобильность, тем ниже текучесть), но p-value = 0,173 > 0,05, поэтому результат статистически не значим. R-квадрат очень маленький, что говорит об очень слабой связи.

---

Результат 3: Влияние вариативности качества школ на неравенство

Спецификация модели:

  • Y = `satisfaction-inequality` (неравенство удовлетворённости)
  • X = `Sch_Quality_Variation` (разброс качества между школами)

Результаты регрессии:

Показатель Значение
R-квадрат 0,1637
Коэффициент при вариативности качества -0,0867
P-значение (Значимость F) 1,24 × 10⁻⁴⁰ (< 0,001)
Количество наблюдений 999

График:

Вывод: Гипотеза подтвердилась (связь статистически значима, p < 0,001). Однако коэффициент оказался отрицательным, а не положительным. Это значит, что при увеличении разброса качества между школами неравенство удовлетворённости снижается. R-квадрат = 0,164 — модель объясняет около 16% дисперсии.

Почему так получилось: Возможное объяснение — учителя из школ с низким качеством увольняются из-за неудовлетворённости и покидают рынок. В итоге в системе остаются в основном те, кто работает в хороших или средних школах, и разрыв в удовлетворённости сокращается.

---

Сводная таблица результатов

Гипотеза Ожидаемый знак Полученный знак p-value Статус
H1: зарплата → удовлетворённость + ≈0 0,57 0,000 не подтверждена
H2: мобильность → текучесть 0,17 0,001 не подтверждена
H3: качество школ → неравенство + < 0,001 0,164 подтверждена (обратная связь)

Общее заключение

Из трёх проверенных факторов только один показал статистически значимое влияние — это вариативность качества школ. Но это влияние оказалось обратным: чем больше школы различаются по качеству, тем ниже неравенство в удовлетворённости. Вероятно, потому что учителя из плохих школ уходят, и остаются только те, кто в целом доволен.

Зарплата и мобильность учителей в данной модели не влияют на удовлетворённость и текучесть. Это может означать, что ключевые механизмы модели завязаны не на этих параметрах, а на чём-то другом — например, на соотношении зарплаты и качества школы, а не на их абсолютных значениях.

Участники и распределение ролей

  • Гловели Джемма — постановка гипотез, загрузка и подготовка данных, регрессионный анализ в Excel, интерпретация коэффициентов
  • Горынин Леонид — визуализация результатов: построение точечных диаграмм с линиями тренда для трёх гипотез, подготовка графиков
  • Дериволкова Алина — оформление отчёта на вики-странице, форматирование таблиц и графиков, итоговая редакция

Ссылки