Прикладная образовательная эконометрика

Материал из Поле цифровой дидактики


Описание Прикладная образовательная эконометрика — это раздел эконометрики и наук об образовании, который использует эконометрические методы для анализа микроданных об обучающихся, преподавателях, курсах и образовательных организациях с целью:
  • количественно описывать образовательные процессы;
  • оценивать эффекты образовательных интервенций и образовательной политики;
  • оптимизировать распределение ресурсов в образовании;
  • строить и проверять модели формирования человеческого капитала.
Область знаний Экономика, Образование, Управление
Авторы
Поясняющее видео
Близкие понятия Эконометрика
Среды и средства для освоения понятия NetLogo, R, CODAP, StatKey

Прикладная образовательная эконометрика

Она опирается на традиционную economics of education (economics of education / economics of human capital) Education economics - Wikipedia. https://en.wikipedia.org/wiki/Education_economics и развивает те методы, которые специально «заточены» под образовательные данные: достижения, траектории, выборы курсов, неравенство образовательных возможностей, учительские и школьные эффекты и т.п.


Место внутри наук об образовании

Внутри широкого поля наук об образовании прикладная образовательная эконометрика пересекается с тремя направлениями:

  1. Экономика образования (economics of education)
    • Волны работ о доходах от образования (Mincer-тип уравнений, human capital models) https://en.wikipedia.org/wiki/Education_economics
    • Оценка отдачи от дополнительных лет обучения, качества школ, программ поддержки и т.п.
  2. Educational effectiveness research / school effectiveness
    • Учительские эффекты, школьные эффекты, value-added-модели, вклад конкретных школ и учителей в прирост результатов учащихся (test score gains), влияние состава класса и т.п.
  3. Learning analytics / educational data science
    • Анализ логов LMS, поведенческих следов, цифровых образовательных ресурсов; переход от «описательной аналитики» к строгим эконометрическим моделям (регрессии, панельные и многоуровневые модели, причинный вывод).

Особенность именно эконометрики в том, что она:

  • чётко формулирует стохастическую модель данных;
  • явно работает с допущениями (о причинности, эндогенности, гетерогенности и т.д.);
  • нацелена не только на предсказание, но и на интерпретацию параметров и оценку причинных эффектов.

Объекты и типы данных в образовательной эконометрике

Базовый строительный блок — микроданные (unit-level data)Research Microdata Files | Statistics

  • единица наблюдения: студент, курс, группа, школа, преподаватель;
  • для каждой единицы — набор числовых и категориальных признаков.

Примеры «единиц»:

  • Студент × дисциплина × семестр — именно такой формат с 300 студентами в нескольких дисциплинах.
  • Ученик × школа × год обучения (типичные государственные панели учеников).
  • Слушатель онлайн-курса × неделя курса (MOOC-данные, логи LMS).

По структуре данные часто:

  • Панельные: повторные измерения по времени (студент наблюдается несколько семестров / лет)
  • Иерархические (многоуровневые): студенты вложены в группы, группы в курсы, курсы в программы, программы в вузы.
  • Смешанные: панель + иерархия (ученик в классе, класс в школе, школа в муниципалитете, измерения по годам).

Примеры реальных образовательных микроданных:

  • Survey of Education and Work (Австралия) предоставляют обезличенные микроданные студентов и выпускников, позволяющие строить регрессионные, панельные и многоуровневые модели<ref name="eheso">EHESO Microdata Access.

Базовые эконометрические модели на образовательных данных

Линейная регрессия для успеваемости и активности

Классический пример: объяснить итоговую оценку студента по дисциплине через его характеристики и образовательный контекст.

Формально:

[math]\displaystyle{ Y_i = \beta_0 + \beta_1 X_{i1} + \dots + \beta_k X_{ik} + \varepsilon_i }[/math]

где \(Y_i\) — итоговая оценка студента \(i\), \(X_{ij}\) — характеристики студента и курса (часы активности, посещаемость, профиль подготовки, дисциплина и т.п.).

Пример из образовательной практики:

  • \(Y_i\) — экзаменационная оценка по курсу «Введение в эконометрику»;
  • \(X_{i1}\) — число просмотренных страниц на digida.mgpu.ru;
  • \(X_{i2}\) — число решённых онлайн-задач;
  • \(X_{i3}\) — индикатор дисциплины (история / филология / информатика);
  • \(X_{i4}\) — средний балл по математике при поступлении.

4.2. Бинарные и многономинальные модели (logit/probit, multinomial)

Используются, когда зависимая переменная — событие: сдал/не сдал, дослушал курс/отвалился, выбрал направление А/В/С.

[math]\displaystyle{ P(Y_i = 1 \mid X_i) = F(X_i^\top \beta) }[/math]

где \(F\) — логистическая или нормальная (probit) функция распределения.

Образовательный пример:

  • \(Y_i = 1\), если студент сдал экзамен с первой попытки;
  • \(X_i\) включает: посещаемость семинаров, участие в форуме курса, тип школы, которую он закончил, и пр.

4.3. Модели счётных данных (Poisson, Negative Binomial)

Для числа попыток теста, числа сообщений на форуме, числа задач, решённых студентом и т.п.

[math]\displaystyle{ \mathbb{E}[Y_i \mid X_i] = \exp(X_i^\top \beta) }[/math]

Пример: число сообщений в обсуждении курса.

5. Панельные и многоуровневые модели в образовании

Панельные модели позволяют контролировать ненаблюдаемую гетерогенность студентов/школ (устойчивые индивидуальные особенности) и отслеживать динамику достижений и эффект накопления человеческого капитала во времени (year-to-year test-score gains)<ref name="hse"/><ref name="stern"/><ref name="oru"/><ref name="unibo"/>.

5.1. Простая панельная модель достижений ученика

[math]\displaystyle{ Y_{it} = \alpha_i + \lambda_t + X_{it}^\top \beta + \varepsilon_{it} }[/math]

где: \(Y_{it}\) — результат ученика \(i\) в году \(t\); \(\alpha_i\) — индивидуальный фиксированный эффект ученика; \(\lambda_t\) — годовой эффект (реформы, ковид и пр.); \(X_{it}\) — ковариаты (часы подготовки, участие в программе поддержки).

5.2. Многоуровневые (иерархические) модели

Позволяют явно моделировать структуру «ученик в классе в школе».

Пример двухуровневой модели:

<math>Y_{ij} = \beta_0 + \