Практикум по эконометрике (syllabus)

Материал из Поле цифровой дидактики
Версия от 11:00, 19 февраля 2026; Patarakin (обсуждение | вклад)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)



Планируемые результаты обучения (Знать, Уметь, Владеть) Знать:
  1. основные параметры распределений (математическое ожидание, дисперсия, стандартное отклонение) и их интерпретацию в социальных исследованиях;
  2. понятие корреляции и ковариации, методы оценки линейной связи между социально-экономическими показателями;
  3. базовые принципы регрессионного анализа: концепция модели, остатки, предпосылки (линейность, гомоскедастичность, нормальность остатков).
Уметь
  1. рассчитывать и интерпретировать статистические характеристики выборки на конкретных данных (например, оценки доходов семей из выборочного обследования населения);
  2. строить и проверять графики распределения выборочных данных и диаграммы рассеяния для анализа связи между переменными;
  3. оценивать параметры простой линейной регрессии и проводить тест значимости коэффициентов (t-тест, F-тест).
Владеть
  1. навыками описательного анализа с помощью R (функции mean(), sd(), plot(), lm());
  2. приёмами проверки предпосылок регрессионной модели через графики остатков и тесты на гетероскедастичность
Содержание разделов курса -
Введение в эконометрику
Регрессионный анализ
Анализ временных рядов

Основные элементы временного ряда. Автокорреляция уровней временного ряда и выявление его структуры. Методы исключения тенденции. Автокорреляция в остатках.

Системы эконометрических уравнений

Общее понятие о системах уравнений, используемых в эконометрике. Структурная и приведенная формы модели.

Видео запись
Среды и средства, которые поддерживают учебный курс NetLogo, R, CODAP, Simple Economy, Urban Suite - Economic Disparity, Central Limit Theorem, Random Basic Advanced, StatKey, CORGIS, RAWGraphs
Книги, на которых основывается учебный курс Introduction to Econometrics with R, Дружелюбная эконометрика, Big Data with R

Последовательность курса


Содержание курса

Курс начинается с подготовительных блоков (outcomes, понятия, ресурсы), где вводятся компетенции по анализу данных образования и инструменты вроде R для регрессии, NetLogo для симуляций классов/групп студентов. Основной поток структурирован по обязательным темам:

  1. Введение фокусируется на типичных образовательных данных (панели вузов, временные ряды онлайн-курсов)
  2. Регрессионный анализ охватывает OLS/logit для предикторов dropout (возраст, мотивация), с бутстрапом для интервальных оценок;
  3. Анализ временных рядов применяет ARIMA к динамике успеваемости или метрикам E-learning;
  4. Системы уравнений разбирают 2SLS для эндогенных выборов (вуз/специальность).

Параллельно интегрируется NetLogo для генерации синтетических данных (агенты-студенты с поведением), которые затем анализируются эконометрически, связывая с материалами DigiDa по моделированию. ​

Каждый этап завершается мини-заданиями в SMW (DigiDa-страницы), а финальный мини-проект — полным циклом:

  • симуляция в NetLogo (например, модель мотивации в классе),
  • бутстрап-регрессия на сгенерированных данных, выводы по эффективности вмешательств.

Итоговая проверка outcomes обеспечивает достижение: студенты публикуют скрипты, модели и категории в вики,

Введение в эконометрику

 Description
ЭконометрикаЭконометрика — наука, изучающая количественные и качественные экономические взаимосвязи с помощью математических и статистических методов. Современное определение предмета эконометрики было выработано в уставе Эконометрического общества, которое главными целями назвало использование статистики и математики для развития экономической теории. Термин «эконометрика» состоит из двух частей: «эконо» — от «экономика» и «метрика» — от «измерение». Теоретическая эконометрика рассматривает статистические свойства оценок и испытаний, в то время как прикладная эконометрика занимается применением эконометрических методов для оценки экономических теорий.


Предмет и задачи эконометрики

Эконометрика исследует применимость статистических методов к экономическим данным для проверки экономических теорий и построения прогностических моделей. Основные задачи:

  • Построение и оценка регрессионных моделей. Общая форма простой линейной регрессии:

[math]\displaystyle{ y_i=\beta_0+\beta_1x_i+\varepsilon_i }[/math]

  • Оценка параметров с помощью метода наименьших квадратов (МНК)

[math]\displaystyle{ S = \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 \rightarrow \min }[/math]

  • Проверка статистических гипотез (t-тест, F-тест).
  • Построение доверительных интервалов и прогнозирование.

Модели практической образовательной эконометрики

 Description
GenderDeSegregationSchoolМодель воспроизводит изменения в проценте женщин-учителей в гимназиях федеральной земли Рейнланд-Пфальц в Германии с 1950 по 1989 год. Она начинается с данных о количестве мужчин и женщин-учителей в этих школах в 1950 году, которые считываются из файла school.txt, и отображает их на карте Рейнланд-Пфальца
  • 120px-School_genderSegregation.jpg
Minority GameМодель Minority Game (Игра меньшинства) — это упрощённая модель экономического рынка, в которой агенты конкурируют, пытаясь оказаться в меньшинстве. На каждом временном шаге каждый агент выбирает одну из двух сторон (0 или 1). Побеждают те агенты, которые оказались в меньшинстве — на стороне, выбранной меньшим числом участников. За каждую победу агент получает очко. Каждый агент располагает набором предопределённых стратегий (например, пять стратегий). Стратегия — это правило, которое на основе истории прошлых результатов предсказывает, какая сторона будет в меньшинстве. Важно: агенты видят только историю победивших, а не количество агентов, выбравших каждую сторону. История прошлых выборов кодируется в двоичное число и используется как индекс для поиска в таблице стратегии. Каждая стратегия отслеживает свои собственные виртуальные очки — как она бы предсказывала на каждом шаге. Агент всегда использует стратегию с наибольшим количеством виртуальных очков.
School Choice ABMМодель "School Enrollment" представляет собой модель, которая иллюстрирует систему школьного образования в Чили, основанную на рыночных принципах. В этой модели студенты могут выбирать между различными типами школ: государственными, частными с ваучерами и частными платными. Модель изображает город, в котором расположены школы и студенты.
schools-own - enrollment achievement traffic-lights-color is-private?
students-own - target enrolled? income years-in-school school-achievement

Есть версии, когда имеют дополнительные атрибуты, такие как географическое положение, сектор (государственная или частная), стоимость обучения, уровень достижений студентов, максимальная вместимость, год открытия и закрытия, а также вероятность того, что о ней узнают ученики.

  • School_achivements.jpg
School Education CompetitionМодель описывает роль образования в повышении социального статуса и содействии социальной мобильности, подчеркивая, что семьи прилагают все усилия для получения лучших образовательных возможностей, особенно в странах с высокой конкурентностью в сфере образования (Китай).
  • Эта модель позволяет исследовать динамику образовательной конкуренции и влияние различных факторов на качество образования и равенство возможностей среди студентов.
  • 120px-Ed_competition_Model.jpg
  • Simple EconomySimple Economy представляет собой базовую модель экономического обмена из второй главы учебника "Introduction to Agent-Based Modeling" Ури Виленского и Уильяма Рэнда. Это мысленный эксперимент простейшей экономической системы, где на каждом временном шаге каждый агент передает один доллар случайно выбранному другому агенту, если у него есть деньги для передачи.
    Small group discussionМодель обсуждения в малой группе. Модель
  • Различает роли студента и преподавателя — позволяет моделировать педагогические стратегии, а не только традиционные подходы к моделированию популяции агентов
  • Агенты имеют убеждения о собственных состояниях и состояниях других агентов, которые изменяются в результате вербальных транзакций
  • Учитывает конкуренцию и кооперацию как факторы, формирующие характер групповой дискуссии
  • Предоставляет теоретическую перспективу для анализа индивидуального и группового развития вовлечённости в задачу (активность) и социальной вовлечённости с одноклассниками (дискурсивность) в независимых и модерируемых преподавателем малых группах
  • Teacher Satisfaction (model)Модель удовлетворённости учителей — агентно-ориентированная симуляция рынка труда преподавателей в городской системе образования. Учителя выбирают работу по зарплате, качеству школы и расстоянию, их удовлетворённость (0-1) определяет текучесть кадров. Модель показывает стратификацию: хорошие школы заполнены (satisfaction 0.9), плохие пустеют (satisfaction 0.2), безработица минимальна.
    Urban Suite - Economic DisparityМодель "Urban Suite - Economic Disparity" представляет упрощённую городскую экономическую систему, где агенты с различным социально-экономическим статусом конкурируют за землю в городском пространстве. Модель исследует процессы пространственной сегрегации и формирования экономического неравенства в городской среде. В модели есть фиксированные рабочие места (серые квадраты), распределённые по городской территории. Агенты стремятся минимизировать расстояние до ближайшего места работы.
    Wealth DistributionМодель распределения богатства в экономике. Данная модель представляет собой агентную вычислительную модель (Agent-based Model) распределения богатства, основанную на классической работе Эпштейна и Акстелла "Sugarscape". Модель демонстрирует механизм неравенства в распределении богатства, где "богатые становятся богаче, а бедные беднее", что соответствует закону Парето.
     Description
    Central Limit TheoremМодель "Central Limit Theorem" представляет население, распределённое по некоторой переменной (например, общие активы в тысячах долларов). Население распределено произвольно — не обязательно нормально — но выборочные средние из этой популяции тем не менее накапливаются в распределении, которое приближается к нормальной кривой.
    1. Парная регрессия. Спецификация модели.
    2. Линейная регрессия и корреляция: смысл и оценка параметров.
    3. Нелинейная регрессия. Подбор линеаризующего преобразования. Корреляция для нелинейной регрессии. Средняя ошибка аппроксимации.
    4. Множественная регрессия. Спецификация модели.
      • Отбор факторов при построении множественной регрессии. Выбор формы уравнения регрессии. Оценка параметров уравнения множественной регрессии. Частные уравнения регрессии.
    5. Множественная корреляция. Частная корреляция. Оценка надежности результатов множественной регрессии и корреляции.

    Использование Testimate (CODAP) для регрессионного анализа


    Анализ временных рядов

    1. Основные элементы временного ряда.
    2. Автокорреляция уровней временного ряда и выявление его структуры.
    3. Методы исключения тенденции.
    4. Автокорреляция в остатках.
    5. Критерий Дарбина-Уотсона.


    Система эконометрических уравнений

     Description
    Система эконометрических уравненийСистема эконометрических уравнений представляет собой совокупность взаимосвязанных регрессионных уравнений, каждая из которых описывает определённый аспект экономических процессов. В таких системах учтены эндогенные переменные (зависящие от модели) и экзогенные (внешние факторы). Отличительной особенностью такой системы является то, что одна и та же переменная может одновременно выступать в качестве зависимой переменной в одном уравнении и независимой переменной в другом. Системы уравнений используются для моделирования сложных социально-экономических процессов, которые невозможно описать одиночным уравнением

    Книги

     Description
    An Introduction to Agent-Based Modeling: Modeling Natural, Social, and Engineered Complex Systems with NetLogoВведение в моделирование систем при помощи языка NetLogo (от создателя языка) - использование NetLogo в естественно-научном, инженерном и общественном образовании
    Causal Inference in RWelcome to Causal Inference in R. Answering causal questions is critical for scientific and business purposes, but techniques like randomized clinical trials and A/B testing are not always practical or successful. The tools in this book will allow readers to better make causal inferences with observational data with the R programming language. By its end, we hope to help you:
    1. Ask better causal questions.
    2. Understand the assumptions needed for causal inference
    3. Identify the target population for which you want to make inferences
    4. Fit causal models and check their problems
    5. Conduct sensitivity analyses where the techniques we use might be imperfect
    Causal Inference: The MixtapeКнига "Causal Inference: The Mixtape" Скотта Каннингема — это современное и практическое введение в методы причинно-следственного вывода, которые позволяют исследователям в социальных науках определить, что именно вызывает те или иные эффекты. Книга посвящена инструментам и методам, с помощью которых можно ответить на вопросы причинно-следственных связей в сложном мире. Например, как повышение минимальной зарплаты влияет на занятость, как дошкольное образование влияет на вероятность заключения в тюрьму в будущем, или как распределение противомалярийных сеток влияет на экономический рост в развивающихся странах.
    Introduction to Econometrics with RВведение в эконометрику с R - учебник по эконометрике с использованием языка R - еще на стадии совместного редактирования
    Introductory Statistics for EconomicsКнига "Introductory Statistics for Economics" предназначена для знакомства студентов с базовыми статистическими методами и их применением в экономике. Учебник содержит большое количество практических примеров и упражнений на языке программирования R, что формирует основные навыки данных и статистического анализа. Эти навыки отлично совмещаются с агентным моделированием в NetLogo, ведь полученные инструменты анализа данных и программирования применимы для анализа результатов симуляций и их визуализации.
    Дружелюбная эконометрикаОсновы эконометрической теории

    Детальное обсуждение применения эконометрики на практике.

    Много отсылок к хорошим исследованиям, использующим эмпирические методы.


    Инструменты

     Description
    BehaviorSpaceСпециальная отдельная программа, встроенная в среду агентного моделирования NetLogo и предназначенная для постановки экспериментов. BehaviorSpace - это программный инструмент, интегрированный с NetLogo, который позволяет проводить эксперименты с моделями.
    • 120px-Behavior_space_flocking.png
    CORGISКоллекция реальных датасетов для образовательного программирования - CORGIS (Collection of Really Great, Interesting, Situated Datasets) — это образовательный проект, разработанный для интеграции анализа данных и программирования в учебный процесс. Проект предоставляет более 40 тщательно подготовленных датасетов из различных областей знаний. Основная цель проекта — сделать изучение программирования более привлекательным и мотивирующим для студентов различных специальностей, предоставляя им возможность работать с реальными данными из областей, связанных с их будущей карьерой.
    DatawrapperDatawrapper — это онлайн-инструмент для визуализации данных, позволяющий создавать интерактивные диаграммы, карты и таблицы без необходимости программирования. Впервые публичная бета-версия Datawrapper была выпущена в феврале 2012 года, а версия 1.0 вышла в декабре 2012 года. Разработчики ставили задачу упростить и ускорить процесс создания визуализаций, чтобы журналисты, преподаватели и аналитики могли быстро представлять сложные данные в наглядной форме.
    NetLogoЯзык программирования и среда для построения многоагентных моделей. В качестве агентов в системе действуют пятна, черепашки и связи. Ко всем агентам можно обратится. При этом пятна нельзя уничтожить, а связи исчезают, если погибают черепашки, которых они связывают. NetLogo чаще других используется при создании многоагентных моделей, поскольку программы не этом языке понятны специалистам различных предметных областей. Библиотека NetLogo содержит множество готовых моделей по биологии, математике, химии, социология. С этими моделями могут ознакомиться и поиграть ученики.
    RAWGraphsRAWGraphs - это веб-приложение с открытым исходным кодом для визуализаций статических данных. При этом формы представления данных можно изменять. Не требует регистрации.
    StatKeyобразовательный веб-инструмент для статистического анализа - не требует регистрации.
    Time Series LabTime Series Lab (TSL) — это мощное бесплатное программное обеспечение для анализа, моделирования и прогнозирования временных рядов, разработанное академическими учёными с позицией в ведущих университетах