Социально-экономическая статистика и эконометрика/exam questions: различия между версиями
Материал из Поле цифровой дидактики
Patarakin (обсуждение | вклад) Новая страница: «== Понятия и темы == # Типы переменных Вопрос: Объясните понятие категориальной переменной в отличие от количественной. #* Категориальная переменная разбивает объекты на группы (классы, категории) и не имеет числового смысла #* В модели Simple Economy «богатст...» |
Patarakin (обсуждение | вклад) Нет описания правки |
||
| Строка 34: | Строка 34: | ||
#* Доля вариации зависимой переменной, которая объясняется нашей моделью | #* Доля вариации зависимой переменной, которая объясняется нашей моделью | ||
#* | #* | ||
# Множественная регрессия | # [[Множественная регрессия]] | ||
#* Модель, где на результат влияет не один, а несколько факторов одновременно | |||
#* | #* | ||
# Временные ряды, понятие [[тренд]]а | |||
#* основная, долгосрочная тенденция изменения показателя | |||
#* | #* | ||
# | # Временные ряды, понятие сезонности | ||
#* Регулярные, повторяющиеся колебания внутри года, связанные с временами года | |||
#* | #* | ||
# Статистика населения - понятия естественного и механического движения населения | |||
#* | |||
#* | #* | ||
# | # Статистика труда - понятие рабочей силы | ||
#* | #* | ||
#* | #* | ||
# | # [[Метод Монте-Карло]] | ||
#* Метод решения задач с помощью множества случайных экспериментов | |||
#* CODAP, [[NetLogo]] | |||
# Статистические гипотезы - понятие нулевой гипотезы | |||
#* гипотеза «по умолчанию»: эффекта нет, разницы нет | |||
#* | #* | ||
# P-значение - [[p-value]] | |||
#* Вероятность получить такие же данные (или еще более выраженные) случайно, если на самом деле эффекта нет | |||
#* p-value < 0.05, - слишком маловероятно, чтобы быть совпадением | |||
# [[Дескриптивный анализ]] - выброс в данных | |||
#* | #* | ||
#* | #* | ||
# Описательные статистики и форма распределения - как соотносятся между собой среднее арифметическое, медиана и мода в случае асимметричного распределения | |||
#* | |||
#* Распределение богатства в модели [[Simple Economy]]: горб слева, хвост справа | |||
# [[Центральная предельная теорема]] | |||
#* средние большого количества независимых случайных величин всегда стремятся к нормальному распределению, какой бы формы ни были сами величины | |||
#* | #* | ||
# [[Парная регрессия]] + [[гетероскедастичность]] | |||
#* Ситуация, когда разброс ошибок (остатков) модели непостоянен — он меняется (например, растет) с ростом переменной X. | |||
#* | |||
# [[Множественная регрессия]] [[мультиколлинеарность]] | |||
#* факторы дублируют друг друга (например, «возраст» и «стаж»). Модель не может понять, какой именно из факторов влияет на Y. Коэффициенты становятся неустойчивыми и могут менять знаки. | |||
#* | |||
# Выбросы и влиятельные наблюдения | |||
#* Выброс — это точка далеко от облака данных (большая ошибка). Влиятельное наблюдение (рычаг) — точка, которая находится далеко от центра по оси X и «притягивает» линию регрессии к себе | |||
#* | |||
# Корреляция, причинность и смещения - Ложная корреляция | |||
#* связь между X и Y вызвана не их взаимодействием, а влиянием третьей, скрытой переменной Z на оба фактора | |||
#* | |||
# [[Парадокс Симпсона]] | |||
#* Если одна группа численно доминирует или имеет совершенно другие базовые показатели, объединение данных искажает выводы | |||
#* | |||
# Автокорреляция | |||
#* Это корреляция ряда с самим собой, но со сдвигом во времени. Означает инерцию процесса | |||
#* | |||
# Объясните механизм возникновения неравенства (распределения Больцмана-Гиббса) в модели Simple Economy | |||
#* Деньги аккумулируются у везучих, формируя [[степенной закон]] распределения | |||
#* | |||
== Практические вопросы == | == Практические вопросы == | ||
Версия от 21:37, 27 ноября 2025
Понятия и темы
- Типы переменных Вопрос: Объясните понятие категориальной переменной в отличие от количественной.
- Категориальная переменная разбивает объекты на группы (классы, категории) и не имеет числового смысла
- В модели Simple Economy «богатство» агента — количественная, а «цвет» агента или «состояние» (работает/ищет) — категориальная
- Средние величины - медиана, мода
- Показатели вариации - дисперсия
- Это мера разброса данных. Показывает, насколько сильно значения в среднем отклоняются от «центра» (среднего)
- В Simple Economy: разрыв между бедными и богатыми
- Показатели вариации - коэффициент вариации
- относительная мера разброса (в процентах) - сравнивать разброс величин с разным масштабом
- Гистограмма распределения
- Это график, показывающий, как часто встречаются разные значения переменной. Позволяет увидеть форму распределения (симметричное или скошенное)
- см. CODAP: гистограмма роста студентов.
- Диаграмма рассеяния (Scatter Plot)
- График, где каждая точка — это одно наблюдение с координатами X и Y.
- CODAP
- Корреляция
- Cогласованность изменений двух величин
- Продажи мороженого и количество солнечных ожогов коррелируют
- Коэффициент корреляции
- Число от -1 до 1, показывающее силу линейной связи. 1 — строгая прямая связь, -1 — строгая обратная, 0 — связи нет
- Парная линейная регрессия
- Метод наименьших квадратов
- Способ провести линию так, чтобы сумма квадратов расстояний (ошибок) от всех точек до этой линии была минимальной
- CODAP
- Коэффициента детерминации (R-квадрат)
- Доля вариации зависимой переменной, которая объясняется нашей моделью
- Множественная регрессия
- Модель, где на результат влияет не один, а несколько факторов одновременно
- Временные ряды, понятие тренда
- основная, долгосрочная тенденция изменения показателя
- Временные ряды, понятие сезонности
- Регулярные, повторяющиеся колебания внутри года, связанные с временами года
- Статистика населения - понятия естественного и механического движения населения
- Статистика труда - понятие рабочей силы
- Метод Монте-Карло
- Метод решения задач с помощью множества случайных экспериментов
- CODAP, NetLogo
- Статистические гипотезы - понятие нулевой гипотезы
- гипотеза «по умолчанию»: эффекта нет, разницы нет
- P-значение - p-value
- Вероятность получить такие же данные (или еще более выраженные) случайно, если на самом деле эффекта нет
- p-value < 0.05, - слишком маловероятно, чтобы быть совпадением
- Дескриптивный анализ - выброс в данных
- Описательные статистики и форма распределения - как соотносятся между собой среднее арифметическое, медиана и мода в случае асимметричного распределения
- Распределение богатства в модели Simple Economy: горб слева, хвост справа
- Центральная предельная теорема
- средние большого количества независимых случайных величин всегда стремятся к нормальному распределению, какой бы формы ни были сами величины
- Парная регрессия + гетероскедастичность
- Ситуация, когда разброс ошибок (остатков) модели непостоянен — он меняется (например, растет) с ростом переменной X.
- Множественная регрессия мультиколлинеарность
- факторы дублируют друг друга (например, «возраст» и «стаж»). Модель не может понять, какой именно из факторов влияет на Y. Коэффициенты становятся неустойчивыми и могут менять знаки.
- Выбросы и влиятельные наблюдения
- Выброс — это точка далеко от облака данных (большая ошибка). Влиятельное наблюдение (рычаг) — точка, которая находится далеко от центра по оси X и «притягивает» линию регрессии к себе
- Корреляция, причинность и смещения - Ложная корреляция
- связь между X и Y вызвана не их взаимодействием, а влиянием третьей, скрытой переменной Z на оба фактора
- Парадокс Симпсона
- Если одна группа численно доминирует или имеет совершенно другие базовые показатели, объединение данных искажает выводы
- Автокорреляция
- Это корреляция ряда с самим собой, но со сдвигом во времени. Означает инерцию процесса
- Объясните механизм возникновения неравенства (распределения Больцмана-Гиббса) в модели Simple Economy
- Деньги аккумулируются у везучих, формируя степенной закон распределения
