Статистическая модель

Материал из Поле цифровой дидактики


Описание Статистическая модель (англ. statistical model) — это математическое представление данных, которое включает набор предположений о вероятностном распределении, породившем наблюдаемые данные. статистическая модель помогает нам понять, как устроены наши данные, и делать предсказания о новых наблюдениях.
Область знаний Социология, Статистика, Моделирование
Авторы
Поясняющее видео
Близкие понятия Модель, Моделирование
Среды и средства для освоения понятия CODAP, R, NetLogo


Формальные определения

В формальном определении статистическая модель представляет собой пару [math]\displaystyle{ (S, \mathcal{P}) }[/math], где: В формальном определении статистическая модель представляет собой пару [math]\displaystyle{ (S, \mathcal{P}) }[/math], где:

  • [math]\displaystyle{ S }[/math] — множество возможных наблюдений (выборочное пространство)
  • [math]\displaystyle{ \mathcal{P} }[/math] — множество вероятностных распределений на [math]\displaystyle{ S }[/math]

[math]\displaystyle{ \mathcal{P} = \{F_\theta : \theta \in \Theta\} }[/math]

Ключевые компоненты

Каждая статистическая модель состоит из нескольких ключевых элементов:

  1. Предположения (assumptions) — основные допущения о данных, такие как нормальность распределения или линейность связи между переменными
  2. Параметры (parameters) — числовые характеристики, которые мы стремимся оценить на основе данных (например, коэффициенты в регрессии)
  3. Математические уравнения — формулы, описывающие взаимосвязи между переменными на основе статистической теории

Типы статистических моделей

Параметрические модели

Параметрические модели имеют заранее определенную структуру с фиксированным числом параметров. Классический пример — линейная регрессия: [math]\displaystyle{ y = \beta_0 + \beta_1 x + \varepsilon }[/math]

где
  • [math]\displaystyle{ y }[/math] — зависимая переменная (то, что мы предсказываем)
  • [math]\displaystyle{ x\lt /math) — независимая переменная (предиктор) * \lt math\gt \beta_0 }[/math] — свободный член (intercept)
  • [math]\displaystyle{ \beta_1 }[/math] — коэффициент наклона
  • [math]\displaystyle{ \varepsilon }[/math] — случайная ошибка