Описательная статистика

Материал из Поле цифровой дидактики


Описание Описательная статистика (Descriptive Statistics) — это раздел статистики, который занимается систематизацией, представлением и анализом характеристик данных с целью их описания, но без попыток делать выводы о более широкой совокупности.

В контексте вычислительной социально-экономической статистики и агентного моделирования описательная статистика используется для:

  • анализа результатов мультиагентных симуляций
  • описания характеристик синтетических популяций
  • изучения распределений переменных в модели
  • калибровки параметров модели на основе эмпирических данных
Область знаний Статистика
Авторы
Поясняющее видео
Близкие понятия
Среды и средства для освоения понятия CODAP, R, NetLogo, Lua, Как проводить статистические вычисления в Lua

Меры центральной тенденции

Среднее арифметическое (Mean)

Среднее арифметическое — это сумма всех значений, деленная на их количество:


[math]\displaystyle{ \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i }[/math]


Медиана (Median)

Медиана — это значение, которое делит упорядоченный ряд данных пополам. При нечетном количестве элементов — это средний элемент, при четном — среднее арифметическое двух средних элементов:

Пример: Для набора оценок {3, 4, 4, 5, 5} медиана = 4

Мода (Mode)

Мода — это наиболее часто встречающееся значение в наборе данных.
Пример: В наборе {3, 4, 4, 5, 5, 5} мода = 5 (встречается 3 раза)
R
get_mode <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

grades <- c(4, 5, 3, 5, 4)
mode_grade <- get_mode(grades)
print(mode_grade)   Output: 5 или 5

Меры разброса (вариации)

Размах (Range)

Размах — это разность между максимальным и минимальным значением
$$R = x_{max} - x_{min}$$
Пример: Для оценок {3, 4, 4, 5, 5} размах = 5 - 3 = 2
 Description
ДисперсияДисперсия (англ. variance) — мера разброса значений случайной величины относительно её математического ожидания. Дисперсия характеризует степень изменчивости экономических показателей вокруг их среднего значения.

Стандартное отклонение

 Description
Стандартное отклонениеСтандартное отклонение (среднеквадратическое отклонение, англ. standard deviation) — квадратный корень из дисперсии случайной величины.

Квартили и процентили

Квартили делят данные на четыре равные части:

  • Q1 (первый квартиль) — 25-й процентиль
  • Q2 (второй квартиль) — 50-й процентиль (медиана)
  • Q3 (третий квартиль) — 75-й процентиль