Исследовательский анализ данных

Материал из Поле цифровой дидактики


Описание Разведочный анализ данных (англ. exploratory data analysis, EDA) — анализ основных свойств данных, нахождение в них общих закономерностей, распределений и аномалий, построение начальных моделей, зачастую с использованием инструментов визуализации.
Область знаний NetSci, Большие данные
Авторы
Поясняющее видео https://www.youtube.com/watch?v=lDpgGzHe0rQ
Близкие понятия
Среды и средства для освоения понятия RAWGraphs, R, Snap!, CODAP

Разведочный анализ данных (англ. exploratory data analysis, EDA) https://www.youtube.com/watch?v=lDpgGzHe0rQ

  • Получение данных - CSV, JSON
  • Предварительная обработка
  • Описательная статистика
  • Визуализация данных - RAWGraphs, CODAP, R
  • Интерпретация результатов
Понятие введено математиком Джоном Тьюки, который сформулировал цели такого анализа следующим образом
  • максимальное «проникновение» в данные,
  • выявление основных структур,
  • выбор наиболее важных переменных,
  • обнаружение отклонений и аномалий,
  • проверка основных гипотез,
  • разработка начальных моделей.