Исследовательский анализ данных
Материал из Поле цифровой дидактики
Версия от 12:21, 9 марта 2024; Patarakin (обсуждение | вклад)
Описание | Разведочный анализ данных (англ. exploratory data analysis, EDA) — анализ основных свойств данных, нахождение в них общих закономерностей, распределений и аномалий, построение начальных моделей, зачастую с использованием инструментов визуализации. |
---|---|
Область знаний | NetSci, Большие данные |
Авторы | |
Поясняющее видео | https://www.youtube.com/watch?v=lDpgGzHe0rQ |
Близкие понятия | |
Среды и средства для освоения понятия | RAWGraphs, R, Snap!, CODAP |
Разведочный анализ данных (англ. exploratory data analysis, EDA) https://www.youtube.com/watch?v=lDpgGzHe0rQ
- Получение данных - CSV, JSON
- Предварительная обработка
- Описательная статистика
- Визуализация данных - RAWGraphs, CODAP, R
- Интерпретация результатов
- Понятие введено математиком Джоном Тьюки, который сформулировал цели такого анализа следующим образом
- максимальное «проникновение» в данные,
- выявление основных структур,
- выбор наиболее важных переменных,
- обнаружение отклонений и аномалий,
- проверка основных гипотез,
- разработка начальных моделей.