Исследовательский анализ данных: различия между версиями
Материал из Поле цифровой дидактики
Patarakin (обсуждение | вклад) |
Patarakin (обсуждение | вклад) |
||
Строка 21: | Строка 21: | ||
* проверка основных гипотез, | * проверка основных гипотез, | ||
* разработка начальных моделей. | * разработка начальных моделей. | ||
== Примеры == | |||
* [[Цифровые инструменты учителей]] - [[датасет]] |
Версия 14:55, 12 марта 2024
Описание | Разведочный анализ данных (англ. exploratory data analysis, EDA) — анализ основных свойств данных, нахождение в них общих закономерностей, распределений и аномалий, построение начальных моделей, зачастую с использованием инструментов визуализации. |
---|---|
Область знаний | NetSci, Большие данные |
Авторы | |
Поясняющее видео | https://www.youtube.com/watch?v=lDpgGzHe0rQ |
Близкие понятия | |
Среды и средства для освоения понятия | RAWGraphs, R, Snap!, CODAP |
Разведочный анализ данных (англ. exploratory data analysis, EDA) https://www.youtube.com/watch?v=lDpgGzHe0rQ
- Получение данных - CSV, JSON
- Предварительная обработка
- Описательная статистика
- Визуализация данных - RAWGraphs, CODAP, R
- Интерпретация результатов
- Понятие введено математиком Джоном Тьюки, который сформулировал цели такого анализа следующим образом
- максимальное «проникновение» в данные,
- выявление основных структур,
- выбор наиболее важных переменных,
- обнаружение отклонений и аномалий,
- проверка основных гипотез,
- разработка начальных моделей.