Исследовательский анализ данных: различия между версиями
Материал из Поле цифровой дидактики
Patarakin (обсуждение | вклад) |
Patarakin (обсуждение | вклад) |
||
Строка 23: | Строка 23: | ||
== Примеры == | == Примеры == | ||
[[Файл:D I Treemap Voronoy.png|600px]] | |||
* [[Цифровые инструменты учителей]] - [[датасет]] | * [[Цифровые инструменты учителей]] - [[датасет]] |
Версия 15:03, 12 марта 2024
Описание | Разведочный анализ данных (англ. exploratory data analysis, EDA) — анализ основных свойств данных, нахождение в них общих закономерностей, распределений и аномалий, построение начальных моделей, зачастую с использованием инструментов визуализации. |
---|---|
Область знаний | NetSci, Большие данные |
Авторы | |
Поясняющее видео | https://www.youtube.com/watch?v=lDpgGzHe0rQ |
Близкие понятия | |
Среды и средства для освоения понятия | RAWGraphs, R, Snap!, CODAP |
Разведочный анализ данных (англ. exploratory data analysis, EDA) https://www.youtube.com/watch?v=lDpgGzHe0rQ
- Получение данных - CSV, JSON
- Предварительная обработка
- Описательная статистика
- Визуализация данных - RAWGraphs, CODAP, R
- Интерпретация результатов
- Понятие введено математиком Джоном Тьюки, который сформулировал цели такого анализа следующим образом
- максимальное «проникновение» в данные,
- выявление основных структур,
- выбор наиболее важных переменных,
- обнаружение отклонений и аномалий,
- проверка основных гипотез,
- разработка начальных моделей.