Анализ данных: различия между версиями

Материал из Поле цифровой дидактики
Строка 9: Строка 9:




=== Последовательность операций над данными ===
== Последовательность операций над данными ==


В книге [[R for Data Science]] приводится следующая последовательность операций над данными:
В книге [[R for Data Science]] приводится следующая последовательность операций над данными:
Строка 22: Строка 22:
}
}
</graphviz>
</graphviz>
=== Import ===
; [[Датасет]] должен быть загружен в среду (файл с компьютера или данные из удалённого источника)
: Для [[Snap!]] просто вбросить [[CSV]] файл с данными в среду и возникнет переменная (список списков) с именем файла
: Для [[R]] read


=== Видео пояснения ===
=== Видео пояснения ===
{{#widget:YouTube|id=go5Au01Jrvs|start=5}}
{{#widget:YouTube|id=go5Au01Jrvs|start=5}}

Версия 19:41, 2 февраля 2023

Описание После того, как мы собрали или вырастили данные, наступает этап их анализа. В прикладной науке о данных выделяется определённая последовательность действий, которые совершаются над данными для их лучшего понимания и объяснения.
Область знаний NetSci, Археология, Информатика, Математика, История, Медицина
Область использования (ISTE) Digital Citizen, Computational Thinker, Global Collaborator
Возрастная категория 10


Поясняющее видео
Близкие рецепту понятия Данные, Датасет, csv
Среды и средства для приготовления рецепта: R, RStudio, Python, Snap!


Последовательность операций над данными

В книге R for Data Science приводится следующая последовательность операций над данными:

Import

Датасет должен быть загружен в среду (файл с компьютера или данные из удалённого источника)
Для Snap! просто вбросить CSV файл с данными в среду и возникнет переменная (список списков) с именем файла
Для R read

Видео пояснения