Анализ данных: различия между версиями

Материал из Поле цифровой дидактики
Строка 27: Строка 27:
; [[Датасет]] должен быть загружен в среду (файл с компьютера или данные из удалённого источника)
; [[Датасет]] должен быть загружен в среду (файл с компьютера или данные из удалённого источника)
: Для [[Snap!]] просто вбросить [[CSV]] файл с данными в среду и возникнет переменная (список списков) с именем файла
: Для [[Snap!]] просто вбросить [[CSV]] файл с данными в среду и возникнет переменная (список списков) с именем файла
: Для [[R]] read
: Для [[R]] read.csv() read.csv2() или загрузка через меню Import.Dataset


=== Видео пояснения ===
=== Видео пояснения ===
{{#widget:YouTube|id=go5Au01Jrvs|start=5}}
{{#widget:YouTube|id=go5Au01Jrvs|start=5}}

Версия от 19:46, 2 февраля 2023

Описание После того, как мы собрали или вырастили данные, наступает этап их анализа. В прикладной науке о данных выделяется определённая последовательность действий, которые совершаются над данными для их лучшего понимания и объяснения.
Область знаний NetSci, Археология, Информатика, Математика, История, Медицина
Область использования (ISTE) Digital Citizen, Computational Thinker, Global Collaborator
Возрастная категория 10


Поясняющее видео
Близкие рецепту понятия Данные, Датасет, csv
Среды и средства для приготовления рецепта: R, RStudio, Python, Snap!


Последовательность операций над данными

В книге R for Data Science приводится следующая последовательность операций над данными:

Import

Датасет должен быть загружен в среду (файл с компьютера или данные из удалённого источника)
Для Snap! просто вбросить CSV файл с данными в среду и возникнет переменная (список списков) с именем файла
Для R read.csv() read.csv2() или загрузка через меню Import.Dataset

Видео пояснения