Анализ и интерпретация данных (syllabus)

Материал из Поле цифровой дидактики

Учебная группа, работающая с курсом Анализ и интерпретация данных в в 202 году Категория:МКО_22

Цель, результаты освоения дисциплины

В результате освоения дисциплины слушатель должен:

Знать
  • особенности типов и источников данных
Уметь
  • планировать процесс обработки, визуализации, анализа и интерпретации данных при помощи UML - Категория:Diagrams
  • использовать сетевые сервисы для экспресс-анализа и интерпретации данных
  • очищать, обрабатывать и видоизменять данные, приводя их к опрятному виду (tidy data)
  • совершать операции статистического анализа
Владеть
  • навыками выстраивания процесс анализа и интерпретации данных от исходных сырых данных до публикации отчета или статьи

Содержание разделов дисциплины:

Источники и типы данных

Источники и типы данных, которые мы извлекаем или порождаем - информационные системы организаций, библиографические системы, сетевые опросы, игры, симуляции, сетевые сообщества

Библиографические данные

Пример работы

Zotero + ACM https://m.youtube.com/watch?v=vNvRVTWYwlw

Библиографический датасет 1

Внешние данные

  1. https://corgis-edu.github.io/corgis/
    1. https://corgis-edu.github.io/corgis/csv/graduates/
        1. https://corgis-edu.github.io/corgis/datasets/csv/graduates/graduates.csv


См. Категория:Dataset

Данные из игр


Выращивание данных

StarLogo Nova

Проект https://www.slnova.org/patarakin/projects/694467/

Исходное состояние - выбираем параметры

  • количество мячей = 5
  • количество участников = 175
  • рычажок видимости (как близко от участника должен быть мяч, чтобы он начал к нему бежать) = 5

Slnova Data.jpg

Собираем данные со страницы

500 записей Slnova Data1.jpg

Загружаем датасет в RAWGraphs - https://rawgraphs.io/

Slnova Data2 exp.jpg

Использовать NetLogo Web для получения данных

Flocking netlogo web.jpg

Примеры моделей для постановки экспериментов:

  1. Образование стаи птиц или рыб
  2. Термиты
  3. Обучение по Выготскому или Пиаже - участники бросают шарики и стараются попасть как можно ближе к линии


Вырастить данные - поставить эксперимент с переменными - использовать BehaviorSpace


Многое как данные на примере Snap!

Планирование операций над данными

Планирование действий над данными при помощи UML диаграмм

Категория:Diagrams


Диаграммы классов

Диаграмма последовательности

Сетевые сервисы визуализации

Использование быстрых сетевых сервисов анализа и интерпретации данных – RAWGraphs, CODAP, NetBlox. Выбор способов представления данных

Задание с RAWGraphs

Патаракин Е. Д. Выращивание и Анализ Данных в Веб Красноярск - Сибирский федеральный университет, 2021.C. 238–242.
https://elibrary.ru/item.asp?id=46644731
https://www.slnova.org/patarakin/projects/694467/

Обработка, очистка

Обработка, очистка и манипуляции с данными

  • В Snap!
  • в пакетах R и Python – использование tidyverse & tidygraph

Мы берём исходный датасет - Cities (dataset)‎‎


Название Страна Население
Voronezh RU 1047549
Samara RU 1163399
Kazan RU 1243500
Rostov-na-Donu RU 1130305
Nizhniy Novgorod RU 1259013
Moscow RU 10381222
Saint Petersburg RU 5351935
Volgograd RU 1013533
Omsk RU 1172070
Yekaterinburg RU 1495066
Ufa RU 1120547
Chelyabinsk RU 1202371
Novosibirsk RU 1612833
Krasnoyarsk RU 1090811

Внутри множество городов - миллионников из разных стран. И у всех координаты в виде

Пример очистки и преобразования данных:

Статистический анализ и интерпретация данных

Основные операции статистического анализа над данными

Экспорт результатов

Подготовка результатов для публикаций, создание выполняемых публикаций и динамических визуализаций

Литература

Основная литература

Дополнительная литература

  1. Патаракин Е.Д., Ярмахов Б.Б. Выращивание данных для школьных виртуальных лабораторий // Вестник Российского Университета Дружбы Народов. Серия: Информатизация Образования. 2021. Vol. 18, № 4. c. 347–359.
  2. Патаракин Е.Д., Вачкова С.Н. Сетевой анализ коллективных действий над цифровыми образовательными объектами // Вестник Московского Городского Педагогического Университета. Серия: Педагогика И Психология. 2019. № 4 (50). c. 101–112.


Видеоматериалы

Критерии оценки по дисциплине

Образовательный результат Тема Задание Пример
Знает особенности типов и источников данных Примеры источников данных Найти, оформить, вырастить данные для дальнейшего анализа В категории статей о датасетах Category:Datasets
планировать процесс обработки, визуализации, анализа и интерпретации данных при помощи UML Планирование операций над данными Создать схему цикла работы с данными Пример
Умеет использовать сетевые сервисы для экспресс-анализа и интерпретации данных Сетевые сервисы визуализации Использовать экспресс-методы RowGraph, CODAP - примеры использования
Обработать и очистить данные Обработка, очистка Подготовить и видоизменить данные Примеры видоизменения данных в Snap!, R, Python
Операции статистического анализа Статистический анализ и интерпретация данных Операции над собственным датасетом Готовые датасеты
Подготовка выполняемой публикации Экспорт результатов Операции над собственным датасетом Выполняемая публикация