Анализ и интерпретация данных (syllabus): различия между версиями
Patarakin (обсуждение | вклад) |
Patarakin (обсуждение | вклад) |
||
Строка 4: | Строка 4: | ||
* особенности типов и источников данных | * особенности типов и источников данных | ||
; Уметь: | ; Уметь: | ||
* планировать процесс обработки, визуализации, анализа и интерпретации данных при помощи UML | * планировать процесс обработки, визуализации, анализа и интерпретации данных при помощи UML диаграмм (plantUML, MerMaid) | ||
* использовать сетевые сервисы для экспресс-анализа и интерпретации данных | * использовать сетевые сервисы для экспресс-анализа и интерпретации данных (RAWGraphs) | ||
* очищать, обрабатывать и видоизменять данные, приводя их к опрятному виду | * очищать, обрабатывать и видоизменять данные, приводя их к опрятному виду tidy data (Snap!, R) | ||
* совершать операции статистического анализа | * совершать операции статистического анализа | ||
; Владеть: | ; Владеть: | ||
* навыками выстраивания процесс анализа и интерпретации данных от исходных сырых данных до публикации отчета или статьи | * навыками выстраивания процесс анализа и интерпретации данных от исходных сырых данных до публикации отчета или статьи | ||
* навыками выращивания данных в искусственных сообществах (NetLogo, GAMA) | |||
|Description=Разделы: | |Description=Разделы: | ||
# Источники и типы данных, которые мы извлекаем или порождаем - информационные системы организаций, библиографические системы, сетевые опросы, игры, симуляции, сетевые сообщества | # Источники и типы данных, которые мы извлекаем или порождаем - информационные системы организаций, библиографические системы, сетевые опросы, игры, симуляции, сетевые сообщества |
Версия 23:05, 9 мая 2024
Планируемые результаты обучения (Знать, Уметь, Владеть) | В результате освоения дисциплины слушатель должен:
|
---|---|
Содержание разделов курса | Разделы:
|
Видео запись | |
Среды и средства, которые поддерживают учебный курс | BehaviorSpace, NetLogo, Scratch, Snap!, Сообщество Scratch, CODAP, RStudio, RAWGraphs |
Книги, на которых основывается учебный курс |
Содержание разделов дисциплины:
Источники и типы данных
Источники и типы данных, которые мы извлекаем или порождаем - информационные системы организаций, библиографические системы, сетевые опросы, игры, симуляции, сетевые сообщества
Библиографические данные
Zotero + ACM https://m.youtube.com/watch?v=vNvRVTWYwlw
Внешние данные
Данные из игр
Выращивание данных
Как вырастить данные в искусственном сообществе
Многое как данные на примере Snap!
Планирование операций над данными
Планирование действий над данными при помощи UML диаграмм
Диаграммы классов
Диаграмма последовательности
Сетевые сервисы визуализации
Использование быстрых сетевых сервисов анализа и интерпретации данных – RAWGraphs, CODAP, NetBlox. Выбор способов представления данных
Задание с RAWGraphs
- Патаракин Е. Д. Выращивание и Анализ Данных в Веб Красноярск - Сибирский федеральный университет, 2021.C. 238–242.
- https://elibrary.ru/item.asp?id=46644731
- https://www.slnova.org/patarakin/projects/694467/
Обработка, очистка
Обработка, очистка и манипуляции с данными
Мы берём исходный датасет - Cities (dataset)
Название | Страна | Население |
---|---|---|
Voronezh | RU | 1047549 |
Samara | RU | 1163399 |
Kazan | RU | 1243500 |
Rostov-na-Donu | RU | 1130305 |
Nizhniy Novgorod | RU | 1259013 |
Moscow | RU | 10381222 |
Saint Petersburg | RU | 5351935 |
Volgograd | RU | 1013533 |
Omsk | RU | 1172070 |
Yekaterinburg | RU | 1495066 |
Ufa | RU | 1120547 |
Chelyabinsk | RU | 1202371 |
Novosibirsk | RU | 1612833 |
Krasnoyarsk | RU | 1090811 |
Внутри множество городов - миллионников из разных стран. И у всех координаты в виде
Пример очистки и преобразования данных:
Статистический анализ и интерпретация данных
Основные операции статистического анализа - Анализ данных
Экспорт результатов
Подготовка результатов для публикаций, создание выполняемых публикаций и динамических визуализаций
Литература
Основная литература
Дополнительная литература
- Патаракин Е.Д., Ярмахов Б.Б. Выращивание данных для школьных виртуальных лабораторий // Вестник Российского Университета Дружбы Народов. Серия: Информатизация Образования. 2021. Vol. 18, № 4. c. 347–359.
- Патаракин Е.Д., Вачкова С.Н. Сетевой анализ коллективных действий над цифровыми образовательными объектами // Вестник Московского Городского Педагогического Университета. Серия: Педагогика И Психология. 2019. № 4 (50). c. 101–112.
Видеоматериалы
Критерии оценки по дисциплине
Образовательный результат | Тема | Задание | Пример |
---|---|---|---|
Знает особенности типов и источников данных | Примеры источников данных | Найти, оформить, вырастить данные для дальнейшего анализа | В категории статей о датасетах Category:Dataset |
планировать процесс обработки, визуализации, анализа и интерпретации данных при помощи UML | Планирование операций над данными | Создать схему цикла работы с данными | Пример |
Умеет использовать сетевые сервисы для экспресс-анализа и интерпретации данных | Сетевые сервисы визуализации | Использовать экспресс-методы | RAWGraphs, CODAP, graphviz - примеры использования |
Обработать и очистить данные | Обработка, очистка | Подготовить и видоизменить данные | Примеры видоизменения данных в Snap!, R, Python |
Операции статистического анализа | Статистический анализ и интерпретация данных | Операции над собственным датасетом | Готовые датасеты Category:Dataset |
Подготовка выполняемой публикации | Экспорт результатов | Операции над собственным датасетом | Выполняемая публикация |