Обработка больших данных (syllabus): различия между версиями
Материал из Поле цифровой дидактики
Patarakin (обсуждение | вклад) |
Patarakin (обсуждение | вклад) |
||
Строка 50: | Строка 50: | ||
== Обработка данных == | == Обработка данных == | ||
[[Файл:Khurmanenok result pic.png|400px]] | |||
== Семинары и конференции МГПУ про данные в образовании == | |||
[[Data_in_Education_Seminar|Семинар о данных в образовании]] | |||
[[ |
Версия 17:38, 29 августа 2023
Планируемые результаты обучения (Знать, Уметь, Владеть) | Готовность студентов к профессиональной деятельности, связанной с обработкой и анализом больших данных, в педагогической сфере.
|
---|---|
Содержание разделов курса |
|
Видео запись | |
Среды и средства, которые поддерживают учебный курс | R, RStudio, NetLogo, Snap!, Google Data Studio, Shiny, Python, CODAP |
Книги, на которых основывается учебный курс | R for Data Science, Mastering Shiny: Build Interactive Apps, Tidy Modeling with R |
Основные понятия
Большие данные, База данных, База знаний, Веб-скрепинг, Датасет, Озеро данных, Агентное моделирование, Гигантская компонента
Источники данных
Инструменты анализа и визуализации данных
Description | Affordances | |
---|---|---|
Biblioshiny | Пакет R для анализа библиометрических данных. Запускается как веб-страница из R - R-studio:
| Проводить библиометрический анализ с использованием возможностей языка R, но без необходимости писать текст команд |
CODAP | Инструмент визуализации данных проведения статистических исследований на основе данных. Данные - есть готовые наборы данных, либо можно получить данные из игр и моделей.
| Пользователь может загрузить набор данных из набора данных или просто перетащить их мышкой из своей таблицы в таблицу CODAP.
|
CODAP API | API for CODAP | |
Chronoviz | ChronoViz is a tool to aid visualization and analysis of multimodal sets of time-coded information, with a focus on the analysis of video in combination with other data sources. | Анализ мультимодальной информации - видео + другие источники In comparison to other data visualization tools, ChronoViz is unique in its focus on time-coded multimodal data and its ability to integrate with various data sources. It offers a range of visualization techniques and navigation mechanisms, making it a powerful tool for researchers working with time-based data. |
Frequency Distribution Analysis Library | Библиотека анализа распределения значений внутри данных. Библиотека Snap!
| Расчёт и и построение графиков распределения той или иной величины на экране - функции группировки и сортировки значений. |
Jamovi | ||
Kepler | Open Source инструмента для визуализации и анализа больших наборов гео-данных. | На сегодняшний день Kepler.gl поддерживает 3 формата исходных данных: geojson, json и csv. Сохранив данные в одном указанных форматов просто загружаем их в приложение. |
Mathematica | Mathematica — проприетарная система компьютерной алгебры, широко используемая для научных, инженерных, математических расчётов. Разработана в 1988 году Стивеном Вольфрамом, дальнейшим развитием системы занята основанная им совместно с Теодором Греем компания Wolfram Research. | Оснащена как аналитическими возможностями, так и обеспечивает численные расчёты; результаты выводятся как в алфавитно-цифровом виде, так и в форме графиков. |
MediaWiki API | Движок MediaWiki имеет свой API, который является веб-службой, обеспечивающей доступ к многим функциям вики. Благодаря этому инструменту мы можем собирать информацию с любой из внешних вики площадок. | аутентификация, операции над страницами, поиск по вики и множество других операций. MediaWiki API может обрабатывать запросы через обработчик(скрипт) api.php, который написан на языке программирования PHP. Обработчик принимает запросы через отправку HTTP запросов на адрес(url) обработчика.
|
Network Workbench | Network Workbench: A Large-Scale Network Analysis, Modeling and Visualization Toolkit for Biomedical, Social Science and Physics Research.This project will design, evaluate, and operate a unique distributed, shared resources environment for large-scale network analysis, modeling, and visualization, named Network Workbench (NWB). | |
Postman | Postman — это сервис для создания, тестирования, документирования, публикации и обслуживания API. | Сервис позволяет создавать коллекции запросов к любому API, применять к ним разные окружения, настраивать мок-серверы, писать автотесты на JavaScript, анализировать и визуализировать результаты запросов.
|
Scratch API | Инструмент доступа к данным сообщества Scratch | Получать информацию о действиях отдельных участников, активности в студиях, активности по отдельным проектам |
ShinyItemAnalysis | R пакет для он-лайн психометрического анализа образовательных тестов | можно использовать собственные наборы данных или использовать готовые наборы |
Tableau | Tableau - BI-система, предназначенная для анализа и визуализации данных. Интерфейс разработан таким образом, чтобы было несложно разобраться, даже если вы никогда раньше не создавали дашборды. Позволяет создавать интерактивные и обновляемые в режиме реального времени панели, в том числе – на основе совмещенных данных. | Плюсы Tableau:
поддерживает более 30 типов данных; один из самых простых для освоения инструментов бизнес-аналитики; много обучающей информации в текстовом и видеоформате; развивается и регулярно обновляется. |
VOSviewer | VOSviewer — это программа для построения и визуализации библиометрических сетей. |
|
Web Scraper | Надстройка для Chrome. Инструмент для извлечения данных из веб-страниц | Сэкономить время на ручном поиске и однотипных данных (текста, ссылок, данных из таблиц, адресов электронной почты и тд) и выгрузить итоговый результат в CSV |
Песочница MediaWiki API | Инструмент позволяет подбирать параметры для запроса к MediaWiki API | Разные действия в запросе:
|
Якласс | Образовательный портал | Организация дистанционных занятий, размещение учебных материалов, посещение вебинаров, ведение оценочной деятельности |
- библиотек Python для обработки и визуализации данных, таких как Pandas, NumPy, Matplotlib, Seaborn и Plotly
Выращивание данных при помощи многоагентных моделей
- см. Категория:Model
Обработка данных