Методы обработки больших данных (syllabus): различия между версиями

Материал из Поле цифровой дидактики
Нет описания правки
Строка 10: Строка 10:
== Описание курса ==
== Описание курса ==


Курс строится вокруг идеи, что Digida как [[Semantic MediaWiki]] — это живой социосемантический объект, в котором совместно эволюционируют социальная сеть участников и семантическая сеть страниц, категорий и свойств. Дополнительно к этому объекту подключаются экспериментальные данные [[NetLogo]] и внешние датасеты, поступающие через расширение [[External Data]] и обрабатываемые [[Lua]]‑модулями Scribunto. Таким образом, студенты не просто изучают методы обработки больших данных, а разворачивают коллективное исследование социо-семантических систем, используя собственную образовательную инфраструктуру как исследовательское поле совместной деятельности.
Результатом курса становится сформированная у студентов способность мыслить образовательные цифровые среды как социосемантические системы и работать с ними как с источником больших данных. На уровне знаний акцент делается на структуре и семантическом слое Digida (PageForms, свойства SMW, концепты), на принципах генерации и анализа экспериментальных данных в NetLogo и BehaviorSpace. На уровне умений — на полном цикле:
# извлечь данные (SMW queries, MediaWiki API, External Data),
#очистить (OpenRefine),
#
# агрегировать в Java/MapReduce,
# проанализировать в R (сетевые и статистические методы),
# визуализировать
# вернуть результат в виде Active Essay на Digida.
На уровне владения — сочетать языки и инструменты ([[Lua]], [[R]], [[NetLogo]], [[Java]]) в рамках единого дидактического и исследовательского сценария.


== Последовательность курса  ==
== Последовательность курса  ==

Версия от 13:52, 15 февраля 2026



Планируемые результаты обучения (Знать, Уметь, Владеть)
  • Научиться находить и собирать большие наборы данных из открытых источников (Википедия, вики-проекты, NetLogo модели), адаптировать их для учебных задач.
  • Освоить основные подходы к обработке и визуализации больших данных.
  • Уметь выявлять структуры, отношения и тренды в образовательных и языковых данных,.
  • Разработать свои проекты по обработке цифровых данных, применимых в школьной практике и во внеурочной деятельности.
Содержание разделов курса
Видео запись
Среды и средства, которые поддерживают учебный курс R, Java, OpenRefine, NetLogo, VOSviewer, RAWGraphs, Mermaid, Semantic MediaWiki
Книги, на которых основывается учебный курс

В 2026 году для Категория:ИНДОР-2121

Описание курса

Курс строится вокруг идеи, что Digida как Semantic MediaWiki — это живой социосемантический объект, в котором совместно эволюционируют социальная сеть участников и семантическая сеть страниц, категорий и свойств. Дополнительно к этому объекту подключаются экспериментальные данные NetLogo и внешние датасеты, поступающие через расширение External Data и обрабатываемые Lua‑модулями Scribunto. Таким образом, студенты не просто изучают методы обработки больших данных, а разворачивают коллективное исследование социо-семантических систем, используя собственную образовательную инфраструктуру как исследовательское поле совместной деятельности.

Результатом курса становится сформированная у студентов способность мыслить образовательные цифровые среды как социосемантические системы и работать с ними как с источником больших данных. На уровне знаний акцент делается на структуре и семантическом слое Digida (PageForms, свойства SMW, концепты), на принципах генерации и анализа экспериментальных данных в NetLogo и BehaviorSpace. На уровне умений — на полном цикле:

  1. извлечь данные (SMW queries, MediaWiki API, External Data),
  2. очистить (OpenRefine),
  3. агрегировать в Java/MapReduce,
  4. проанализировать в R (сетевые и статистические методы),
  5. визуализировать
  6. вернуть результат в виде Active Essay на Digida.

На уровне владения — сочетать языки и инструменты (Lua, R, NetLogo, Java) в рамках единого дидактического и исследовательского сценария.

Последовательность курса