Методы обработки больших данных (syllabus)
| Планируемые результаты обучения (Знать, Уметь, Владеть) |
|
|---|---|
| Содержание разделов курса | |
| Видео запись | |
| Среды и средства, которые поддерживают учебный курс | R, Java, OpenRefine, NetLogo, VOSviewer, RAWGraphs, Mermaid, Semantic MediaWiki |
| Книги, на которых основывается учебный курс |
В 2026 году для Категория:ИНДОР-2121
Описание курса
Курс строится вокруг идеи, что Digida как Semantic MediaWiki — это живой социосемантический объект, в котором совместно эволюционируют социальная сеть участников и семантическая сеть страниц, категорий и свойств. Дополнительно к этому объекту подключаются экспериментальные данные NetLogo и внешние датасеты, поступающие через расширение External Data и обрабатываемые Lua‑модулями Scribunto. Таким образом, студенты не просто изучают методы обработки больших данных, а разворачивают коллективное исследование социо-семантических систем, используя собственную образовательную инфраструктуру как исследовательское поле совместной деятельности.
Результатом курса становится сформированная у студентов способность мыслить образовательные цифровые среды как социосемантические системы и работать с ними как с источником больших данных. На уровне знаний акцент делается на структуре и семантическом слое Digida (PageForms, свойства SMW, концепты), на принципах генерации и анализа экспериментальных данных в NetLogo и BehaviorSpace. На уровне умений — на полном цикле:
- извлечь данные (SMW queries, MediaWiki API, External Data),
- очистить (OpenRefine),
- агрегировать в Java/MapReduce,
- проанализировать в R (сетевые и статистические методы),
- визуализировать
- вернуть результат в виде Active Essay на Digida.
На уровне владения — сочетать языки и инструменты (Lua, R, NetLogo, Java) в рамках единого дидактического и исследовательского сценария.
Последовательность курса

