Язык программирования R (syllabus) 2026
Материал из Поле цифровой дидактики
| Планируемые результаты обучения (Знать, Уметь, Владеть)
|
Знать
- основные особенности языка R и его роль в анализе данных ;
- принципы tidy data: строка = наблюдение, столбец = переменная;
- базовые возможности пакетов dplyr, httr/jsonlite, ggplot2 для обработки, получения и визуализации данных;
- общую схему работы с данными курса: Digida/NetLogo → CSV/API → R → визуализация → публикация на Digida.
- Уметь
- настраивать рабочую среду R/RStudio и загружать данные из CSV‑файлов;
- выполнять базовую обработку данных в R: фильтрацию, выбор столбцов, группировку, агрегирование с помощью `%>%` и dplyr;
- получать данные по HTTP и из MediaWiki API (Digida) и преобразовывать их в таблицы;
- строить простые графики в ggplot2 (столбчатые, линейные, точечные) и сохранять результаты;
- документировать полный рецепт обработки данных на странице Digida (код, данные, результаты, вывод).
- Владеть
- базовыми приёмами потоковой обработки данных в R с использованием pipe‑нотации;
- навыками интеграции R‑скриптов с инфраструктурой Digida
|
| Содержание разделов курса
|
; Введение в язык R и настройка рабочей среды
- обзор языка R и RStudio;
- установка и выбор рабочей директории;
- загрузка данных из CSV (логи Digida, результаты NetLogo);
- базовые операции: просмотр данных, размер, типы столбцов.
- Элементы языка программирования R и tidydata
- векторы, data.frame, основы индексирования;
- пакет dplyr: `filter`, `select`, `mutate`, `group_by`, `summarise`;
- оператор pipe `%>%` и построение цепочек преобразований;
- tidydata и приведение исходных логов/экспериментов к опрятному виду.
- Получение данных из файлов, по HTTP и через MediaWiki API
- повторение `read.csv` для локальных файлов (Digida/NetLogo CSV);
- пакет httr: выполнение GET‑запросов;
- пакет jsonlite: преобразование JSON в таблицы;
- примеры запросов к MediaWiki API Digida (recentchanges и др.);
- объединение данных из нескольких источников (merge/join).
- Визуализация данных и R‑рецепты для Digida
- базовые графики в ggplot2: `geom_col`, `geom_line`, `geom_point`;
- настройка подписей, осей, тем и сохранение графиков (ggsave);
- структура R‑рецепта: описание задачи, данные, код, таблицы, графики, выводы;
- создание страницы в категории RRecipe на Digida с полным рецептом извлечения и анализа данных.
|
| Видео запись
|
|
| Среды и средства, которые поддерживают учебный курс
|
R
|
| Книги, на которых основывается учебный курс
|
R for Data Science
|
Последовательность курса