Язык программирования R (syllabus) 2026: различия между версиями

Материал из Поле цифровой дидактики
Нет описания правки
Нет описания правки
 
Строка 15: Строка 15:
* базовыми приёмами потоковой обработки данных в R с использованием pipe‑нотации;  
* базовыми приёмами потоковой обработки данных в R с использованием pipe‑нотации;  
* навыками интеграции R‑скриптов с инфраструктурой Digida
* навыками интеграции R‑скриптов с инфраструктурой Digida
|Description=; Введение в язык R и настройка рабочей среды 
* обзор языка R и RStudio;
* установка и выбор рабочей директории; 
* загрузка данных из CSV (логи Digida, результаты NetLogo);
*  базовые операции: просмотр данных, размер, типы столбцов.
; Элементы языка программирования R и tidydata 
* векторы, data.frame, основы индексирования;
* пакет dplyr: `filter`, `select`, `mutate`, `group_by`, `summarise`;
* оператор pipe `%>%` и построение цепочек преобразований;
*  tidydata и приведение исходных логов/экспериментов к опрятному виду.
; Получение данных из файлов, по HTTP и через MediaWiki API 
* повторение `read.csv` для локальных файлов (Digida/NetLogo CSV);
* пакет httr: выполнение GET‑запросов;
* пакет jsonlite: преобразование JSON в таблицы;
* примеры запросов к MediaWiki API Digida (recentchanges и др.);
* объединение данных из нескольких источников (merge/join). 
; Визуализация данных и R‑рецепты для Digida 
* базовые графики в ggplot2: `geom_col`, `geom_line`, `geom_point`;
* настройка подписей, осей, тем и сохранение графиков (ggsave);
* структура R‑рецепта: описание задачи, данные, код, таблицы, графики, выводы;
* создание страницы в категории RRecipe на Digida с полным рецептом извлечения и анализа данных.
|Environment=R
|Environment=R
|Book=R for Data Science
|Book=R for Data Science

Текущая версия от 21:31, 15 февраля 2026



Планируемые результаты обучения (Знать, Уметь, Владеть) Знать
  • основные особенности языка R и его роль в анализе данных ;
  • принципы tidy data: строка = наблюдение, столбец = переменная;
  • базовые возможности пакетов dplyr, httr/jsonlite, ggplot2 для обработки, получения и визуализации данных;
  • общую схему работы с данными курса: Digida/NetLogo → CSV/API → R → визуализация → публикация на Digida.
Уметь
  • настраивать рабочую среду R/RStudio и загружать данные из CSV‑файлов;
  • выполнять базовую обработку данных в R: фильтрацию, выбор столбцов, группировку, агрегирование с помощью `%>%` и dplyr;
  • получать данные по HTTP и из MediaWiki API (Digida) и преобразовывать их в таблицы;
  • строить простые графики в ggplot2 (столбчатые, линейные, точечные) и сохранять результаты;
  • документировать полный рецепт обработки данных на странице Digida (код, данные, результаты, вывод).
Владеть
  • базовыми приёмами потоковой обработки данных в R с использованием pipe‑нотации;
  • навыками интеграции R‑скриптов с инфраструктурой Digida
Содержание разделов курса ; Введение в язык R и настройка рабочей среды
  • обзор языка R и RStudio;
  • установка и выбор рабочей директории;
  • загрузка данных из CSV (логи Digida, результаты NetLogo);
  • базовые операции: просмотр данных, размер, типы столбцов.
Элементы языка программирования R и tidydata
  • векторы, data.frame, основы индексирования;
  • пакет dplyr: `filter`, `select`, `mutate`, `group_by`, `summarise`;
  • оператор pipe `%>%` и построение цепочек преобразований;
  • tidydata и приведение исходных логов/экспериментов к опрятному виду.
Получение данных из файлов, по HTTP и через MediaWiki API
  • повторение `read.csv` для локальных файлов (Digida/NetLogo CSV);
  • пакет httr: выполнение GET‑запросов;
  • пакет jsonlite: преобразование JSON в таблицы;
  • примеры запросов к MediaWiki API Digida (recentchanges и др.);
  • объединение данных из нескольких источников (merge/join).
Визуализация данных и R‑рецепты для Digida
  • базовые графики в ggplot2: `geom_col`, `geom_line`, `geom_point`;
  • настройка подписей, осей, тем и сохранение графиков (ggsave);
  • структура R‑рецепта: описание задачи, данные, код, таблицы, графики, выводы;
  • создание страницы в категории RRecipe на Digida с полным рецептом извлечения и анализа данных.
Видео запись
Среды и средства, которые поддерживают учебный курс R
Книги, на которых основывается учебный курс R for Data Science

Последовательность курса