Язык программирования R (syllabus) 2026: различия между версиями

Материал из Поле цифровой дидактики
Нет описания правки
Строка 155: Строка 155:


</uml>
</uml>
=== Книги ===
{{#ask: [[Категория:Book]] [[Description::+]]  [[Environment::R]] | ?Description  }}

Версия от 12:52, 3 марта 2026



Планируемые результаты обучения (Знать, Уметь, Владеть) Знать
  • основные особенности языка R и его роль в анализе данных ;
  • принципы tidy data: строка = наблюдение, столбец = переменная;
  • базовые возможности пакетов dplyr, httr/jsonlite, ggplot2 для обработки, получения и визуализации данных;
  • общую схему работы с данными курса: Digida/NetLogo → CSV/API → R → визуализация → публикация на Digida.
Уметь
  • настраивать рабочую среду R/RStudio и загружать данные из CSV‑файлов;
  • выполнять базовую обработку данных в R: фильтрацию, выбор столбцов, группировку, агрегирование с помощью `%>%` и dplyr;
  • получать данные по HTTP и из MediaWiki API (Digida) и преобразовывать их в таблицы;
  • строить простые графики в ggplot2 (столбчатые, линейные, точечные) и сохранять результаты;
  • документировать полный рецепт обработки данных на странице Digida (код, данные, результаты, вывод).
Владеть
  • базовыми приёмами потоковой обработки данных в R с использованием pipe‑нотации;
  • навыками интеграции R‑скриптов с инфраструктурой Digida
Содержание разделов курса ; Введение в язык R и настройка рабочей среды
  • обзор языка R и RStudio;
  • установка и выбор рабочей директории;
  • загрузка данных из CSV (логи Digida, результаты NetLogo);
  • базовые операции: просмотр данных, размер, типы столбцов.
Элементы языка программирования R и tidydata
  • векторы, data.frame, основы индексирования;
  • пакет dplyr: `filter`, `select`, `mutate`, `group_by`, `summarise`;
  • оператор pipe `%>%` и построение цепочек преобразований;
  • tidydata и приведение исходных логов/экспериментов к опрятному виду.
Получение данных из файлов, по HTTP и через MediaWiki API
  • повторение `read.csv` для локальных файлов (Digida/NetLogo CSV);
  • пакет httr: выполнение GET‑запросов;
  • пакет jsonlite: преобразование JSON в таблицы;
  • примеры запросов к MediaWiki API Digida (recentchanges и др.);
  • объединение данных из нескольких источников (merge/join).
Визуализация данных и R‑рецепты для Digida
  • базовые графики в ggplot2: `geom_col`, `geom_line`, `geom_point`;
  • настройка подписей, осей, тем и сохранение графиков (ggsave);
  • структура R‑рецепта: описание задачи, данные, код, таблицы, графики, выводы;
  • создание страницы в категории RRecipe на Digida с полным рецептом извлечения и анализа данных.
Видео запись
Среды и средства, которые поддерживают учебный курс R
Книги, на которых основывается учебный курс R for Data Science

Последовательность курса


Книги

 Description
APIs for social scientists: A collaborative reviewВ книге представлено множество API социальных сетей и основы их использования. В статье по этой книге собраны примеры API и особенности работы с ними. Код в книге - R
Big Data with RExploring, Visualizing, and Modeling Big Data with R
  • В образовании имеется огромное количество данных — от записей о студентах и наблюдений преподавателей до результатов тестов. Современные технологии, такие как распознавание лиц и биометрические сигналы, расширяют доступ к визуальной и аудиоинформации о студентах. Мультимодальная аналитика в образовательном тестировании и психометрике позволяет точнее оценивать знания учащихся, одновременно отслеживая их прогресс с помощью аналитики обучения. Анализ логов и времени реакции помогает понять уровень вовлеченности студентов, выявить списывание и наличие предварительных знаний по тестовым заданиям.
Causal Inference in RWelcome to Causal Inference in R. Answering causal questions is critical for scientific and business purposes, but techniques like randomized clinical trials and A/B testing are not always practical or successful. The tools in this book will allow readers to better make causal inferences with observational data with the R programming language. By its end, we hope to help you:
  1. Ask better causal questions.
  2. Understand the assumptions needed for causal inference
  3. Identify the target population for which you want to make inferences
  4. Fit causal models and check their problems
  5. Conduct sensitivity analyses where the techniques we use might be imperfect
Individual-Based Models of Cultural Evolution: A Step-by-Step Guide Using RКнига показывает как создавать агентно-ориентированные модели или ABM культурной эволюции. В тексте книги используется код на языке программирования R. От очень простых моделей основных процессов культурной эволюции, таких как предвзятая передача и культурная мутация, к более сложным темам, таким как эволюция социального обучения, демографические эффекты и анализ социальных сетей.
Interactive web-based data visualization with R, plotly, and shinyКнига по разработке приложений в веб среде на основе языка R + Plotly + Shiny It makes heavy use of plotly for rendering graphics, but you’ll also learn about other R packages that augment a data science workflow, such as the tidyverse and shiny
Introduction to Econometrics with RВведение в эконометрику с R - учебник по эконометрике с использованием языка R - еще на стадии совместного редактирования
Introductory Statistics for EconomicsКнига "Introductory Statistics for Economics" предназначена для знакомства студентов с базовыми статистическими методами и их применением в экономике. Учебник содержит большое количество практических примеров и упражнений на языке программирования R, что формирует основные навыки данных и статистического анализа. Эти навыки отлично совмещаются с агентным моделированием в NetLogo, ведь полученные инструменты анализа данных и программирования применимы для анализа результатов симуляций и их визуализации.
Learn ggplot2 using Shiny AppСетевая книга по освоению приемов работы с пакетом ggplot2 языка R в среде Shiny
Learning analytics methods and tutorials: A practical guide using RМетоды учебной аналитики с использованием языка R - открытое руководство с многочисленными примерами и ссылками на образовательные датасеты
Mastering Shiny: Build Interactive Apps, Reports, and Dashboards Powered by RКнига о создании аналитических веб-приложений на языке R в среде Shiny
Mastering Spark with RРуководство как использовать Apache Spark с R. Книга поможет освоить инструменты, навыки и методы Apache Spark с R, применимые в крупномасштабной обработке данных
Modeling Social Behavior: Mathematical and Agent-Based Models of Social Dynamics and Cultural EvolutionСоциальные, поведенческие и когнитивные науки исторически полагались на силу слова. Слова имеют силу. Богатые аналогии могут найти отклик в умах читателей и пролить свет на тайны природы. Я говорю о вербальных теориях, описательных объяснениях сложных явлений. Большинство теорий, вероятно, более точны, чем поэтичны, но они, как правило, опираются на свойство большинства языков, согласно которому фраз могут нести в себе несколько возможных импликатур — рассмотрим, например, такие слова, как «восприятие», «категория», «идентичность», «тождественность» обучение» и даже «реакция» достаточно двусмысленны, чтобы допускать множество интерпретаций. То есть язык по своей сути (и адаптивно) расплывчат и двусмыслен. В конечном счете, это проблема для ученых, потому что нам нужно предельно четко понимать, о чем мы говорим, чтобы выдвинуть полезные теории Вселенной.
Outstanding User Interfaces with ShinyA book about deeply customizing Shiny app for production.
R for Data ScienceПодробное руководство по использованию языка R для обработки, модификации, визуализации и программировании данных. Книга "R for Data Science" вводит концепцию tidy data как стандарт организации данных, где каждая переменная — в отдельном столбце, а каждая наблюдение — в отдельной строке. Это упрощает анализ, визуализацию и моделирование с помощью tidyverse. Стратегия книги строится вокруг полного цикла data science: импорт данных, их приведение к tidy-форме (tidying), трансформация (wrangling), визуализация (ggplot2). Цель — научить думать о данных как о tidy, чтобы 80% времени уходило на анализ, а не на чистку.
Text Mining with RКнига даёт завершённую картину современных аналитических подходов к тексту, систематизируя инструменты R и методику работы с данными на всех этапах анализа.
Text Mining with R: A Tidy ApproachПрактический современный учебник с фокусом на подход "tidy data" в R. Охватывает: предобработку, токенизацию, анализ тональности, тематическое моделирование, визуализацию Используемые пакеты: tidytext, dplyr, ggplot2, quanteda
Tidy Modeling with RРуководство по созданию и использованию моделей при помощи пакетов из пространства tidyverse: recipes, parsnip, workflows, yardstick, and others.
Классификация, регрессия и другие алгоритмы Data Mining с использованием RОписана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные нейронные сети и т.д.
Незримый колледж МЭШСтатья, в которой понятие незримого колледжа применяется к сообществу учителей, сотрудничающих внутри репозитория московской электронной школы.