Язык программирования R (syllabus) 2026
Материал из Поле цифровой дидактики
| Планируемые результаты обучения (Знать, Уметь, Владеть) | Знать
|
|---|---|
| Содержание разделов курса | ; Введение в язык R и настройка рабочей среды
|
| Видео запись | |
| Среды и средства, которые поддерживают учебный курс | R |
| Книги, на которых основывается учебный курс | R for Data Science |
Последовательность курса

Книги
| Description | Environment | |
|---|---|---|
| APIs for social scientists: A collaborative review | В книге представлено множество API социальных сетей и основы их использования. В статье по этой книге собраны примеры API и особенности работы с ними. Код в книге - R | R RStudio API |
| Big Data with R | Exploring, Visualizing, and Modeling Big Data with R
| R SQL Spark |
| Causal Inference in R | Welcome to Causal Inference in R. Answering causal questions is critical for scientific and business purposes, but techniques like randomized clinical trials and A/B testing are not always practical or successful. The tools in this book will allow readers to better make causal inferences with observational data with the R programming language. By its end, we hope to help you:
| R |
| Individual-Based Models of Cultural Evolution: A Step-by-Step Guide Using R | Книга показывает как создавать агентно-ориентированные модели или ABM культурной эволюции. В тексте книги используется код на языке программирования R. От очень простых моделей основных процессов культурной эволюции, таких как предвзятая передача и культурная мутация, к более сложным темам, таким как эволюция социального обучения, демографические эффекты и анализ социальных сетей. | R Ggplot |
| Interactive web-based data visualization with R, plotly, and shiny | Книга по разработке приложений в веб среде на основе языка R + Plotly + Shiny It makes heavy use of plotly for rendering graphics, but you’ll also learn about other R packages that augment a data science workflow, such as the tidyverse and shiny | R RStudio Shiny |
| Introduction to Econometrics with R | Введение в эконометрику с R - учебник по эконометрике с использованием языка R - еще на стадии совместного редактирования | R |
| Introductory Statistics for Economics | Книга "Introductory Statistics for Economics" предназначена для знакомства студентов с базовыми статистическими методами и их применением в экономике. Учебник содержит большое количество практических примеров и упражнений на языке программирования R, что формирует основные навыки данных и статистического анализа. Эти навыки отлично совмещаются с агентным моделированием в NetLogo, ведь полученные инструменты анализа данных и программирования применимы для анализа результатов симуляций и их визуализации. | R |
| Learn ggplot2 using Shiny App | Сетевая книга по освоению приемов работы с пакетом ggplot2 языка R в среде Shiny | R RStudio Shiny |
| Learning analytics methods and tutorials: A practical guide using R | Методы учебной аналитики с использованием языка R - открытое руководство с многочисленными примерами и ссылками на образовательные датасеты | R RStudio Аналитика мультимодальная |
| Mastering Shiny: Build Interactive Apps, Reports, and Dashboards Powered by R | Книга о создании аналитических веб-приложений на языке R в среде Shiny | R Shiny |
| Mastering Spark with R | Руководство как использовать Apache Spark с R. Книга поможет освоить инструменты, навыки и методы Apache Spark с R, применимые в крупномасштабной обработке данных | R Spark |
| Modeling Social Behavior: Mathematical and Agent-Based Models of Social Dynamics and Cultural Evolution | Социальные, поведенческие и когнитивные науки исторически полагались на силу слова. Слова имеют силу. Богатые аналогии могут найти отклик в умах читателей и пролить свет на тайны природы. Я говорю о вербальных теориях, описательных объяснениях сложных явлений. Большинство теорий, вероятно, более точны, чем поэтичны, но они, как правило, опираются на свойство большинства языков, согласно которому фраз могут нести в себе несколько возможных импликатур — рассмотрим, например, такие слова, как «восприятие», «категория», «идентичность», «тождественность» обучение» и даже «реакция» достаточно двусмысленны, чтобы допускать множество интерпретаций. То есть язык по своей сути (и адаптивно) расплывчат и двусмыслен. В конечном счете, это проблема для ученых, потому что нам нужно предельно четко понимать, о чем мы говорим, чтобы выдвинуть полезные теории Вселенной. | NetLogo BehaviorSpace R ODD принципы Центральная предельная теорема |
| Outstanding User Interfaces with Shiny | A book about deeply customizing Shiny app for production. | R Shiny |
| R for Data Science | Подробное руководство по использованию языка R для обработки, модификации, визуализации и программировании данных. Книга "R for Data Science" вводит концепцию tidy data как стандарт организации данных, где каждая переменная — в отдельном столбце, а каждая наблюдение — в отдельной строке. Это упрощает анализ, визуализацию и моделирование с помощью tidyverse. Стратегия книги строится вокруг полного цикла data science: импорт данных, их приведение к tidy-форме (tidying), трансформация (wrangling), визуализация (ggplot2). Цель — научить думать о данных как о tidy, чтобы 80% времени уходило на анализ, а не на чистку. | Анализ данных R RStudio |
| Text Mining with R | Книга даёт завершённую картину современных аналитических подходов к тексту, систематизируя инструменты R и методику работы с данными на всех этапах анализа. | R Tidytext |
| Text Mining with R: A Tidy Approach | Практический современный учебник с фокусом на подход "tidy data" в R. Охватывает: предобработку, токенизацию, анализ тональности, тематическое моделирование, визуализацию Используемые пакеты: tidytext, dplyr, ggplot2, quanteda | R Tidytext |
| Tidy Modeling with R | Руководство по созданию и использованию моделей при помощи пакетов из пространства tidyverse: recipes, parsnip, workflows, yardstick, and others. | R RStudio R for Data Science |
| Классификация, регрессия и другие алгоритмы Data Mining с использованием R | Описана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные нейронные сети и т.д. | R |
| Незримый колледж МЭШ | Статья, в которой понятие незримого колледжа применяется к сообществу учителей, сотрудничающих внутри репозитория московской электронной школы. | NetLogo BehaviorSpace R RStudio |
Готовые рецепты с R
| Description | |
|---|---|
| Pivot в R | Pivot в R (из пакета tidyr) — это "поворот" или "сводка данных", простыми словами — инструмент для перестройки формы таблицы: из длинной (long) в широкую (wide) и наоборот. Представьте, что данные — это пластилин: pivot_longer "растягивает" таблицу вниз, превращая столбцы в строки, а pivot_wider "расплющивает" её в стороны, делая из строк новые столбцы. Это нужно, чтобы привести данные к tidy-стандарту для удобного анализа, графиков и моделей — в образовании часто данные приходят "криво" (оценки по предметам в столбцах или в строках), а pivot их быстро приводит в порядок. |
| R for Big Data | R для обработки больших данных |
| Анализ данных | После того, как мы собрали или вырастили данные, наступает этап их анализа. В прикладной науке о данных выделяется определённая последовательность действий, которые совершаются над данными для их лучшего понимания и объяснения. |
| Библиографический анализ области знаний | Анализ публикаций начинается с представления общего поля работ, которые были сделаны по данной теме в последние 10 – 30 лет. В рецепте представлены следующие шаги:
|
| Библиометрические исследования | Как организовать и осуществить библиометрическое исследование - от сбора информации в базах данных, через обработку в библиоменеджерах и дальнейший анализ в средах анализа данных |
| Как извлечь данные из категории Digida | Мы хотим проанализировать тексты, которые хранятся в статья определенной категории поля цифровой дидактики. Есть 2 способа - экспорт статей и использование MediaWiki API |
| Как изучить данные PISA learningtower package | Некоторые данные PISA доступны в сети и в среде пакетов R. Например, можно использовать learningtower package |
| Как изучить студию с помощью Scratch API | Мы хотим изучить деятельность участников, которые разместили свои проекты внутри конкретной студии Scratch. В этом рецепте мы изучаем как авторы размещают свои проекты в данной студии (по ее номеру) и в других студиях. При этом исходно мы не использовали данные о комментариях к студии и проектам. |
| Как использовать данные в модели NetLogo | У нас есть наборы данных, которые мы хотим использовать в NetLogo модели. Как мы можем обратиться к этим данным и использовать их? |
| Как исследовать данные из Wealth Distribution в R | Процесс выращивания данных в модели и их последующий анализ в R |
| Как оценить командность в студиях Scratch | Мы хотим сравнить командность действий в студиях Scratch. Рецепт сделан на примере 5 студий, но может быть расширен и можно провести большое исследование для множества студий |
| Как посчитать метрики командности (GitLab) | У нас есть записи коммитов в GitLab и мы хотим оценить командность действий участников в различных проектах |
| Как представить графы совместной деятельности в R | Для датасета из GitLab строим графы месячной активности участников. |
| Как провести анализ временного ряда | Нам нужно показать процедуру анализа временного ряда на готовых или выращенных в эксперименте данных. |
| Как провести лингвистический анализ текста | Нам нужно провести сравнительный анализ текстов по лингвистическим характеристика:
|
| Как провести поверхностный анализ текста | Поверхностный анализ текста — это анализ легко измеримых, формальных характеристик текста, которые не требуют глубокого лингвистического анализа или интерпретации смысла. К ним относятся:
|
| Как провести семантический анализ текста |
|
| Как провести сравнительный анализ поведения на поле цифровой дидактики (R) | Мы собрали датасет о действиях участников на площадке digida и хотим провести анализ этого датасета с демонстрацией возможностей среды R
|
| Как собрать данные Scratch Wiki при помощи MediaWiki API | Знания сообщества Scratch хранятся в нескольких вики на разных языках. Мы хотим собрать и сравнить данные о поведении участников |
| Как собрать своё первое приложение Shinу | Как:
|
| Как сравнить тексты | Статья описывает методику комплексного сравнительного анализа текстовых корпусов. На примере студентов историков и филологов с площадки Digida.mgpu.ru, с использованием инструментов R и Voyant Tools. |
| Описать датасет при помощи описательной статистики | У нас есть готовый датасет и мы хотим его описать при помощи описательной статистики. При этом мы можем пользоваться различными статистическими пакетами и языками программирования. |
| Регрессионная модель | Регрессионная модель — это статистический инструмент, который помогает нам предсказывать значение одной переменной, исходя из значений других переменных. Это способ найти закономерность в данных и использовать её для предсказания будущих значений. В статье описано, как построить регрессионную модель и провести регрессионный анализ (на примере Language Change) |
| Сравнение Scratch wikis | Это рецепт извлечения данных по MediaWiki API из различных вики площадок, связанных с языком программирования Scratch. |
| Сравнить тексты нескольких датасетов | У нас есть несколько датасетов с библиографическими данными. Мы хотим провести сравнительный анализ по столбцу названий публикаций, чтобы понять различия между научными школами |
| Считать данные в R | Как считать данные в R, если они лежат на локальной машине или доступны удаленно по URL |
Студенческие работы
| Description | |
|---|---|
| Описать датасет при помощи описательной статистики | У нас есть готовый датасет и мы хотим его описать при помощи описательной статистики. При этом мы можем пользоваться различными статистическими пакетами и языками программирования. |
