R for Data Science: различия между версиями

Материал из Поле цифровой дидактики
Метка: ручная отмена
Нет описания правки
Строка 1: Строка 1:
{{Book
{{Book
|Description=Подробное руководство по использованию языка R для обработки, модификации, визуализации и программировании данных
|Description=Подробное руководство по использованию языка R для обработки, модификации, визуализации и программировании данных. Книга "'''R for Data Science'''" вводит концепцию tidy data как стандарт организации данных, где каждая переменная — в отдельном столбце, а каждая наблюдение — в отдельной строке. Это упрощает анализ, визуализацию и моделирование с помощью tidyverse. Стратегия книги строится вокруг полного цикла data science: импорт данных, их приведение к tidy-форме (tidying), трансформация (wrangling), визуализация (ggplot2). Цель — научить думать о данных как о tidy, чтобы 80% времени уходило на анализ, а не на чистку.
|Field_of_knowledge=NetSci, Биология, Информатика, Социология
|Field_of_knowledge=NetSci, Биология, Информатика, Социология
|launch year=2023
|launch year=2023
Строка 73: Строка 73:
   )
   )
</syntaxhighlight>
</syntaxhighlight>
Tidy data обеспечивает единообразную структуру, совместимую с функциями tidyverse. Основные принципы: переменные в столбцах, наблюдения в строках; одна [[таблица]] на [[датасет]]. Это позволяет R работать с векторами естественно, ускоряя трансформации.
[[Pivot в R]]

Версия от 13:01, 2 марта 2026



Описание книги Подробное руководство по использованию языка R для обработки, модификации, визуализации и программировании данных. Книга "R for Data Science" вводит концепцию tidy data как стандарт организации данных, где каждая переменная — в отдельном столбце, а каждая наблюдение — в отдельной строке. Это упрощает анализ, визуализацию и моделирование с помощью tidyverse. Стратегия книги строится вокруг полного цикла data science: импорт данных, их приведение к tidy-форме (tidying), трансформация (wrangling), визуализация (ggplot2). Цель — научить думать о данных как о tidy, чтобы 80% времени уходило на анализ, а не на чистку.
Область знаний NetSci, Биология, Информатика, Социология
Год издания 2023
Веб-сайт где можно прочитать книгу или статью https://r4ds.hadley.nz/
Видео запись https://www.youtube.com/watch?v=go5Au01Jrvs
Авторы Wickham
Среды и средства, на которые повлияла книга R, RStudio, Анализ_данных


Book WorkFlow

Особенности книги

  • Тема моделирования с R в редакции 2023 года из книги удалена - советуют Tidy Modeling with R

Сама книга опубликована на Quarto и является примером для таких понятий как активное эссе и выполняемая публикация

flights |> 
  mutate(
    speed      = air_time / distance,
    dep_hour   = dep_time %/% 100,
    dep_minute = dep_time %%  100
  )

Tidy data обеспечивает единообразную структуру, совместимую с функциями tidyverse. Основные принципы: переменные в столбцах, наблюдения в строках; одна таблица на датасет. Это позволяет R работать с векторами естественно, ускоряя трансформации.

Pivot в R