R for Data Science: различия между версиями

Текущая версия от 17:57, 31 мая 2026

Описание книги	Подробное руководство по использованию языка R для обработки, модификации, визуализации и программировании данных. Книга "R for Data Science" вводит концепцию tidy data как стандарт организации данных, где каждая переменная — в отдельном столбце, а каждая наблюдение — в отдельной строке. Это упрощает анализ, визуализацию и моделирование с помощью tidyverse. Стратегия книги строится вокруг полного цикла data science: импорт данных, их приведение к tidy-форме (tidying), трансформация (wrangling), визуализация (ggplot2). Цель — научить думать о данных как о tidy, чтобы 80% времени уходило на анализ, а не на чистку.
Область знаний	NetSci, Биология, Информатика, Социология
Год издания	2023
Веб-сайт где можно прочитать книгу или статью	https://r4ds.hadley.nz/
Видео запись	https://www.youtube.com/watch?v=go5Au01Jrvs
Авторы	Wickham
Среды и средства, на которые повлияла книга	R, RStudio, Анализ_данных

Book WorkFlow

Особенности книги

Тема моделирования с R в редакции 2023 года из книги удалена - советуют Tidy Modeling with R

Сама книга опубликована на Quarto и является примером для таких понятий как активное эссе и выполняемая публикация

Уроки из R for Data Science

Tidy data обеспечивает единообразную структуру, совместимую с функциями tidyverse. Основные принципы: переменные в столбцах, наблюдения в строках; одна таблица на датасет. Это позволяет R работать с векторами естественно, ускоряя трансформации.

	Description
Pivot в R	Pivot в R (из пакета tidyr) — это "поворот" или "сводка данных", простыми словами — инструмент для перестройки формы таблицы: из длинной (long) в широкую (wide) и наоборот. Представьте, что данные — это пластилин: pivot_longer "растягивает" таблицу вниз, превращая столбцы в строки, а pivot_wider "расплющивает" её в стороны, делая из строк новые столбцы. Это нужно, чтобы привести данные к tidy-стандарту для удобного анализа, графиков и моделей — в образовании часто данные приходят "криво" (оценки по предметам в столбцах или в строках), а pivot их быстро приводит в порядок.

@@ Строка 1: / Строка 1: @@
 {{Book
-|Description=Подробное руководство по использованию языка R для обработки, модификации, визуализации и программировании данных
+|Description=Подробное руководство по использованию языка R для обработки, модификации, визуализации и программировании данных. Книга "'''R for Data Science'''" вводит концепцию tidy data как стандарт организации данных, где каждая переменная — в отдельном столбце, а каждая наблюдение — в отдельной строке. Это упрощает анализ, визуализацию и моделирование с помощью tidyverse. Стратегия книги строится вокруг полного цикла data science: импорт данных, их приведение к tidy-форме (tidying), трансформация (wrangling), визуализация (ggplot2). Цель — научить думать о данных как о tidy, чтобы 80% времени уходило на анализ, а не на чистку.
 |Field_of_knowledge=NetSci, Биология, Информатика, Социология
 |launch year=2023
 |Website=https://r4ds.hadley.nz/
 |Clarifying_video=https://www.youtube.com/watch?v=go5Au01Jrvs
-|Environment=R, RStudio
+|Inventor=Wickham
+|Environment=R, RStudio, Анализ_данных
 }}
-Тема моделирования с [[R]] в редакции 2023 года из книги удалена - советуют [[Tidy Modeling with R]]
+=== Book WorkFlow ===
-{{#widget:YouTube|id=go5Au01Jrvs|start=5}}
+<uml>
+@startuml
+skinparam NoteBackgroundColor tan
+start
+:Import;
+note right
+csv
+Web scraping
+end note
-https://www.youtube.com/watch?v=MjHQo-t2v_c
+:Tidy;
+note left
+tidyverse
+mutate
+group_by
+summarize
-https://www.youtube.com/watch?v=cpbtcsGE0OA
+end note
+:Transform;
+note right
+filter
+mutate
+summarize
+if_else()
+case_when()
+Regular expressions
+end note
+:Visualize;
+note left
+ggplot
+ggplot2
+ggthemes
+glimpse
+end note
+:Communicate;
+note right
+end note
+stop
+@enduml
+</uml>
+=== Особенности книги  ===
+* Тема моделирования с [[R]] в редакции 2023 года из книги удалена - советуют [[Tidy Modeling with R]]
+Сама книга опубликована на [[Quarto]] и является примером для таких понятий как [[активное эссе]] и [[выполняемая публикация]]
+===  Уроки из  [[R for Data Science]] ===
+Tidy data обеспечивает единообразную структуру, совместимую с функциями tidyverse. Основные принципы: переменные в столбцах, наблюдения в строках; одна [[таблица]] на [[датасет]]. Это позволяет R работать с векторами естественно, ускоряя трансформации.
+{{#ask: [[Pivot в R]] | ?Description }}

Аноним

Поиск

R for Data Science: различия между версиями

Пространства имён

Ещё

Действия на странице

Текущая версия от 17:57, 31 мая 2026

Book WorkFlow

Особенности книги

Уроки из R for Data Science

Навигация

Навигация

Вики-инструменты

Вики-инструменты

Аноним

Поиск

R for Data Science: различия между версиями

Текущая версия от 17:57, 31 мая 2026

Book WorkFlow

Особенности книги

Уроки из R for Data Science

Навигация

Вики-инструменты

Инструменты для страниц

Категории