R-скрипт анализа Конухова Анастасия

Материал из Поле цифровой дидактики

Страница создана Конуховой Анастасией, ИНФА-221.

Описание датасета

Датасет Billionaires содержит информацию о миллиардерах мира:https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv

Датасет был взят с Категория:Dataset

Код R-скрипта

Код R-скрипта в RStudio
library(tidyverse)

data <- read_csv("https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv")

glimpse(data)

total_records <- nrow(data)
print(paste("Всего миллиардеров в датасете:", total_records))

total_words_names <- sum(str_count(data$name, "\\S+"))
print(paste("Всего слов в именах миллиардеров:", total_words_names))

top10_names <- data %>%
  separate_rows(name, sep = " ") %>%
  count(word = name, sort = TRUE) %>%
  head(10)

print("10 самых частых слов в именах миллиардеров:")
print(top10_names)

top_countries <- data %>%
  count(country = `location.citizenship`, sort = TRUE) %>%
  head(10)
print("Топ-10 стран по числу миллиардеров:")
print(top_countries)


Результаты анализа

Показатель Значение
Общее количество миллиардеров 2614
Общее количество слов в именах 5908

10 самых частых слов в именах

Результаты в консоли R
Слово Частота
John 65
David 41
Robert 40
Michael 39
Richard 36
James 31
de 31
Jr. 28
and 28
Lee 27


Топ-10 стран по числу миллиардеров

Топ-10 стран по числу миллиардеров
Страна Количество миллиардеров
United States 903
Germany 160
China 153
Russia 119
Japan 96
Brazil 81
Hong Kong 77
France 72
United Kingdom 65
India 63

Комментарий

В датасете Billionaires содержится 2614 записей о миллиардерах. Общее количество слов в именах составляет 5908.

По странам лидируют США (903 миллиардера), затем Германия (160) и Китай (153).