R-скрипт анализа Конухова Анастасия: различия между версиями

Материал из Поле цифровой дидактики
Новая страница: «Страница создана Конуховой Анастасией, ИНФА-221. == Описание датасета == Датасет Billionaires содержит информацию о миллиардерах мира:https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv Датасет был взят с https://digida.mgpu.ru/index.php/Billionaires_(dataset) == Код R-скрипта == Файл:Код R.png|400px...»
 
Нет описания правки
 
Строка 5: Строка 5:
Датасет Billionaires содержит информацию о миллиардерах мира:https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv
Датасет Billionaires содержит информацию о миллиардерах мира:https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv


Датасет был взят с https://digida.mgpu.ru/index.php/Billionaires_(dataset)
Датасет был взят с [[:Категория:Dataset]]


== Код R-скрипта ==
== Код R-скрипта ==

Текущая версия от 22:52, 2 июня 2026

Страница создана Конуховой Анастасией, ИНФА-221.

Описание датасета

Датасет Billionaires содержит информацию о миллиардерах мира:https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv

Датасет был взят с Категория:Dataset

Код R-скрипта

Код R-скрипта в RStudio
library(tidyverse)

data <- read_csv("https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv")

glimpse(data)

total_records <- nrow(data)
print(paste("Всего миллиардеров в датасете:", total_records))

total_words_names <- sum(str_count(data$name, "\\S+"))
print(paste("Всего слов в именах миллиардеров:", total_words_names))

top10_names <- data %>%
  separate_rows(name, sep = " ") %>%
  count(word = name, sort = TRUE) %>%
  head(10)

print("10 самых частых слов в именах миллиардеров:")
print(top10_names)

top_countries <- data %>%
  count(country = `location.citizenship`, sort = TRUE) %>%
  head(10)
print("Топ-10 стран по числу миллиардеров:")
print(top_countries)


Результаты анализа

Показатель Значение
Общее количество миллиардеров 2614
Общее количество слов в именах 5908

10 самых частых слов в именах

Результаты в консоли R
Слово Частота
John 65
David 41
Robert 40
Michael 39
Richard 36
James 31
de 31
Jr. 28
and 28
Lee 27


Топ-10 стран по числу миллиардеров

Топ-10 стран по числу миллиардеров
Страна Количество миллиардеров
United States 903
Germany 160
China 153
Russia 119
Japan 96
Brazil 81
Hong Kong 77
France 72
United Kingdom 65
India 63

Комментарий

В датасете Billionaires содержится 2614 записей о миллиардерах. Общее количество слов в именах составляет 5908.

По странам лидируют США (903 миллиардера), затем Германия (160) и Китай (153).