R-скрипт анализа Конухова Анастасия: различия между версиями
Материал из Поле цифровой дидактики
Новая страница: «Страница создана Конуховой Анастасией, ИНФА-221. == Описание датасета == Датасет Billionaires содержит информацию о миллиардерах мира:https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv Датасет был взят с https://digida.mgpu.ru/index.php/Billionaires_(dataset) == Код R-скрипта == Файл:Код R.png|400px...» |
Нет описания правки |
||
| Строка 5: | Строка 5: | ||
Датасет Billionaires содержит информацию о миллиардерах мира:https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv | Датасет Billionaires содержит информацию о миллиардерах мира:https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv | ||
Датасет был взят с | Датасет был взят с [[:Категория:Dataset]] | ||
== Код R-скрипта == | == Код R-скрипта == | ||
Текущая версия от 22:52, 2 июня 2026
Страница создана Конуховой Анастасией, ИНФА-221.
Описание датасета
Датасет Billionaires содержит информацию о миллиардерах мира:https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv
Датасет был взят с Категория:Dataset
Код R-скрипта

library(tidyverse)
data <- read_csv("https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv")
glimpse(data)
total_records <- nrow(data)
print(paste("Всего миллиардеров в датасете:", total_records))
total_words_names <- sum(str_count(data$name, "\\S+"))
print(paste("Всего слов в именах миллиардеров:", total_words_names))
top10_names <- data %>%
separate_rows(name, sep = " ") %>%
count(word = name, sort = TRUE) %>%
head(10)
print("10 самых частых слов в именах миллиардеров:")
print(top10_names)
top_countries <- data %>%
count(country = `location.citizenship`, sort = TRUE) %>%
head(10)
print("Топ-10 стран по числу миллиардеров:")
print(top_countries)
Результаты анализа
| Показатель | Значение |
|---|---|
| Общее количество миллиардеров | 2614 |
| Общее количество слов в именах | 5908 |
10 самых частых слов в именах

| Слово | Частота |
|---|---|
| John | 65 |
| David | 41 |
| Robert | 40 |
| Michael | 39 |
| Richard | 36 |
| James | 31 |
| de | 31 |
| Jr. | 28 |
| and | 28 |
| Lee | 27 |
Топ-10 стран по числу миллиардеров

| Страна | Количество миллиардеров |
|---|---|
| United States | 903 |
| Germany | 160 |
| China | 153 |
| Russia | 119 |
| Japan | 96 |
| Brazil | 81 |
| Hong Kong | 77 |
| France | 72 |
| United Kingdom | 65 |
| India | 63 |
Комментарий
В датасете Billionaires содержится 2614 записей о миллиардерах. Общее количество слов в именах составляет 5908.
По странам лидируют США (903 миллиардера), затем Германия (160) и Китай (153).
