Как изучить данные PISA learningtower package
Материал из Поле цифровой дидактики
| Описание | Некоторые данные PISA доступны в сети и в среде пакетов R. Например, можно использовать learningtower package |
|---|---|
| Область знаний | Информатика, Образование |
| Область использования (ISTE) | |
| Возрастная категория | 15
|
| Поясняющее видео | |
| Близкие рецепту понятия | |
| Среды и средства для приготовления рецепта: | R |
getwd()
#------------
library(learningtower);
library(dplyr)
library(ggplot2)
#----
student_data_2015 <- load_student(2015)
str(student_data_2015)
glimpse(student_data_2015)
summary(student_data_2015)
glimpse(student_data_2015)
data_proc <- student_data_2015 %>%
filter(country %in% c("RUS", "USA", "SGP")) %>%
group_by(country, gender) %>%
summarise(
mean_math = weighted.mean(math, stu_wgt, na.rm = TRUE),
mean_science = weighted.mean(science, stu_wgt, na.rm = TRUE),
n = n(),
.groups = "drop"
) %>%
na.omit()
print(data_proc)
ggplot(student_data_2015 %>% filter(country %in% c("RUS", "USA", "SGP")),
aes(x = country, y = math, fill = gender)) +
geom_boxplot(alpha = 0.7) +
labs(title = "Распределение баллов по математике (PISA 2015)",
x = "Страна", y = "Баллы по математике", fill = "Пол") +
theme_minimal() +
theme(legend.position = "bottom")
data_long <- data_proc %>%
tidyr::pivot_longer(cols = starts_with("mean_"), names_to = "subject", values_to = "score") %>%
mutate(subject = recode(subject, "mean_math" = "Математика", "mean_science" = "Наука"))
ggplot(data_long, aes(x = country, y = score, fill = gender)) +
geom_col(position = "dodge") +
facet_wrap(~ subject) +
labs(title = "Средние взвешенные баллы PISA 2015",
x = "Страна", y = "Средний балл", fill = "Пол") +
theme_minimal() +
theme(legend.position = "bottom")
