Сравнить тексты нескольких датасетов: различия между версиями

Материал из Поле цифровой дидактики
Нет описания правки
Строка 11: Строка 11:


Все данные содержат одинаковые столбцы: Lens ID,Title,Date Published,Publication Year,Publication Type,Source Title,ISSNs,Publisher,Source Country,Author/s,Abstract,Volume,Issue Number,Start Page,End Page,Fields of Study,Keywords,MeSH Terms,Chemicals,Funding,Source URLs,External URL,PMID,DOI,Microsoft Academic ID,PMCID,Citing Patents Count,References,Citing Works Count,Is Open Access,Open Access License,Open Access Colour
Все данные содержат одинаковые столбцы: Lens ID,Title,Date Published,Publication Year,Publication Type,Source Title,ISSNs,Publisher,Source Country,Author/s,Abstract,Volume,Issue Number,Start Page,End Page,Fields of Study,Keywords,MeSH Terms,Chemicals,Funding,Source URLs,External URL,PMID,DOI,Microsoft Academic ID,PMCID,Citing Patents Count,References,Citing Works Count,Is Open Access,Open Access License,Open Access Colour
; [[Считать данные в R]]


=== Полезные библиотеки ===
=== Полезные библиотеки ===
Строка 18: Строка 20:
library(ggplot2)
library(ggplot2)
library(wordcloud)
library(wordcloud)
</syntaxhighlight>


; [[Считать данные в R]]


<syntaxhighlight lang="R" line>
##########
data_AS <- read_csv("https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-acad-sci-psych.csv")
data_AS <- read_csv("https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-acad-sci-psych.csv")


# Загрузка данных MGPU (Moscow Pedagogical State University)
data_MGPU <- read_csv("https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgpu-psychol.csv")
data_MGPU <- read_csv("https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgpu-psychol.csv")


# Загрузка данных MGU (Moscow State University)
data_MGU <- read_csv("https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgu-psychol.csv")
data_MGU <- read_csv("https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgu-psychol.csv")
nrow(data_AS)    # количество статей в AS
</syntaxhighlight>
</syntaxhighlight>

Версия от 17:36, 18 декабря 2025

Описание У нас есть несколько датасетов с библиографическими данными. Мы хотим провести сравнительный анализ по столбцу названий публикаций, чтобы понять различия между научными школами
Область знаний Психология, Статистика
Область использования (ISTE)
Возрастная категория 20


Поясняющее видео
Близкие рецепту понятия
Среды и средства для приготовления рецепта: R, GitHub, VOYANT Tools

Перечень данных к сравнению (получены из Lens)

Все данные содержат одинаковые столбцы: Lens ID,Title,Date Published,Publication Year,Publication Type,Source Title,ISSNs,Publisher,Source Country,Author/s,Abstract,Volume,Issue Number,Start Page,End Page,Fields of Study,Keywords,MeSH Terms,Chemicals,Funding,Source URLs,External URL,PMID,DOI,Microsoft Academic ID,PMCID,Citing Patents Count,References,Citing Works Count,Is Open Access,Open Access License,Open Access Colour

Считать данные в R

Полезные библиотеки

library(tidyverse)
library(tidytext)
library(ggplot2)
library(wordcloud)


##########
data_AS <- read_csv("https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-acad-sci-psych.csv")

data_MGPU <- read_csv("https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgpu-psychol.csv")

data_MGU <- read_csv("https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgu-psychol.csv")


nrow(data_AS)    # количество статей в AS