Психологические школы России (датасет): различия между версиями

Материал из Поле цифровой дидактики
Нет описания правки
Нет описания правки
Строка 218: Строка 218:


</div>
</div>
== Анализ совместного редактирования (MediaWiki API) ==
Для анализа соавторства и совместного редактирования используется MediaWiki API.
Пример запроса:
https://en.wikipedia.org/w/api.php?action=query&prop=contributors&titles=Psychology&pclimit=50&format=json
Этот запрос возвращает список участников, редактировавших страницу "Psychology".
== Пример кода извлечения ==
<syntaxhighlight lang="python" line>
import requests
url = "https://en.wikipedia.org/w/api.php"
params = {
    "action": "query",
    "prop": "contributors",
    "titles": "Psychology",
    "pclimit": 50,
    "format": "json"
}
response = requests.get(url, params=params)
data = response.json()
print(data)
</syntaxhighlight>
'''Что делаем дальше:'''
* извлекаем авторов 
* строим граф "автор–страница" 
* анализируем плотность взаимодействий 
== Граф совместного редактирования ==
[[Graph:Coauthorship_Psychology]]
'''Что показывает граф:'''
* узлы — авторы 
* связи — совместное редактирование 
* плотность графа отражает уровень коллективной работы 


== Pipeline анализа данных ==
== Pipeline анализа данных ==

Версия от 21:35, 13 апреля 2026

Описание датасета Публикации российских психологов в Lens
Описание полей
  1. Lens ID
  2. Title
  3. Date Published
  4. Publication Year
  5. Publication Type
  6. Source Title
  7. ISSNs
  8. Publisher
  9. Source Country
  10. Author/s
  11. Abstract
  12. Volume
  13. Issue Number
  14. Start Page
  15. End Page
  16. Fields of Study
  17. Keywords
  18. MeSH Terms
  19. Chemicals
  20. Funding
  21. Source URLs
  22. External URL
  23. PMID
  24. DOI
  25. Microsoft Academic ID
  26. PMCID
  27. Citing Patents Count
  28. References
  29. Citing Works Count
  30. Is Open Access
  31. Open Access License
  32. Open Access Colour
Форматы данных CSV
Область знаний Информатика, Психология
Веб-сайт - ссылка на датасет
Примеры использования датасета
Год создания датасета 2006

Социосемантическая структура публикаций российских психологов (Lens)

Исследовательский вопрос

Как связаны социальные параметры научного производства (организации: МГУ, МГПУ, РАН) и семантические характеристики публикаций (тип статьи, открытый доступ, тематика) с уровнем цитируемости?

Гипотеза

Публикации в формате journal article и с открытым доступом (Open Access) имеют более высокую цитируемость, формируя устойчивые социосемантические паттерны.

Теоретическая рамка

Социосемантическая система науки включает:

  • социальный уровень — авторы и организации
  • семантический уровень — темы, типы публикаций
  • механизм связи — цитирование

Цитирование выступает как ключевой механизм, связывающий производство знаний и их распространение.

---

Данные

Академия наук (цитируемость = 5)

Название Год Цитирования

Features of the Development of a Teenager's Subjectivity in Interaction with the Natural Environment in a Children's Educational and Health Camp 2021 5
Ретроспективный анализ посттравматического стресса в годы Великой Отечественной войны 2021 5
Воздействие алкоголя на сердечный ритм и оценку действий при решении моральных дилемм 2017 5
Study of Neurocognitive Processes in a Paradigm of Information Concealment 2021 5
Emotional Regulation in Individuals, Standing in Codependent Relationship 2021 5
Метод реляционно-ситуационного анализа текста в психологических исследованиях 2020 5

МГУ (публикации = 2018 год, Цитирования = 5)

Название Год Тип публикации Цитирования

К вопросу о нормативно-правовом регулировании организации деятельности психолого-медико-педагогических комиссий в контексте профилактики правонарушений несовершеннолетних 2018 journal article 5
Патохарактерологические особенности психически здоровых лиц, склонных к импульсивной агрессии 2018 journal article 5

МГПУ (5 фильтров одновременно)

Название Год Тип публикации Open Access Область Цитирования

Трансформация метафорических репрезентаций жизненного пути личности в период самоизоляции у взрослых 2020 journal article true Psychology 3
Prerequisites for Accepting the Digital Educational Environment in New Cultural and Historical Conditions 2021 journal article true Psychology 4
Психологические детерминанты возникновения внутриличностных противоречий студентов 2020 journal article true Psychology 1

Возможности анализа

Используя параметр |filters= можно:

  • отбирать публикации по годам
  • сравнивать школы по цитируемости
  • выделять только статьи (Publication Type=journal article)
  • анализировать публикации в открытом доступе
  • строить выборки для последующего анализа в R

Семантические запросы (SMW)

1. Датасеты по психологии

 FileFormatLaunch year
ABM Constructor2024
Adila
Airtable2015
Alexandra Valyaeva
Alina Ermakova
Alina Stenshina
AliyaSa
Anastasia Lugovaya
Anna Volynchikova
AnotnovVA207
Antisummit МГПУ 2024
AskerovaMary
BeregovaMS
Blown to Bits2008
BoboevaSN
Books (dataset)JSON
CSV
BudilovskiiAV
CherenkovIR
Communities of Practice1998
Cyberleninka
DavydovAE
Die Toten Engel
Dreytsers
E.v.menzul
EVSmolin777
EgorovSN
Egorovsn051
EkaterinaRodionovaIoe2025
FedyshinaSP
FreeMind
Gaines1938
GawainGabhann
Gee1949
Glazunova
InasovAA
Julia Sibirtseva
Kamyshnikovaej
Kate
Kiss Love
KornevaNS
Learning mechanic
Lens Psych Collab
LiAV
Literacy and Education2014
Maria Ledneva
MarkovNA
Marya Aks
Memex
Mindstorms1980
Mouse
… следующие результаты

Результат: список психологических датасетов


2. Все BigDataWorks

 Field of knowledge
Анализ активности персонажей вселенной Disney
Анализ активности пользователей Digida
Анализ наиболее посещаемых страниц портала
Анализ погоды за последнюю неделю
Анализ президентских выборов в России (2018)
Демографические данные России за 5 лет
Изучение изменения стоимости валют по данным ЦБ
Интерактивный дашборд динамики цен на недвижимость на основе Parquet и DuckDB
Коллекция песен из индийского кинематографа DataSetБольшие данные
Искусственный интеллект
Информатика
Образование
Музыка
Медиа
Лаборатории изучения командного творчества подростков в цифровых средах
Мировая сейсмическая активность за последние 30 дней
Погода за последние 7 дней
Психологические школы России (датасет)Информатика
Психология
Цифровые следы командности: сравнительный анализ Scratch-вики и студий

Результат: все проекты с данными


3. После 2010 года

 Field of knowledge
ABM ConstructorБольшие данные
Наука о сетях
Педагогика
Психология
Образование
Интернет вещей
Моделирование
ACRLИнформатика
Литература
APIs for social scientists: A collaborative reviewБольшие данные
Наука о сетях
Информатика
Образование
Adobe SparkИнформатика
Agent-Based and Individual-Based Modeling: A Practical IntroductionБиология
История
Медицина
Моделирование
AgentScript
Ai dungeon
AirtableБольшие данные
Искусственный интеллект
Информатика
Психология
Социология
Экономика
Образование
Статистика
Интернет вещей
Моделирование
Управление
Мобильное обучение
Game design
Спорт
An Introduction to Agent-Based Modeling: Modeling Natural, Social, and Engineered Complex Systems with NetLogoНаука о сетях
Информатика
Биология
Экономика
Археология
Математика
Образование
Моделирование
Обществознание
Android Studio
App InventorИнформатика
Робототехника
Математика
Интернет вещей
География
App Inventor 2 (book)Информатика
Artbreeder
Audionotes
AutoThinking
Awash in DataБольшие данные
Социология
Статистика
Моделирование
Beetle Blocks
Bert
Brainscape
CODAPБольшие данные
Информатика
Статистика
Картография
CORGISНаука о сетях
Информатика
Педагогика
COVID (dataset 1)Медицина
Causal Inference in RИнформатика
Социология
Экономика
Статистика
Causal Inference: The MixtapeЭкономика
Статистика
Управление
Cellverse
Character.ai
ChatGPT
ChatbotACM (dataset)Искусственный интеллект
Children Learning to CodeИнформатика
Управление
Chronoviz
Clicbot
ClubHouse
CodeMonkey
Codey RockyРобототехника
Образование
Мехатроника
CodyColor
Collaborative knowledge ACM (dataset)Информатика
Образование
Управление
Computational thinking (ACM)Искусственный интеллект
Информатика
Робототехника
Computer Science with Snap! by ExamplesИнформатика
Математика
Образование
Craiyon
CreatiCode
DBSnap
DOLYИскусственный интеллект
Робототехника
Интернет вещей
Инженерия
DartИнформатика
Мобильное обучение
DatawrapperБольшие данные
Социология
Статистика
DeepseekБольшие данные
Искусственный интеллект
Статистика
Delitex
Demonstrate an understanding of the role an online identity plays in the digital world
Demonstrate an understanding of what personal data is
DetectiveStudio (dataset)Наука о сетях
Информатика
Digida2026Педагогика
Статистика
… следующие результаты

Результат: современные датасеты


4. Только CSV

 Field of knowledge
Astronauts (dataset)Астрономия
Billionaires (dataset)Наука о сетях
Bills of Mortality (dataset)История
География
Урбанистика
Books (dataset)Психология
Социология
COVID (dataset 1)Медицина
ChatbotACM (dataset)Искусственный интеллект
Cities (dataset)Экономика
География
Урбанистика
Collaborative knowledge ACM (dataset)Информатика
Образование
Управление
Computational thinking (ACM)Искусственный интеллект
Информатика
Робототехника
DetectiveStudio (dataset)Наука о сетях
Информатика
Digida2026Педагогика
Статистика
DigidaCollab 02 2026
Food (dataset)Биология
Медицина
Образование
Forum (dataset)Образование
Games (biblio dataset)Информатика
Мобильное обучение
GitLab example
GoogleSchool 01(dataset)Информатика
Педагогика
Образование
GoogleSchool 02(dataset)Педагогика
Graduate (dataset)Педагогика
Образование
Урбанистика
ICD 10Медицина
Invisible College Scopus (dataset)Социология
Letopisi 2006 (dataset)Информатика
Педагогика
Социология
Образование
Lobster (fish-dataset)Наука о сетях
Биология
NetLogo Wealth Distribution 07122025Экономика
Статистика
Моделирование
On-line masters
PokemonDatasetОбразование
Preschool Digital ScopusНаука о сетях
Педагогика
Робототехника
Образование
Мобильное обучение
Scopus Games (dataset)Информатика
Педагогика
Мобильное обучение
ScratchWikis2026
Screen-Writing 2026Медиа
Video games (dataset)Робототехника
Образование
Мобильное обучение
Взаимное копирование МЭШ (датасет)Педагогика
Психология
Математика
Управление
Вовлеченность студентов Л2Психология
Образование
Вовлеченность студентов при использовании LearningAppsПсихология
Образование
Данные из модели о привлечении учеников в школы КитаяПедагогика
Образование
Статистика
Моделирование
Машинное обучение платформыБольшие данные
Искусственный интеллект
Информатика
Робототехника
Статистика
Мотивация – как фактор управления профессиональным развитием педагогических работников общеобразовательной организацииОбразование
Периодическая системаХимия
Психологические школы России (датасет)Информатика
Психология
Сайты российских школОбразование
Студия Collab Challenge (dataset)Наука о сетях
Информатика
Образование
Цифровые инструменты учителейИнформатика
Образование
Что делают в МЭШ учителя английского языка
Что делают в МЭШ учителя литературыЛингвистика
Что делают в МЭШ учителя математикиМатематика

Результат: данные для R


5. Междисциплинарные

 Launch year
Adila
Airtable2015
Alina Stenshina
AliyaSa
Blown to Bits2008
BoboevaSN
BudilovskiiAV
CherenkovIR
Cyberleninka
DavydovAE
Die Toten Engel
EVSmolin777
FedyshinaSP
Gee1949
InasovAA
Kamyshnikovaej
Kate
Kiss Love
KornevaNS
LiAV
Maria Ledneva
Marya Aks
Memex
Mindstorms1980
Mouse
Natalia Verezubova
Nikita Pechko
OksanaOS036
PadalkoYV
Papert1928
Pospelov
Removing an Item from a List (by value)
Rybakinaea
ShvedovaSS
Smolkina Anastasia
StulinSD
Tatiana Nigay
The Design of Everyday Things1988
The Wiki Way: Quick Collaboration on the Web2001
Vanyarina Julia
VetoshkinaAS
Viktoriia
VolkovAJ
Yarmakhov
Zaharova am
À la carte
Анализ абстрактов статей
Аналитика
Анастасия
Аниканова Мария Сергеевна
… следующие результаты

Результат: пересечение областей

Анализ совместного редактирования (MediaWiki API)

Для анализа соавторства и совместного редактирования используется MediaWiki API.

Пример запроса:

https://en.wikipedia.org/w/api.php?action=query&prop=contributors&titles=Psychology&pclimit=50&format=json

Этот запрос возвращает список участников, редактировавших страницу "Psychology".

Пример кода извлечения

import requests

url = "https://en.wikipedia.org/w/api.php"

params = {
    "action": "query",
    "prop": "contributors",
    "titles": "Psychology",
    "pclimit": 50,
    "format": "json"
}

response = requests.get(url, params=params)
data = response.json()

print(data)

Что делаем дальше:

  • извлекаем авторов
  • строим граф "автор–страница"
  • анализируем плотность взаимодействий

Граф совместного редактирования

Graph:Coauthorship_Psychology

Что показывает граф:

  • узлы — авторы
  • связи — совместное редактирование
  • плотность графа отражает уровень коллективной работы

Pipeline анализа данных

---

Метрики

Основной показатель:

[math]\displaystyle{ \bar{C} = \frac{1}{N} \sum_{i=1}^{N} C_i }[/math]

Дополнительно:

[math]\displaystyle{ OA = \frac{N_{open}}{N_{total}} }[/math]

---

Анализ в R

mgpu <- read.csv("lens_mgpu.csv")
mgu  <- read.csv("lens_mgu.csv")
ras  <- read.csv("lens_ras.csv")

mgpu_filtered <- subset(mgpu,
  Publication.Year > 2018 &
  Citing.Works.Count < 6 &
  Publication.Type == "journal article"
)

mean(mgpu_filtered$Citing.Works.Count)

aggregate(Citing.Works.Count ~ Publication.Year, data=mgpu, mean)

hist(mgpu$Citing.Works.Count)

---

Социосемантическая модель

---

Агентная модель

Ошибка: не указано имя модели

---

Интерактивная модель

---

Урок с данными

Модель на этих данных

Lens Psych Collab


Те же данные, но после очистки в OpenRefine

  1. Author/s,
  2. Title,
  3. Publication Year,
  4. Lens ID,
  5. DOI,
  6. Citing Works Count


МГПУ

Академия наук

МГУ

---

Вывод

Анализ показал:

  • цитируемость зависит от типа публикации
  • journal articles формируют ядро научного поля
  • Open Access увеличивает видимость исследований

Социальные параметры (организации) и семантические параметры (структура публикаций) совместно формируют социосемантическую систему науки.

Цитирование выступает ключевым механизмом связи между ними.