Психологические школы России (датасет): различия между версиями
Нет описания правки |
Нет описания правки |
||
| Строка 218: | Строка 218: | ||
</div> | </div> | ||
== Анализ совместного редактирования (MediaWiki API) == | |||
Для анализа соавторства и совместного редактирования используется MediaWiki API. | |||
Пример запроса: | |||
https://en.wikipedia.org/w/api.php?action=query&prop=contributors&titles=Psychology&pclimit=50&format=json | |||
Этот запрос возвращает список участников, редактировавших страницу "Psychology". | |||
== Пример кода извлечения == | |||
<syntaxhighlight lang="python" line> | |||
import requests | |||
url = "https://en.wikipedia.org/w/api.php" | |||
params = { | |||
"action": "query", | |||
"prop": "contributors", | |||
"titles": "Psychology", | |||
"pclimit": 50, | |||
"format": "json" | |||
} | |||
response = requests.get(url, params=params) | |||
data = response.json() | |||
print(data) | |||
</syntaxhighlight> | |||
'''Что делаем дальше:''' | |||
* извлекаем авторов | |||
* строим граф "автор–страница" | |||
* анализируем плотность взаимодействий | |||
== Граф совместного редактирования == | |||
[[Graph:Coauthorship_Psychology]] | |||
'''Что показывает граф:''' | |||
* узлы — авторы | |||
* связи — совместное редактирование | |||
* плотность графа отражает уровень коллективной работы | |||
== Pipeline анализа данных == | == Pipeline анализа данных == | ||
Версия от 21:35, 13 апреля 2026
| Описание датасета | Публикации российских психологов в Lens |
|---|---|
| Описание полей |
|
| Форматы данных | CSV |
| Область знаний | Информатика, Психология |
| Веб-сайт - ссылка на датасет | |
| Примеры использования датасета | |
| Год создания датасета | 2006 |
- Академия Наук - https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-acad-sci-psych.csv
- МГПУ https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgpu-psychol.csv
- МГУ https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgu-psychol.csv
Социосемантическая структура публикаций российских психологов (Lens)
Исследовательский вопрос
Как связаны социальные параметры научного производства (организации: МГУ, МГПУ, РАН) и семантические характеристики публикаций (тип статьи, открытый доступ, тематика) с уровнем цитируемости?
Гипотеза
Публикации в формате journal article и с открытым доступом (Open Access) имеют более высокую цитируемость, формируя устойчивые социосемантические паттерны.
Теоретическая рамка
Социосемантическая система науки включает:
- социальный уровень — авторы и организации
- семантический уровень — темы, типы публикаций
- механизм связи — цитирование
Цитирование выступает как ключевой механизм, связывающий производство знаний и их распространение.
---
Данные
Академия наук (цитируемость = 5)
| Название | Год | Цитирования
|
|---|---|---|
| Features of the Development of a Teenager's Subjectivity in Interaction with the Natural Environment in a Children's Educational and Health Camp | 2021 | 5 |
| Ретроспективный анализ посттравматического стресса в годы Великой Отечественной войны | 2021 | 5 |
| Воздействие алкоголя на сердечный ритм и оценку действий при решении моральных дилемм | 2017 | 5 |
| Study of Neurocognitive Processes in a Paradigm of Information Concealment | 2021 | 5 |
| Emotional Regulation in Individuals, Standing in Codependent Relationship | 2021 | 5 |
| Метод реляционно-ситуационного анализа текста в психологических исследованиях | 2020 | 5 |
МГУ (публикации = 2018 год, Цитирования = 5)
| Название | Год | Тип публикации | Цитирования
|
|---|---|---|---|
| К вопросу о нормативно-правовом регулировании организации деятельности психолого-медико-педагогических комиссий в контексте профилактики правонарушений несовершеннолетних | 2018 | journal article | 5 |
| Патохарактерологические особенности психически здоровых лиц, склонных к импульсивной агрессии | 2018 | journal article | 5 |
МГПУ (5 фильтров одновременно)
| Название | Год | Тип публикации | Open Access | Область | Цитирования
|
|---|---|---|---|---|---|
| Трансформация метафорических репрезентаций жизненного пути личности в период самоизоляции у взрослых | 2020 | journal article | true | Psychology | 3 |
| Prerequisites for Accepting the Digital Educational Environment in New Cultural and Historical Conditions | 2021 | journal article | true | Psychology | 4 |
| Психологические детерминанты возникновения внутриличностных противоречий студентов | 2020 | journal article | true | Psychology | 1 |
Возможности анализа
Используя параметр |filters= можно:
- отбирать публикации по годам
- сравнивать школы по цитируемости
- выделять только статьи (Publication Type=journal article)
- анализировать публикации в открытом доступе
- строить выборки для последующего анализа в R
Семантические запросы (SMW)
1. Датасеты по психологии
Результат: список психологических датасетов
2. Все BigDataWorks
Результат: все проекты с данными
3. После 2010 года
Результат: современные датасеты
4. Только CSV
Результат: данные для R
5. Междисциплинарные
Результат: пересечение областей
Анализ совместного редактирования (MediaWiki API)
Для анализа соавторства и совместного редактирования используется MediaWiki API.
Пример запроса:
Этот запрос возвращает список участников, редактировавших страницу "Psychology".
Пример кода извлечения
import requests
url = "https://en.wikipedia.org/w/api.php"
params = {
"action": "query",
"prop": "contributors",
"titles": "Psychology",
"pclimit": 50,
"format": "json"
}
response = requests.get(url, params=params)
data = response.json()
print(data)
Что делаем дальше:
- извлекаем авторов
- строим граф "автор–страница"
- анализируем плотность взаимодействий
Граф совместного редактирования
Что показывает граф:
- узлы — авторы
- связи — совместное редактирование
- плотность графа отражает уровень коллективной работы
Pipeline анализа данных

---
Метрики
Основной показатель:
[math]\displaystyle{ \bar{C} = \frac{1}{N} \sum_{i=1}^{N} C_i }[/math]
Дополнительно:
[math]\displaystyle{ OA = \frac{N_{open}}{N_{total}} }[/math]
---
Анализ в R
mgpu <- read.csv("lens_mgpu.csv")
mgu <- read.csv("lens_mgu.csv")
ras <- read.csv("lens_ras.csv")
mgpu_filtered <- subset(mgpu,
Publication.Year > 2018 &
Citing.Works.Count < 6 &
Publication.Type == "journal article"
)
mean(mgpu_filtered$Citing.Works.Count)
aggregate(Citing.Works.Count ~ Publication.Year, data=mgpu, mean)
hist(mgpu$Citing.Works.Count)
---
Социосемантическая модель

---
Агентная модель
---
Интерактивная модель
---
Урок с данными
Модель на этих данных
Те же данные, но после очистки в OpenRefine
- Author/s,
- Title,
- Publication Year,
- Lens ID,
- DOI,
- Citing Works Count
МГПУ
Академия наук
МГУ
---
Вывод
Анализ показал:
- цитируемость зависит от типа публикации
- journal articles формируют ядро научного поля
- Open Access увеличивает видимость исследований
Социальные параметры (организации) и семантические параметры (структура публикаций) совместно формируют социосемантическую систему науки.
Цитирование выступает ключевым механизмом связи между ними.
