Психологические школы России (датасет): различия между версиями
Patarakin (обсуждение | вклад) |
Нет описания правки |
||
| Строка 41: | Строка 41: | ||
* МГУ https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgu-psychol.csv | * МГУ https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgu-psychol.csv | ||
= Социосемантическая структура публикаций российских психологов (Lens) = | |||
== Исследовательский вопрос == | |||
Как связаны '''социальные параметры научного производства''' (организации: МГУ, МГПУ, РАН) и '''семантические характеристики публикаций''' (тип статьи, открытый доступ, тематика) с уровнем цитируемости? | |||
== Гипотеза == | |||
Публикации в формате journal article и с открытым доступом (Open Access) имеют более высокую цитируемость, формируя устойчивые социосемантические паттерны. | |||
== Теоретическая рамка == | |||
Социосемантическая система науки включает: | |||
* социальный уровень — авторы и организации | |||
* семантический уровень — темы, типы публикаций | |||
* механизм связи — цитирование | |||
Цитирование выступает как ключевой механизм, связывающий производство знаний и их распространение. | |||
--- | |||
== Данные == | == Данные == | ||
| Строка 144: | Строка 163: | ||
* анализировать публикации в открытом доступе | * анализировать публикации в открытом доступе | ||
* строить выборки для последующего анализа в R | * строить выборки для последующего анализа в R | ||
== Pipeline анализа данных == | |||
<uml> | |||
@startuml | |||
skinparam backgroundColor #FAFAFA | |||
title Pipeline исследования | |||
rectangle "Lens (сырые данные)" as A | |||
rectangle "OpenRefine\n(очистка)" as B | |||
rectangle "External Data\n(фильтрация)" as C | |||
rectangle "Агрегация\n(MapReduce)" as D | |||
rectangle "Анализ (R)" as E | |||
rectangle "Wiki (визуализация)" as F | |||
A --> B | |||
B --> C | |||
C --> D | |||
D --> E | |||
E --> F | |||
@enduml | |||
</uml> | |||
--- | |||
== Метрики == | |||
Основной показатель: | |||
<math> | |||
\bar{C} = \frac{1}{N} \sum_{i=1}^{N} C_i | |||
</math> | |||
Дополнительно: | |||
<math> | |||
OA = \frac{N_{open}}{N_{total}} | |||
</math> | |||
--- | |||
== Анализ в R == | |||
<syntaxhighlight lang="r" line> | |||
mgpu <- read.csv("lens_mgpu.csv") | |||
mgu <- read.csv("lens_mgu.csv") | |||
ras <- read.csv("lens_ras.csv") | |||
mgpu_filtered <- subset(mgpu, | |||
Publication.Year > 2018 & | |||
Citing.Works.Count < 6 & | |||
Publication.Type == "journal article" | |||
) | |||
mean(mgpu_filtered$Citing.Works.Count) | |||
aggregate(Citing.Works.Count ~ Publication.Year, data=mgpu, mean) | |||
hist(mgpu$Citing.Works.Count) | |||
</syntaxhighlight> | |||
--- | |||
== Социосемантическая модель == | |||
<uml> | |||
@startuml | |||
skinparam backgroundColor #FAFAFA | |||
actor "Автор" as A | |||
rectangle "Публикация" as P | |||
rectangle "Тематика" as T | |||
rectangle "Научное поле" as F | |||
A --> P | |||
P --> T | |||
P --> F | |||
P --> P : цитирует | |||
@enduml | |||
</uml> | |||
--- | |||
== Агентная модель == | |||
<netlogo> | |||
to setup | |||
clear-all | |||
create-turtles 100 [ | |||
setxy random-xcor random-ycor | |||
] | |||
end | |||
to go | |||
ask turtles [ | |||
rt random 360 | |||
fd 1 | |||
] | |||
end | |||
</netlogo> | |||
--- | |||
== Интерактивная модель == | |||
<scratch project="211029567" /> | |||
--- | |||
== Урок с данными == | == Урок с данными == | ||
| Строка 172: | Строка 300: | ||
=== МГУ === | === МГУ === | ||
* https://raw.githubusercontent.com/patarakin/stat-data/b9bea4cf7b9e7a78cc462346e073b18fb0745b59/datasets/csv/lens_mgu.csv | * https://raw.githubusercontent.com/patarakin/stat-data/b9bea4cf7b9e7a78cc462346e073b18fb0745b59/datasets/csv/lens_mgu.csv | ||
--- | |||
== Вывод == | |||
Анализ показал: | |||
* цитируемость зависит от типа публикации | |||
* journal articles формируют ядро научного поля | |||
* Open Access увеличивает видимость исследований | |||
Социальные параметры (организации) и семантические параметры (структура публикаций) совместно формируют социосемантическую систему науки. | |||
Цитирование выступает ключевым механизмом связи между ними. | |||
Версия от 21:15, 13 апреля 2026
| Описание датасета | Публикации российских психологов в Lens |
|---|---|
| Описание полей |
|
| Форматы данных | CSV |
| Область знаний | Информатика, Психология |
| Веб-сайт - ссылка на датасет | |
| Примеры использования датасета | |
| Год создания датасета | 2006 |
- Академия Наук - https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-acad-sci-psych.csv
- МГПУ https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgpu-psychol.csv
- МГУ https://raw.githubusercontent.com/patarakin/stat-data/refs/heads/main/datasets/csv/lens-mgu-psychol.csv
Социосемантическая структура публикаций российских психологов (Lens)
Исследовательский вопрос
Как связаны социальные параметры научного производства (организации: МГУ, МГПУ, РАН) и семантические характеристики публикаций (тип статьи, открытый доступ, тематика) с уровнем цитируемости?
Гипотеза
Публикации в формате journal article и с открытым доступом (Open Access) имеют более высокую цитируемость, формируя устойчивые социосемантические паттерны.
Теоретическая рамка
Социосемантическая система науки включает:
- социальный уровень — авторы и организации
- семантический уровень — темы, типы публикаций
- механизм связи — цитирование
Цитирование выступает как ключевой механизм, связывающий производство знаний и их распространение.
---
Данные
Академия наук (цитируемость = 5)
| Название | Год | Цитирования
|
|---|---|---|
| Features of the Development of a Teenager's Subjectivity in Interaction with the Natural Environment in a Children's Educational and Health Camp | 2021 | 5 |
| Ретроспективный анализ посттравматического стресса в годы Великой Отечественной войны | 2021 | 5 |
| Воздействие алкоголя на сердечный ритм и оценку действий при решении моральных дилемм | 2017 | 5 |
| Study of Neurocognitive Processes in a Paradigm of Information Concealment | 2021 | 5 |
| Emotional Regulation in Individuals, Standing in Codependent Relationship | 2021 | 5 |
| Метод реляционно-ситуационного анализа текста в психологических исследованиях | 2020 | 5 |
МГУ (публикации = 2018 год, Цитирования = 5)
| Название | Год | Тип публикации | Цитирования
|
|---|---|---|---|
| К вопросу о нормативно-правовом регулировании организации деятельности психолого-медико-педагогических комиссий в контексте профилактики правонарушений несовершеннолетних | 2018 | journal article | 5 |
| Патохарактерологические особенности психически здоровых лиц, склонных к импульсивной агрессии | 2018 | journal article | 5 |
МГПУ (5 фильтров одновременно)
| Название | Год | Тип публикации | Open Access | Область | Цитирования
|
|---|---|---|---|---|---|
| Трансформация метафорических репрезентаций жизненного пути личности в период самоизоляции у взрослых | 2020 | journal article | true | Psychology | 3 |
| Prerequisites for Accepting the Digital Educational Environment in New Cultural and Historical Conditions | 2021 | journal article | true | Psychology | 4 |
| Психологические детерминанты возникновения внутриличностных противоречий студентов | 2020 | journal article | true | Psychology | 1 |
Возможности анализа
Используя параметр |filters= можно:
- отбирать публикации по годам
- сравнивать школы по цитируемости
- выделять только статьи (Publication Type=journal article)
- анализировать публикации в открытом доступе
- строить выборки для последующего анализа в R
Pipeline анализа данных

---
Метрики
Основной показатель:
[math]\displaystyle{ \bar{C} = \frac{1}{N} \sum_{i=1}^{N} C_i }[/math]
Дополнительно:
[math]\displaystyle{ OA = \frac{N_{open}}{N_{total}} }[/math]
---
Анализ в R
mgpu <- read.csv("lens_mgpu.csv")
mgu <- read.csv("lens_mgu.csv")
ras <- read.csv("lens_ras.csv")
mgpu_filtered <- subset(mgpu,
Publication.Year > 2018 &
Citing.Works.Count < 6 &
Publication.Type == "journal article"
)
mean(mgpu_filtered$Citing.Works.Count)
aggregate(Citing.Works.Count ~ Publication.Year, data=mgpu, mean)
hist(mgpu$Citing.Works.Count)
---
Социосемантическая модель

---
Агентная модель
---
Интерактивная модель
---
Урок с данными
Модель на этих данных
Те же данные, но после очистки в OpenRefine
- Author/s,
- Title,
- Publication Year,
- Lens ID,
- DOI,
- Citing Works Count
МГПУ
Академия наук
МГУ
---
Вывод
Анализ показал:
- цитируемость зависит от типа публикации
- journal articles формируют ядро научного поля
- Open Access увеличивает видимость исследований
Социальные параметры (организации) и семантические параметры (структура публикаций) совместно формируют социосемантическую систему науки.
Цитирование выступает ключевым механизмом связи между ними.
