Взаимное копирование МЭШ (датасет): различия между версиями
Patarakin (обсуждение | вклад) Нет описания правки |
Patarakin (обсуждение | вклад) Нет описания правки |
||
| Строка 11: | Строка 11: | ||
|launch year=2022 | |launch year=2022 | ||
}} | }} | ||
; Описание | |||
Из базы данных были выделены все записи о действиях, которые совершают участники внутри репозитория учебных сценариев. В результате была создана таблица, включающая почти 40 миллионов действий. В результате отбора действий, которые совершают исключительно создатели сценариев, мы получили таблицу, которая содержит только 3 миллиона действий, которые совершили над сценариями 8,364 участников. | : Мы использовали методы сетевого анализа и данные электронного журнала репозитория Московской электронной школы. Метод построения социограмм на основе следов, которые участники совместной деятельности оставляют на различных цифровых объектах, был представлен в в статье о [[викиграмма|викиграммах]]. Этот же подход позднее использовались для визуализации отношений между учителями в различных системах построения знаний. Для обработки данных и построения графа в использовался язык [[R]] и пакеты [[tidyverse]], tidygraph. | ||
: Из базы данных были выделены все записи о действиях, которые совершают участники внутри репозитория учебных сценариев. В результате была создана таблица, включающая почти 40 миллионов действий. В результате отбора действий, которые совершают исключительно создатели сценариев, мы получили таблицу, которая содержит только 3 миллиона действий, которые совершили над сценариями 8,364 участников. | |||
Следующий важный этап состоял в переводе таблицы действий участников в граф отношений между участниками – создателями сценариев. Принципиальный момент выделения среди всех связей только тех, которые взаимны. Мы рассматриваем связи между участниками основанием для связи, только если такие связи взаимны. При этом мы исходим из того, что у человека может быть доступ в библиотеку, он может оценивать и использовать объекты-сценарии, созданные другими людьми, но пока он не создает собственных объектов между ним и другими авторами не могут возникать взаимные связи. А именно взаимные связи мы используем в качестве маркера принадлежности к одной команде. В МЭШ взаимная связь образуется в том случае, если учитель А скопировал сценарий урока, созданный учителем Б, а учитель Б скопировал сценарий урока, созданный учителем Б. После удаления из системы однонаправленных невзаимных связей в системе остается множество одиноких участников, которые не входят ни в какие группировки и могут быть удалены. | Следующий важный этап состоял в переводе таблицы действий участников в граф отношений между участниками – создателями сценариев. Принципиальный момент выделения среди всех связей только тех, которые взаимны. Мы рассматриваем связи между участниками основанием для связи, только если такие связи взаимны. При этом мы исходим из того, что у человека может быть доступ в библиотеку, он может оценивать и использовать объекты-сценарии, созданные другими людьми, но пока он не создает собственных объектов между ним и другими авторами не могут возникать взаимные связи. А именно взаимные связи мы используем в качестве маркера принадлежности к одной команде. В МЭШ взаимная связь образуется в том случае, если учитель А скопировал сценарий урока, созданный учителем Б, а учитель Б скопировал сценарий урока, созданный учителем Б. После удаления из системы однонаправленных невзаимных связей в системе остается множество одиноких участников, которые не входят ни в какие группировки и могут быть удалены. | ||
; Граф | |||
[[Граф]], в котором собраны все участники, взаимно копирующие учебные сценарии друг у друга описывается следующими параметрами: | [[Граф]], в котором собраны все участники, взаимно копирующие учебные сценарии друг у друга описывается следующими параметрами: | ||
| Строка 25: | Строка 22: | ||
# A directed multigraph with 145 components | # A directed multigraph with 145 components | ||
В этом направленном графе 1552 узла, объединенных между собой 21349 связями. Граф совместных копирований состоит из 145 компонент. При этом узлы и связи распределены крайне неравномерно. Главный компонент содержит 1174 узла и 17928 связей, а на остальные 144 компоненты приходится всего 378 узлов и 3421 связь | В этом направленном графе 1552 узла, объединенных между собой 21349 связями. Граф совместных копирований состоит из 145 компонент. При этом узлы и связи распределены крайне неравномерно. Главный компонент содержит 1174 узла и 17928 связей, а на остальные 144 компоненты приходится всего 378 узлов и 3421 связь. Визуализация графа получена применением следующих фильтров и слоев ([[R]]): | ||
<syntaxhighlight lang="r"> | <syntaxhighlight lang="r"> | ||
| Строка 42: | Строка 39: | ||
theme(legend.position = 'none') | theme(legend.position = 'none') | ||
</syntaxhighlight> | </syntaxhighlight> | ||
{{#widget:YouTube|id=lXuMyUrvMLc|start=5}} | {{#widget:YouTube|id=lXuMyUrvMLc|start=5}} | ||
; The story of the MES educational community, told using network analysis and agent-based modelling === | |||
: https://youtu.be/Az3S2m2fDvE | |||
{{#widget:YouTube|id=Az3S2m2fDvE|start=5}} | {{#widget:YouTube|id=Az3S2m2fDvE|start=5}} | ||
; Датасет в вики | |||
Пример, когда датасет фильтруется по предмету [[Биология]] | : Пример, когда датасет фильтруется по предмету [[Биология]] | ||
{{#get_web_data:url=http://www.uic.unn.ru/pustyn/data-sets/mesh/giant_recicrop_component.csv | {{#get_web_data:url=http://www.uic.unn.ru/pustyn/data-sets/mesh/giant_recicrop_component.csv | ||
| Строка 62: | Строка 54: | ||
|filters=subject=Биология | |filters=subject=Биология | ||
|data=from=from,to=to,subject=subject,date=date_of_action}} | |data=from=from,to=to,subject=subject,date=date_of_action}} | ||
{| class="wikitable" | {| class="wikitable" | ||
Версия от 13:35, 17 февраля 2023
| Описание датасета | При изучении записей действий над учебными сценариями в МЭШ из всей таблицы действий учителей над объектами-сценариями были выделены только действия взаимного копирования. В результате был выделен граф совместных копирований состоящий из 145 компонент. При этом узлы и связи распределены крайне неравномерно. Главный компонент содержит 1174 узлов и 17928 связей, а на остальные 144 компоненты приходится всего 378 узлов и 3421 связи. |
|---|---|
| Описание полей |
|
| Форматы данных | CSV |
| Область знаний | Математика, Педагогика, Психология, Управление |
| Веб-сайт - ссылка на датасет | http://www.uic.unn.ru/pustyn/data-sets/mesh/giant recicrop component.csv |
| Примеры использования датасета | Патаракин Е.Д., Буров В.В. “Незримый колледж” МЭШ // Вестник Мгпу. Серия: Информатика И Информатизация Образования. 2022. № 2 (60). 38-52 https://www.elibrary.ru/item.asp?id=49058657 |
| Год создания датасета | 2022 |
- Описание
- Мы использовали методы сетевого анализа и данные электронного журнала репозитория Московской электронной школы. Метод построения социограмм на основе следов, которые участники совместной деятельности оставляют на различных цифровых объектах, был представлен в в статье о викиграммах. Этот же подход позднее использовались для визуализации отношений между учителями в различных системах построения знаний. Для обработки данных и построения графа в использовался язык R и пакеты tidyverse, tidygraph.
- Из базы данных были выделены все записи о действиях, которые совершают участники внутри репозитория учебных сценариев. В результате была создана таблица, включающая почти 40 миллионов действий. В результате отбора действий, которые совершают исключительно создатели сценариев, мы получили таблицу, которая содержит только 3 миллиона действий, которые совершили над сценариями 8,364 участников.
Следующий важный этап состоял в переводе таблицы действий участников в граф отношений между участниками – создателями сценариев. Принципиальный момент выделения среди всех связей только тех, которые взаимны. Мы рассматриваем связи между участниками основанием для связи, только если такие связи взаимны. При этом мы исходим из того, что у человека может быть доступ в библиотеку, он может оценивать и использовать объекты-сценарии, созданные другими людьми, но пока он не создает собственных объектов между ним и другими авторами не могут возникать взаимные связи. А именно взаимные связи мы используем в качестве маркера принадлежности к одной команде. В МЭШ взаимная связь образуется в том случае, если учитель А скопировал сценарий урока, созданный учителем Б, а учитель Б скопировал сценарий урока, созданный учителем Б. После удаления из системы однонаправленных невзаимных связей в системе остается множество одиноких участников, которые не входят ни в какие группировки и могут быть удалены.
- Граф
Граф, в котором собраны все участники, взаимно копирующие учебные сценарии друг у друга описывается следующими параметрами:
- A tbl_graph: 1552 nodes and 21349 edges
- A directed multigraph with 145 components
В этом направленном графе 1552 узла, объединенных между собой 21349 связями. Граф совместных копирований состоит из 145 компонент. При этом узлы и связи распределены крайне неравномерно. Главный компонент содержит 1174 узла и 17928 связей, а на остальные 144 компоненты приходится всего 378 узлов и 3421 связь. Визуализация графа получена применением следующих фильтров и слоев (R):
rcgraphR %>%
activate(edges) %>%
filter(!edge_is_multiple()) %>%
convert(to_undirected) %>%
activate(nodes) %>%
mutate(c_betw = centrality_betweenness()) %>%
activate(edges) %>%
mutate(edge_between = centrality_edge_betweenness()) %>%
activate(nodes) %>%
ggraph(layout = 'stress') +
geom_node_point(aes(size = c_betw, colour = c_betw, shape = '21')) +
geom_edge_link0(aes( alpha = edge_between),edge_colour = "grey66") +
theme(legend.position = 'none')
- The story of the MES educational community, told using network analysis and agent-based modelling ===
- https://youtu.be/Az3S2m2fDvE
- Датасет в вики
- Пример, когда датасет фильтруется по предмету Биология
| Копирующий | Копируемый | Предмет | Время |
|---|---|---|---|
| 901 | 1106 | Биология | 2016-12-01T16:42:07Z |
| 1219 | 925 | Биология | 2016-12-23T06:50:48Z |
| 606 | 1280 | Биология | 2017-01-31T19:32:01Z |
| 1219 | 1211 | Биология | 2017-03-10T21:08:58Z |
| 925 | 1220 | Биология | 2017-03-19T20:20:40Z |
| 925 | 1219 | Биология | 2017-03-27T13:32:31Z |
| 1280 | 606 | Биология | 2017-04-27T07:19:09Z |
| 1280 | 1211 | Биология | 2017-04-28T13:33:52Z |
| 1220 | 925 | Биология | 2017-10-17T08:07:11Z |
| 1515 | 666 | Биология | 2017-12-11T18:57:57Z |
| 1247 | 666 | Биология | 2018-02-08T13:09:59Z |
| 1211 | 1280 | Биология | 2018-04-20T12:44:32Z |
| 345 | 257 | Биология | 2018-06-08T09:07:12Z |
| 1104 | 1218 | Биология | 2018-09-17T05:17:48Z |
| 1218 | 576 | Биология | 2018-10-11T18:32:55Z |
| 1074 | 1218 | Биология | 2018-10-17T08:16:39Z |
| 1218 | 744 | Биология | 2018-10-21T17:59:56Z |
| 1218 | 1074 | Биология | 2018-11-04T20:47:46Z |
| 1211 | 1219 | Биология | 2018-11-26T08:33:46Z |
| 576 | 1218 | Биология | 2018-12-13T09:57:52Z |
| 1218 | 768 | Биология | 2018-12-14T16:22:42Z |
| 253 | 593 | Биология | 2018-12-27T10:59:04Z |
| 253 | 592 | Биология | 2019-01-22T16:22:50Z |
| 1218 | 593 | Биология | 2019-03-01T20:32:06Z |
| 1218 | 1104 | Биология | 2019-03-04T19:50:26Z |
| 744 | 1218 | Биология | 2019-03-11T08:04:32Z |
| 1068 | 1020 | Биология | 2019-03-18T10:19:28Z |
| 768 | 1218 | Биология | 2019-03-20T19:50:54Z |
| 1021 | 1178 | Биология | 2019-03-21T19:16:12Z |
| 592 | 253 | Биология | 2019-03-30T16:07:57Z |
| 1055 | 1105 | Биология | 2019-05-21T17:55:08Z |
| 1060 | 1105 | Биология | 2019-05-21T17:57:21Z |
| 396 | 442 | Биология | 2019-09-15T12:46:50Z |
| 690 | 442 | Биология | 2019-09-17T11:30:52Z |
| 523 | 442 | Биология | 2019-09-19T06:14:10Z |
| 593 | 1218 | Биология | 2019-09-24T15:45:45Z |
| 190 | 86 | Биология | 2019-10-05T19:25:04Z |
| 566 | 564 | Биология | 2019-10-29T05:57:51Z |
| 593 | 253 | Биология | 2020-04-30T12:50:28Z |
| 183 | 779 | Биология | 2020-05-25T14:43:29Z |
| 745 | 779 | Биология | 2020-05-29T07:02:14Z |
| 615 | 616 | Биология | 2020-10-05T14:39:25Z |
| 358 | 568 | Биология | 2020-10-29T08:13:41Z |
