Категория:Dataset

Материал из Поле цифровой дидактики
Версия от 21:49, 9 марта 2024; Patarakin (обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Эта категория использует форму Dataset. Категория, в которой собраны готовые датасеты и их описание.

Категория Dataset содержит 43 объектов

 Description
Astronauts (dataset)Датасет о полётах в космос. Исходник находится на сайте corgis https://corgis-edu.github.io/corgis
Billionaires (dataset)Перечень миллиардеров - имена, гражданство, возраст, компании 600px-Snap_Ages_Plots.jpg
Bills of Mortality (dataset)Датасет причин смертности в Лондоне в 17 - 18 веке. 1657 - 1758 - столетие. 7381 строка в таблице
Books (dataset)1000 самых популярных книг проекта Гутенберг - имя автора, дата публикации, дата рождения, смерти средняя длина предложений, сложность чтения и т.д.
  • 120px-Book_RG01.png
COVID (dataset 1)бесплатная статистика COVID-19 и новый API позволяют отправить веб-запрос в Smartable AI и получить подробную информацию о глобальных и региональных данных о коронавирусе, включая последние цифры, исторические значения и географические разбивки.
ChatbotACM (dataset)Датасет сформирован на основании запроса к цифровой библиотеке ACM – dl.acm.org. Поисковый запрос выглядит следующим образом: All: “chatbot” AND "school" AND "teaching" AND Publication Date: (2018 To 2023) Кластеры понятий:
600px-Chatbot_keys.png
Cities (dataset)Фрагмент из датасета, где хранилось более 140 000 записей о городах с населением более 1 000 жителей. В этом датасете 478 записей. Только городов с населением от 1 млн человек. Датасет используется в нескольких географических проектах в Kepler, App Inventor и других цифровых средствах
  • 120px-Kepler_cities.png
  • Collaborative knowledge ACM (dataset)Датасет сформирован на основании запроса к цифровой библиотеке ACM – dl.acm.org. Поисковый запрос выглядит следующим образом:
  • All: “collaborative knowledge” AND Publication Date: (2012 To 2022)
  • На исходный запрос мы наложили фильтр, ограничивающий формат статей только исследовательскими статьями, поскольку мы хотели получить подробное описание кейсов, в которых описывалась бы практика работы со знаниями в образовании. В ответ на такой запрос было получено 476 записей, которые составили коллекцию в системе Zotero и в формате RIS были загружены в систему VOS viewer для выявления и визуального представления сетевых отношений как между авторами, так и между ключевыми словами публикаций.
    Computational thinking (ACM)Датасет записей из библиотеки ACM по запросу Computational Thinking
    DetectiveStudio (dataset)Материалы на основе Scratch API
    Food (dataset)The following data comes from the United States Department of Agriculture’s Food Composition Database. It contains data for various types of food including the amounts of different vitamins and minerals found in the foods as well as macronutrient percentages. The food covered spans a large variety of foods from butter to Campbell’s soup. Much of the supplementary documenation for each field comes directly from that pages’ Wikipedia article.
    Forum (dataset)Датасет лог-файла форума по обсуждению книг (ранобэ)
    Games (biblio dataset)Для поиска использовали ключевые слова: ("computer games" OR "video games" OR "serious games" OR "simulation games" OR "games-based learning" OR mmog OR mmorpg OR mud OR "online games") AND ("computational thinking")
    GoogleSchool 01(dataset)Датасет собран из лог-файла действий учителей внутри школы
    GoogleSchool 02(dataset)Датасет собран из лог-файла действий учителей внутри школы в среде GoogleApps - совместные действия учителей над документами различного типа превращаются в социальный граф.
    Graduate (dataset)Данные по выпускникам - год, численность, данные по зарплатам, демография, работа по профессии, причины выбора
  • https://corgis-edu.github.io/corgis/datasets/csv/graduates/graduates.csv
  • Может быть использован в связке с RAWGraphs
    ICD 10Это датасет, в котором собраны коды и названия болезней по МКБ-10
    Invisible College Scopus (dataset)Запрос к библиографической базе данных Scopus был сформулирован так, чтобы получить все документы (статьи, книги, главы в книгах), связанные с темой формирования команд и темой командной науки, которые были бы написаны на английском языке за 20 лет (2001 – 2021) в области социальных наук или компьютерных наук

    ALL ( "Team Science" OR "Team Formation" OR "Team Assembly" OR "Invisible College" ) AND PUBYEAR > 2001 AND ( LIMIT-TO ( PUBSTAGE , "final" ) ) AND ( LIMIT-TO ( OA , "all" ) ) AND ( LIMIT-TO ( DOCTYPE , "ar" ) OR LIMIT-TO ( DOCTYPE , "ch" ) OR LIMIT-TO ( DOCTYPE , "bk" ) ) AND ( LIMIT-TO ( SUBJAREA , "SOCI" ) ) AND ( LIMIT-TO ( LANGUAGE , "English" ) ) AND ( LIMIT-TO ( SUBJAREA , "COMP" ) )

    В результате поиска по заданным критериям мы получили 205 документов.
    Letopisi 2006 (dataset)120px-Hist_2006_associatios.png Лог-файл действий участников проекта Letopisi в 2006 году
    Lobster (fish-dataset)Дата-сет миграции лобстеров - использовался для сравнений инструментов по работе с данными в образовательных целях
    On-line mastersДатасет по запросу об авторах, которые пишут на эти тему. В датасете первая 1000 записей
    PokemonDatasetPokemon with stats
    Preschool Digital Scopus120px-Co-ocurence-network.jpg

    1709 публикаций (стандартный набор полей Скопус) - Для выделения данных из базы Scopus использовалась следующая формула:

    • ALL (( preschool OR "primary school" ) AND ( "psychological" OR "pedagogical" ) AND ( computer OR internet OR digital ) ) AND PUBYEAR > 1999 AND ( LIMIT-TO ( ACCESSTYPE(OA) ) )
    Publishers (Dataset)This collection includes 54,000 titles spanning across several genres and types of publishing companies, practically every book on every Amazon bestseller list.
    School Scores (USA dataset)Датасет с https://corgis-edu.github.io/corgis/csv/school_scores/ - 98 полей и 577 строк
    Scopus Games (dataset)Датасет по публикациям о компьютерных играх, собранный в Scopus
    Video games (dataset)Видеоигры - готовый датасет с описанием видеоигр по массе параметров (38 столбцов) Видеоигры из https://corgis-edu.github.io/corgis/
    Библиосет: исполняемые публикацииПеречень научных публикаций, экспортированных из Dimensions по результатам поиска по ключевым словам "executable paper" с фильтром 2020-2023, являющихся исполняемой публикацией.
    Библиосет: контекст исполняемых публикацийПеречень научных публикаций, экспортированных из Dimensions по результатам поиска по ключевым словам "executable paper" с фильтром 2020-2023, содержащих описание контекста в котором упоминаются исполняемые публикации. https://drive.google.com/file/d/1z-rnslKP0Yd0hI42GNmZogLF3BXOIp2G/view?usp=share_link
    Библиосет: публикационная активность ВВГУ120px-Vl_sci_schools.png Данные о публикационной активности Владивостокского государственного университета https://vvsu.ru/ выгружены из Scopus в формате RIS.
    Библиосет: публикационная активность ДВФУДанные о публикационной активности Дальневосточного федерального университета https://www.dvfu.ru выгружены из Scopus в формате RIS с применением фильтра по годам 2021-2023. https://drive.google.com/file/d/1xTzqRntH-kAnp-miwOdMWiagXU4k2mvP/view?usp=share_link
    Библиосет: публикационная активность МГПУ120px-Collab_mgpu01.jpg
    • Данные о публикационной активности Московского городского университета https://www.mgpu.ru выгружены из Scopus в формате RIS.
    Библиосет: теория исполняемых публикацийПеречень научных публикаций, экспортированных из Dimensions по результатам поиска по ключевым словам "executable paper" с фильтром 2020-2023, где теоретически обосновываются и характеризуются исполняемые публикации или инструменты к ним. https://drive.google.com/file/d/1u6SNZwi7uhPql5IvvTtj16G2qFQpy3ds/view?usp=share_link
    Взаимное копирование МЭШ (датасет)При изучении записей действий над учебными сценариями в МЭШ из всей таблицы действий учителей над объектами-сценариями были выделены только действия взаимного копирования. В результате был выделен граф совместных копирований состоящий из 145 компонент. При этом узлы и связи распределены крайне неравномерно. Главный компонент содержит 1174 узлов и 17928 связей, а на остальные 144 компоненты приходится всего 378 узлов и 3421 связи.
    375px-Giant_copies.png
    Вовлеченность студентов Л2Датасет сформирован на основе запроса к WoS "engagementANDL2_students" в октябре 2021. https://app.vosviewer.com/?json=https%3A%2F%2Fdrive.google.com%2Fuc%3Fid%3D1ljcOmU8t9ip8wl-W9Mda4LuGGFwHrJZ2 Ссылка на визуализацию VOSviewer.
    Вовлеченность студентов при использовании LearningAppsДатасет создан на основе результатов опроса студентов ВВГУ по завершении обучения по курсу педагогики. Опрос проводился с помощью Гугл Форм. Из полученной базы удалены повторные ответы 2-х студентов в пользу второго варианта как более взвешенного. Названия групп и имена студентов заменены на номера по порядку. В наличии 66 ответов.
    Мотивация – как фактор управления профессиональным развитием педагогических работников общеобразовательной организацииДатасет о том, какие инструменты мотивации труда используются директорами общеобразовательных учреждений РФ.
    Периодическая системаДатасет с элементами периодической системы
    Сайты российских школВыявление цифровой трансформации на основании данных с сайтов школ
    Студия Collab Challenge (dataset)Это история совместной деятельности внутри Scratch студии Collab Challenge - https://scratch.mit.edu/studios/4789981/ - где в 2018 году собирались проекты на конкурс Collab Challenge. Данный датасет - возможность посмотреть деятельность сквозь призму данных Scratch API - 354 проекта
    • Collab_Challenge2018.png
    Цифровые инструменты учителейДатасет о том, какие цифровые инструменты используются учителями учителями для решения различных задач
  • + различные приёмы обработки и визуализации датасета
  • 120px-D_I_Treemap_Voronoy.png
  • Что делают в МЭШ учителя литературыЭто выборка про учителей литературы в МЭШ
    Что делают в МЭШ учителя математикиКак копируют учителя математики
     Description
    Astronauts (dataset)Датасет о полётах в космос. Исходник находится на сайте corgis https://corgis-edu.github.io/corgis
    Billionaires (dataset)Перечень миллиардеров - имена, гражданство, возраст, компании 600px-Snap_Ages_Plots.jpg
    Bills of Mortality (dataset)Датасет причин смертности в Лондоне в 17 - 18 веке. 1657 - 1758 - столетие. 7381 строка в таблице
    Books (dataset)1000 самых популярных книг проекта Гутенберг - имя автора, дата публикации, дата рождения, смерти средняя длина предложений, сложность чтения и т.д.
    • 120px-Book_RG01.png
    COVID (dataset 1)бесплатная статистика COVID-19 и новый API позволяют отправить веб-запрос в Smartable AI и получить подробную информацию о глобальных и региональных данных о коронавирусе, включая последние цифры, исторические значения и географические разбивки.
    ChatbotACM (dataset)Датасет сформирован на основании запроса к цифровой библиотеке ACM – dl.acm.org. Поисковый запрос выглядит следующим образом: All: “chatbot” AND "school" AND "teaching" AND Publication Date: (2018 To 2023) Кластеры понятий:
    600px-Chatbot_keys.png
    Cities (dataset)Фрагмент из датасета, где хранилось более 140 000 записей о городах с населением более 1 000 жителей. В этом датасете 478 записей. Только городов с населением от 1 млн человек. Датасет используется в нескольких географических проектах в Kepler, App Inventor и других цифровых средствах
  • 120px-Kepler_cities.png
  • Collaborative knowledge ACM (dataset)Датасет сформирован на основании запроса к цифровой библиотеке ACM – dl.acm.org. Поисковый запрос выглядит следующим образом:
  • All: “collaborative knowledge” AND Publication Date: (2012 To 2022)
  • На исходный запрос мы наложили фильтр, ограничивающий формат статей только исследовательскими статьями, поскольку мы хотели получить подробное описание кейсов, в которых описывалась бы практика работы со знаниями в образовании. В ответ на такой запрос было получено 476 записей, которые составили коллекцию в системе Zotero и в формате RIS были загружены в систему VOS viewer для выявления и визуального представления сетевых отношений как между авторами, так и между ключевыми словами публикаций.
    Computational thinking (ACM)Датасет записей из библиотеки ACM по запросу Computational Thinking
    DetectiveStudio (dataset)Материалы на основе Scratch API
    Food (dataset)The following data comes from the United States Department of Agriculture’s Food Composition Database. It contains data for various types of food including the amounts of different vitamins and minerals found in the foods as well as macronutrient percentages. The food covered spans a large variety of foods from butter to Campbell’s soup. Much of the supplementary documenation for each field comes directly from that pages’ Wikipedia article.
    Forum (dataset)Датасет лог-файла форума по обсуждению книг (ранобэ)
    Games (biblio dataset)Для поиска использовали ключевые слова: ("computer games" OR "video games" OR "serious games" OR "simulation games" OR "games-based learning" OR mmog OR mmorpg OR mud OR "online games") AND ("computational thinking")
    GoogleSchool 01(dataset)Датасет собран из лог-файла действий учителей внутри школы
    GoogleSchool 02(dataset)Датасет собран из лог-файла действий учителей внутри школы в среде GoogleApps - совместные действия учителей над документами различного типа превращаются в социальный граф.
    Graduate (dataset)Данные по выпускникам - год, численность, данные по зарплатам, демография, работа по профессии, причины выбора
  • https://corgis-edu.github.io/corgis/datasets/csv/graduates/graduates.csv
  • Может быть использован в связке с RAWGraphs
    ICD 10Это датасет, в котором собраны коды и названия болезней по МКБ-10
    Invisible College Scopus (dataset)Запрос к библиографической базе данных Scopus был сформулирован так, чтобы получить все документы (статьи, книги, главы в книгах), связанные с темой формирования команд и темой командной науки, которые были бы написаны на английском языке за 20 лет (2001 – 2021) в области социальных наук или компьютерных наук

    ALL ( "Team Science" OR "Team Formation" OR "Team Assembly" OR "Invisible College" ) AND PUBYEAR > 2001 AND ( LIMIT-TO ( PUBSTAGE , "final" ) ) AND ( LIMIT-TO ( OA , "all" ) ) AND ( LIMIT-TO ( DOCTYPE , "ar" ) OR LIMIT-TO ( DOCTYPE , "ch" ) OR LIMIT-TO ( DOCTYPE , "bk" ) ) AND ( LIMIT-TO ( SUBJAREA , "SOCI" ) ) AND ( LIMIT-TO ( LANGUAGE , "English" ) ) AND ( LIMIT-TO ( SUBJAREA , "COMP" ) )

    В результате поиска по заданным критериям мы получили 205 документов.
    Letopisi 2006 (dataset)120px-Hist_2006_associatios.png Лог-файл действий участников проекта Letopisi в 2006 году
    Lobster (fish-dataset)Дата-сет миграции лобстеров - использовался для сравнений инструментов по работе с данными в образовательных целях
    On-line mastersДатасет по запросу об авторах, которые пишут на эти тему. В датасете первая 1000 записей
    PokemonDatasetPokemon with stats
    Preschool Digital Scopus120px-Co-ocurence-network.jpg

    1709 публикаций (стандартный набор полей Скопус) - Для выделения данных из базы Scopus использовалась следующая формула:

    • ALL (( preschool OR "primary school" ) AND ( "psychological" OR "pedagogical" ) AND ( computer OR internet OR digital ) ) AND PUBYEAR > 1999 AND ( LIMIT-TO ( ACCESSTYPE(OA) ) )
    Publishers (Dataset)This collection includes 54,000 titles spanning across several genres and types of publishing companies, practically every book on every Amazon bestseller list.
    School Scores (USA dataset)Датасет с https://corgis-edu.github.io/corgis/csv/school_scores/ - 98 полей и 577 строк
    Scopus Games (dataset)Датасет по публикациям о компьютерных играх, собранный в Scopus
    Video games (dataset)Видеоигры - готовый датасет с описанием видеоигр по массе параметров (38 столбцов) Видеоигры из https://corgis-edu.github.io/corgis/
    Библиосет: исполняемые публикацииПеречень научных публикаций, экспортированных из Dimensions по результатам поиска по ключевым словам "executable paper" с фильтром 2020-2023, являющихся исполняемой публикацией.
    Библиосет: контекст исполняемых публикацийПеречень научных публикаций, экспортированных из Dimensions по результатам поиска по ключевым словам "executable paper" с фильтром 2020-2023, содержащих описание контекста в котором упоминаются исполняемые публикации. https://drive.google.com/file/d/1z-rnslKP0Yd0hI42GNmZogLF3BXOIp2G/view?usp=share_link
    Библиосет: публикационная активность ВВГУ120px-Vl_sci_schools.png Данные о публикационной активности Владивостокского государственного университета https://vvsu.ru/ выгружены из Scopus в формате RIS.
    Библиосет: публикационная активность ДВФУДанные о публикационной активности Дальневосточного федерального университета https://www.dvfu.ru выгружены из Scopus в формате RIS с применением фильтра по годам 2021-2023. https://drive.google.com/file/d/1xTzqRntH-kAnp-miwOdMWiagXU4k2mvP/view?usp=share_link
    Библиосет: публикационная активность МГПУ120px-Collab_mgpu01.jpg
    • Данные о публикационной активности Московского городского университета https://www.mgpu.ru выгружены из Scopus в формате RIS.
    Библиосет: теория исполняемых публикацийПеречень научных публикаций, экспортированных из Dimensions по результатам поиска по ключевым словам "executable paper" с фильтром 2020-2023, где теоретически обосновываются и характеризуются исполняемые публикации или инструменты к ним. https://drive.google.com/file/d/1u6SNZwi7uhPql5IvvTtj16G2qFQpy3ds/view?usp=share_link
    Взаимное копирование МЭШ (датасет)При изучении записей действий над учебными сценариями в МЭШ из всей таблицы действий учителей над объектами-сценариями были выделены только действия взаимного копирования. В результате был выделен граф совместных копирований состоящий из 145 компонент. При этом узлы и связи распределены крайне неравномерно. Главный компонент содержит 1174 узлов и 17928 связей, а на остальные 144 компоненты приходится всего 378 узлов и 3421 связи.
    375px-Giant_copies.png
    Вовлеченность студентов Л2Датасет сформирован на основе запроса к WoS "engagementANDL2_students" в октябре 2021. https://app.vosviewer.com/?json=https%3A%2F%2Fdrive.google.com%2Fuc%3Fid%3D1ljcOmU8t9ip8wl-W9Mda4LuGGFwHrJZ2 Ссылка на визуализацию VOSviewer.
    Вовлеченность студентов при использовании LearningAppsДатасет создан на основе результатов опроса студентов ВВГУ по завершении обучения по курсу педагогики. Опрос проводился с помощью Гугл Форм. Из полученной базы удалены повторные ответы 2-х студентов в пользу второго варианта как более взвешенного. Названия групп и имена студентов заменены на номера по порядку. В наличии 66 ответов.
    Мотивация – как фактор управления профессиональным развитием педагогических работников общеобразовательной организацииДатасет о том, какие инструменты мотивации труда используются директорами общеобразовательных учреждений РФ.
    Периодическая системаДатасет с элементами периодической системы
    Сайты российских школВыявление цифровой трансформации на основании данных с сайтов школ
    Студия Collab Challenge (dataset)Это история совместной деятельности внутри Scratch студии Collab Challenge - https://scratch.mit.edu/studios/4789981/ - где в 2018 году собирались проекты на конкурс Collab Challenge. Данный датасет - возможность посмотреть деятельность сквозь призму данных Scratch API - 354 проекта
    • Collab_Challenge2018.png
    Цифровые инструменты учителейДатасет о том, какие цифровые инструменты используются учителями учителями для решения различных задач
  • + различные приёмы обработки и визуализации датасета
  • 120px-D_I_Treemap_Voronoy.png
  • Что делают в МЭШ учителя литературыЭто выборка про учителей литературы в МЭШ
    Что делают в МЭШ учителя математикиКак копируют учителя математики

    Страницы в категории «Dataset»

    Показано 47 страниц из 47, находящихся в данной категории.