Обсуждение:Анализ и интерпретация данных (syllabus): различия между версиями
Patarakin (обсуждение | вклад) |
Patarakin (обсуждение | вклад) |
||
Строка 25: | Строка 25: | ||
; [[:Категория:Dataset]] | ; [[:Категория:Dataset]] | ||
* https://corgis-edu.github.io/corgis/ | * https://corgis-edu.github.io/corgis/ | ||
** https://corgis-edu.github.io/corgis/datasets/csv/billionaires/billionaires.csv | |||
== Цифровые средства == | == Цифровые средства == |
Версия 16:37, 14 мая 2024
Умения
{{#ask: [[~*data*]] [[Категория:Competence]] | format=ol }}
- Analyze age-appropriate data
- Demonstrate an understanding of what personal data is
- Demonstrate an understanding of what personal data is and how to keep it private and secure
- Evaluating whether a database contains appropriately current and pertinent information
- Explore or solve problems by selecting technology for data analysis
- Find or organize data and use technology to analyze and represent it to solve problems and make decisions
- Practice defining problems to solve by computing for data analysis, modeling or algorithmic thinking
- Protect privacy and security by ensuring that students and staff observe effective privacy and data management policies
- Select effective technology to represent data
- Sorting files, emails or database returns to clarify clusters of related information
Понятия
{{#ask: [[Категория:Понятие]] [[Field_of_knowledge::NetSci]] | ?Description }}
Description | |
---|---|
API | Интерфейс прикладного программирования application programming interface (API) - — описание способов взаимодействия одной компьютерной программы с другими. API (интерфейс прикладного программирования) упрощает процесс программирования при создании приложений, абстрагируя базовую реализацию и предоставляя только объекты или действия, необходимые разработчику. Если графический интерфейс для почтового клиента может предоставить пользователю кнопку, которая выполнит все шаги для выборки и выделения новых писем, то API для ввода/вывода файлов может дать разработчику функцию, которая копирует файл из одного места в другое, не требуя от разработчика понимания операций файловой системы. |
CORS | Cross-Origin Resource Sharing (CORS или “совместное использование ресурсов различными источниками”) — это контролируемый и применяемый в принудительном порядке клиентом (браузером) механизм обеспечения безопасности на основе HTTP. Он позволяет службе (API) указывать любой источник (origin), помимо себя, из которого клиент может запрашивать ресурсы. Он был разработан в соответствии с same-origin policy (SOP или “политика одинакового источника”), которая ограничивает взаимодействие сайта (HTML-документа или JS-скрипта), загруженного из одного источника, с ресурсом из другого источника. CORS используется для явного разрешения определенных cross-origin запросов и отклонения всех остальных. |
CSV | CSV (от англ. Comma-Separated Values — значения, разделённые запятыми) — текстовый формат, предназначенный для представления табличных данных. Строка таблицы соответствует строке текста, которая содержит одно или несколько полей, разделенных запятыми. |
Complex network analysis | Complex network analysis refers to the study of large networks that possess properties which could not be found otherwise in simple graphs. They generally represent bigger systems, like the networks of all web pages on the WWW. It has emerged as a new field comprising basics of graph theory, community detection and machine learning. These networks can be studied in static or dynamic arrangement, depending on the nature of the problem and the data available. Complex networks are of two basic types that are scale-free networks and random or small-world network. Scale-free networks are more loosely connected, having long tails and fewer paths between pairs of nodes. |
Flocking | Стая, образование стаи - процесс формирования коллективного поведения без каких-либо руководящих указаний в результате наблюдения за поведением товарищей по стае. |
GFF | GFF (англ. General Feature Format, GFF) — формат файлов, используемый для хранения разметки генов и других элементов последовательностей ДНК, РНК и белков. Используемое для такого типа файлов расширение обозначается как .GFF. |
GIS | Геоинформационная система (географическая информационная система, ГИС) — система сбора, хранения, анализа и графической визуализации пространственных (географических) данных и связанной с ними информации о необходимых объектах. Понятие геоинформационной системы также используется в более узком смысле — как инструмента (программного продукта), позволяющего пользователям искать, анализировать и редактировать как цифровую карту местности, так и дополнительную информацию об объектах |
HTTP | HTTP является основой обмена данными для Всемирной паутины. Это независимый от языка программирования протокол, предназначенный для обмена документами (также называемыми ресурсами) между приложениями через интернет. Протокол HTTP используется широким спектром приложений, наиболее известными из которых являются веб-браузеры. |
Inquiry based learning | Исследовательское обучение или обучение через открытия — педагогический подход, разработанный в 1960-х годах как ответ на традиционные формы обучения, в которых требовалось запоминания информации из учебных материалов. Философия «обучения через открытие» происходит из конструктивистских теорий обучения, таких, как работы Пиаже, Дьюи, Выготского и Паулу Фрейре |
MQTT | MQTT (Message Queue Telemetry Transport) – это основанный на стандартах протокол, или набор правил, обмена сообщениями, используемый для взаимодействия между компьютерами. Интеллектуальные датчики, носимые устройства и другие устройства Интернета вещей (IoT) обычно передают и получают данные по сетям с ограниченными ресурсами и пропускной способностью. Эти устройства IoT используют MQTT для передачи данных, поскольку он прост в реализации и может эффективно передавать данные IoT. MQTT поддерживает передачу сообщений от устройств в облако и в обратном направлении. |
ODD принципы | Протокол описания модели при её публикации: The Overview, Design concepts and Details (ODD) protocol for describing Individual- and Agent-Based Models (ABMs) is now widely accepted and used to document such models in journal articles.
Протокол ODD состоит из 21 элемента, которые разделены на три категории: «Обзор» (Overview), «Концепции проектирования» (Design concepts) и «Детали» (Details); отсюда и аббревиатура ODD. Каждая из этих категорий служит своей цели: дать обзор, объяснить, как использовались концепции дизайна, важные для модели, и объяснить все детали концепции модели. Принципы дизайна исследовательской многоагентной модели. 21 принцип разбит по группам. Например:
|
Team Assembly | Team Assembly - формирование команд. Ключевое понятие в области Team Science - как образуются команды |
URL | Унифицированный указатель ресурса (от англ. Uniform Resource Locator, сокр. URL — система унифицированных адресов электронных ресурсов, или единообразный определитель местонахождения ресурса. Используется как стандарт записи ссылок на объекты в Интернете (Гипертекстовые ссылки во «всемирной паутине» www). |
VOMAS | VOMAS (Virtual Overlay Multi-agent System) - подход к описанию многоагентных систем. В основе подхода лежит использование данных для проверки адекватности модели. |
Агентное моделирование | Агентное моделирование (agent-based model) (ABM)— метод имитационного моделирования, исследующий поведение децентрализованных агентов и то, как такое поведение определяет поведение всей системы в целом. В отличие от системной динамики аналитик определяет поведение агентов на индивидуальном уровне, а глобальное поведение возникает как результат деятельности множества агентов (моделирование «снизу вверх»). ABM представляют собой модели, в которых отдельные лица или агенты описываются как уникальные и автономные объекты, которые обычно взаимодействуют друг с другом и с окружающей их средой на местном уровне. Агентами могут быть организмы, люди, предприятия, учреждения и любые другие объекты, преследующие определенную цель. Когда мы даем агентам правила адаптации к изменениям в их среде и к тому, что делают другие агенты, тогда поведение каждого отдельного агента и, следовательно, поведение всей системы вытекает из этих правил, характеристик агентов и окружающей среды. Эмерджентность - это основная объясняющая концепция агентного моделирования. Эпштейн и Акстелл (1996) удачно описали этот вид объяснения своим знаменитым вопросом:
|
Акторно-сетевая теория | Ключевое положение теории состоит в том, что участники сетей — люди — рассматриваются наравне со всеми другими сущностями, включенными в сеть. Объектом изучения акторно-сетевой теории является сеть социальных взаимодействий, неотделимая от социальных акторов. Акторно-сетевая теория обосновывает равенство всех узлов сети тем, что без других сущностей человек не может существовать ни одного мгновения. Внутри акторно-сетевой теории люди не имеют никакого преимущества перед объектами или орудиями. Отношения между людьми, вещами, медиаторами, компьютерными программами полностью симметричны. Люди, орудия и объекты рассматриваются как равные узлы гибридной сети. |
Анализ социальных сетей/Ключевые понятия | Статья, в которой собраны ключевые понятия для анализа социальных сететей |
Аналитика мультимодальная | Направление учебной аналитики подчёркивает, что современные цифровые средства позволяют собирать данные сразу по нескольким каналам и такое многоканальное объединение данные позволяет глубже понимать динамику обучения. |
Аналитика учебная | Аналитика учебная. (Learning analytics) — измерение, сбор, анализ и представление данных об учениках и их действиях с целью понимания и оптимизации учебного процесса и той среды, где это этот процесс происходит. Набор методов, позволяющих учителям и ученикам лучше понимать происходящее в учебном процессе. |
Блог | Блог (web-log) это - пополняемая через веб-интерфейс коллекция записей. Согласно определению, которое дает SlashDot, «блог - это новый, личный способ эволюции электронного сообщества. Термин "Блог" - blog - происходит от Web-logging. Он может служить примером того, как люди используют сеть для построения своей собственной среды общения». Как правило, это личные записи, содержащие аннотированные ссылки на другие ресурсы, опубликованные в сети. С этой точки зрения первый блог создал сам Бернерс-Ли, когда публиковал новости о развитии проекта Всемирной Паутины. Первые блоги появились еще в 1996 году, но стали заметным и популярным феноменом начиная с 1999 года. |
Валидность | Вали́дность (англ. validity, фр. validité – годность (действительность, законность, весомость, обоснованность), от лат. validus – «сильный, здоровый, достойный») — обоснованность и пригодность применения методик и результатов исследования в конкретных условиях. Более прикладное определение понятия «валидность» — мера соответствия методик и результатов исследования поставленным задачам. Валидность считается фундаментальным понятием экспериментальной психологии, организационной психологии и психодиагностики. |
Веб-приложение | Веб-приложение — клиент-серверное приложение, в котором клиент взаимодействует с веб-сервером при помощи браузера. Одним из преимуществ такого подхода является тот факт, что клиенты не зависят от конкретной операционной системы пользователя, поэтому веб-приложения являются межплатформенными службами |
Веб-скрепинг | Веб-скрепинг, (от англ. web scraping) — технология получения веб-данных путем извлечения их со страниц веб-ресурсов вручную или автоматически. Чаще термин относится к автоматизированным процессам, реализованным с помощью кода, который выполняет запросы на целевой сайт. |
Викиграмма | Викиграмма – социограмма совместной деятельности - графическое изображение структуры связей между авторами и вики-статьями. Викиграмма статьи строится на основании истории редактирований страницы. |
Выращивание данных | Data-farming - данных в ходе изучения сложных и комплексных систем с огромным количеством агентов в искусственных сообществах многоагентного моделирования/ |
Вычислительная история | Вычислительная история - это междисциплинарная область, которая объединяет исторические исследования с методологиями компьютерных наук и цифровых гуманитарных наук для анализа, моделирования и визуализации исторических данных. Это относительно новая область, возникшая в ответ на растущую доступность цифровых ресурсов и растущий интерес к количественным подходам к историческим исследованиям. Истоки вычислительной истории можно проследить в 1940-х и 1950-х годах, когда историки начали использовать статистические методы и ранние компьютеры для анализа исторических данных. Одним из пионеров в этой области был французский историк Фернан Бродель https://ru.wikipedia.org/wiki/Бродель,_Фернан который использовал количественные методы для изучения средиземноморского мира в XVI веке. |
Вычислительное мышление | Объединение способностей человека и возможностей вычислительной техники. Способность усиливать свою деятельность, привлекая к себе на помощь программных агентов. Производные понятия - вычислительная наука, вычислительная история. |
Вычислительное участие | Понятие, которое вводит в своих работах Ж.Кафаи на основании понятия вычислительное мышление. В сетевой среде для успешного участия в субъектно-направленных взаимодействиях субъекту совместной деятельности необходимо уметь оценивать и обсуждать объекты, созданные другими субъектами совместной деятельности; принимать оценки и суждения других участников совместной деятельности; отслеживать действия других субъектов; классифицировать предметы, созданные другими субъектами совместной деятельности. Все эти умения свидетельствуют о социальной компетентности субъекта совместной сетевой деятельности. Ж. Кафаи использует термин «вычислительное участие» (Computational participation), подчеркивая что в сообществе Scratch «объекты для мышления» становятся «объектами для совместного использования». |
Генеративная социология | Изучаемый феномен выращивается в искусственном обществе |
Гигантская компонента | Гигантская компонента – в науке о сетях – это наиболее крупный компонент графа, представленного в рассматриваемой сетевой структуре. Существование сетевого компонента, как правило, связывают с «эффектом Матфея» или эффектом предпочтительного присоединения, суть которого в том, что узлы с большем числом связей притягивают новые узлы сильнее, чем узлы с малым числом связей. |
Гипотеза | Гипо́теза (др.-греч. ὑπόθεσις — «предположение; допущение», от ὑπό — «под; по причине; из-за» и θέσις — «место; положение; тезис») — предположение или догадка, утверждение, которое, в отличие от аксиом, постулатов, требует доказательства. Гипотеза считается научной, если она, в соответствии с научным методом, объясняет факты, охватываемые этой гипотезой; является логически непротиворечивой; принципиально опровергаема, то есть потенциально может быть проверена критическим экспериментом; не противоречит ранее установленным законам и, скорее всего, приложима к более широкому кругу явлений.
Карл Поппер в философии науки дополнил позитивистский принцип верифицируемости принципом фальсифицируемости. Соответствие реальности естественнонаучной теория может быть установлена путём постановки соответствующего эксперимента (верификация). Любое научное знание носит лишь относительный характер.
|
Гражданская наука | Гражданская наука (англ. Citizen science) — концепция проведения научных исследований с привлечением широкого круга добровольцев, многие из которых могут быть любителями |
Граф | Граф. В математической теории графов и информатике граф – это совокупность объектов со связями между ними. Объекты представляются как вершины или узлы графа, а связи – как дуги или рёбра. Для разных областей применения виды графов могут различаться направленностью, ограничениями на количество связей и дополнительными данными о вершинах или рёбрах. |
Граф знаний | Технология семантического поиска. Граф знаний объединяет большой объем общедоступной информации о различных сущностях и их признаках, свойствах и связях между этими сущностями. |
Датасет | Датасет - это обработанный и структурированный массив данных. |
Демографическая статистика | составная часть системы демографических наук, осуществляющих сбор, обработку, анализ и изложение данных, характеризующих численность, состав, размещение и движение населения стран, территорий или отдельных групп населения с применением статистических методов |
Дерево решений | Дерево решений — это тип направленного ациклического графа, который отображает решения и их последствия. Логика дерева решений наглядно представляется графом и понятна человеку. Алгоритм дерева решений - метод обучения с учителем. |
Диаграмма | Диагра́мма (др.-греч. Διάγραμμα (diagramma) — изображение, рисунок, чертёж) — графическое представление данных линейными отрезками или геометрическими фигурами, позволяющее быстро оценить соотношение нескольких величин. Представляет собой геометрическое символьное изображение информации с применением различных приёмов техники визуализации. |
Диаграмма связей | Диагра́мма свя́зей, известная также как интелле́кт-ка́рта, ассоциати́вная ка́рта, мента́льная ка́рта или ка́рта мыслей (англ. Mind map) — метод структуризации и визуализации концепций с использованием графической записи в виде диаграммы. Диаграмма связей реализуется в виде древовидной схемы, на которой изображены слова, идеи, задачи или другие понятия, связанные ветвями, отходящими от центрального понятия или идеи. Обычно создается вокруг одной концепции, нарисованной в виде изображения в центре пустой страницы, к которому добавляются связанные представления идей, такие как изображения, слова и части слов. Основные идеи напрямую связаны с центральной концепцией, а другие идеи являются ответвлениями от этих основных идей. |
Дружественное средство | Дружественное средство - Convivial Tool - предложено Илличем в книге Tools for Conviviality - средство, которое каждый человек может использовать так, как он этого хочет. |
Законное периферийное участие | Законное периферийное участие - процесс, характеризующий вступление новичков в деятельность сообщества |
Инструмент | Инструмент — любая установка, производящая визуальный продукт, который используется в исследовательских текстах. |
Интерактивный блокнот | Интерактивный блокнот — подход к построению пользовательского интерфейса интерактивной вычислительной среды, объединяющий в одном окне работу с кодом (в том числе редактор с подсветкой синтаксиса), исходными данными и результатом вычислений и сформированной графикой — в едином редактируемом документе, называемом блокнотом англ. notebook. |
Интернет вещей | Iot - сеть физических объектов, содержащих встроенную технологию, которая позволяет этим объектам измерять параметры собственного состояния или состояния окружающей среды, использовать и передавать эту информацию.
|
Исследовательский анализ данных | Разведочный анализ данных (англ. exploratory data analysis, EDA) — анализ основных свойств данных, нахождение в них общих закономерностей, распределений и аномалий, построение начальных моделей, зачастую с использованием инструментов визуализации. |
История | Исто́рия (от др.-греч. ἱστορία, букв. — «расспрашивание»; «сведения, которые были получены путём расспросов»), истори́ческая нау́ка — наука, научная (академическая) дисциплина, предметом изучения которой является человеческое прошлое; историческая наука использует исторические источники, включая различные нарративы, письменные документы, устные сообщения, материальные артефакты, лингвистические данные, а также экологические маркеры, для описания и исследования человеческого прошлого и причинно-следственных связей исторических событий и фактов, конкретные проявления и закономерности исторического процесса, развитие социума и любую человеческую деятельность. История — общий термин, описывающий как события прошлого, так и память о прошлом, нахождение, сбор и интерпретацию сведений об этих событиях. Период человеческого прошлого до изобретения письменности и начала письменной истории считается доисторическим периодом. |
Команда | Команды – объединения нескольких участников, работающих над общей задачей. Объединение участников происходит самопроизвольно и в современной цифровой среде поддерживается огромным разнообразием программного обеспечения, которое помогает им совместно редактировать тексты, тексты программ, ментальные карты, диаграммы, аудио и видео файлы. Общая деятельность предполагает наличие или формирование у участников общей экспертной позиции. |
Командная наука | Science of Team Science – наука о командных научных исследованиях. Эта область представляет одно из направлений гуманитарных вычислительных наук, цифровой и сетевой социологии. «Командная наука» исследует поведение людей в современных командах, сложных технологических средах, которые во многом определяют то, как протекает совместная работа и совместное обучение. |
Компьютерная игра | Компьютерная игра - игра, в которой соперником человека выступает компьютерная программа. Существуют многочисленные версии компьютерных игр, в которых за основу взята та или иная настольная игра. Для целого ряда сетевых сообществ игра является социальным объектов, вокруг которого организуется совместная деятельность. |
Конструкционизм | Конструкционизм - философия обучения, развитая Сеймуром Пейпертом на основании конструктивизма. К активной позиции конструктивизма конструкционизм добавляет идею того, что люди создают новое знание особенно эффективно, когда они вовлечены в создание продуктов, наделенных личностным смыслом, будь то песочные замки, Лего машины или компьютерные программы. |
… следующие результаты |
Книги и авторы
{{#ask: [[Категория:Book]] [[Field_of_knowledge::NetSci]] | ?Inventor | ?Description }}
- [[
- Категория:Book]
Inventor | Description | |
---|---|---|
APIs for social scientists: A collaborative review | В книге представлено множество API социальных сетей и основы их использования. В статье по этой книге собраны примеры API и особенности работы с ними. Код а книге - R | |
An Introduction to Agent-Based Modeling: Modeling Natural, Social, and Engineered Complex Systems with NetLogo | Wilensky Rand | Введение в моделирование систем при помощи языка NetLogo (от создателя языка) - использование NetLogo в естественно-научном, инженерном и общественном образовании |
As We May Think | Bush | «Как Мы Можем Мыслить» — визионерское эссе, написанное Бушем в 1945 году, предвидевшее многие аспекты информационного общества. Оно было впервые опубликовано в журнале The Atlantic в июле 1945 года и переиздано в сокращённом варианте в сентябре 1945 — до и после атомной бомбардировки Хиросимы и Нагасаки. Буш выражает свою обеспокоенность тем, что усилия науки направлены на разрушение, вместо понимания. Он выражает надежду на создание гипотетической гипертекстовой системы, названной Бушем «Мемекс». По мнению учёного, такая система сделала бы знания более доступными. Буш надеялся, что создание такой системы превратит информационный взрыв во взрыв знаний. |
Individual-Based Models of Cultural Evolution: A Step-by-Step Guide Using R | Acerbi | Книга показывает как создавать агентно-ориентированные модели или ABM культурной эволюции. В тексте книги используется код на языке программирования R. От очень простых моделей основных процессов культурной эволюции, таких как предвзятая передача и культурная мутация, к более сложным темам, таким как эволюция социального обучения, демографические эффекты и анализ социальных сетей. |
Interactive web-based data visualization with R, plotly, and shiny | Sievert | Книга по разработке приложений в веб среде на основе языка R + Plotly + Shiny It makes heavy use of plotly for rendering graphics, but you’ll also learn about other R packages that augment a data science workflow, such as the tidyverse and shiny |
Learn ggplot2 using Shiny App | Сетевая книга по освоению приемов работы с пакетом ggplot2 языка R в среде Shiny | |
Mastering Shiny: Build Interactive Apps, Reports, and Dashboards Powered by R | Wickham | Книга о создании аналитических веб-приложений на языке R в среде Shiny |
Modeling Social Behavior: Mathematical and Agent-Based Models of Social Dynamics and Cultural Evolution | Smaldino | Социальные, поведенческие и когнитивные науки исторически полагались на силу слова. Слова имеют силу. Богатые аналогии могут найти отклик в умах читателей и пролить свет на тайны природы. Я говорю о вербальных теориях, описательных объяснениях сложных явлений. Большинство теорий, вероятно, более точны, чем поэтичны, но они, как правило, опираются на свойство большинства языков, согласно которому фраз могут нести в себе несколько возможных импликатур — рассмотрим, например, такие слова, как «восприятие», «категория», «идентичность», «тождественность» обучение» и даже «реакция» достаточно двусмысленны, чтобы допускать множество интерпретаций. То есть язык по своей сути (и адаптивно) расплывчат и двусмыслен. В конечном счете, это проблема для ученых, потому что нам нужно предельно четко понимать, о чем мы говорим, чтобы выдвинуть полезные теории Вселенной. |
Outstanding User Interfaces with Shiny | Granjon | A book about deeply customizing Shiny app for production. |
R for Data Science | Wickham | Подробное руководство по использованию языка R для обработки, модификации, визуализации и программировании данных |
Sorting Things Out | Bowker, Star | Sorting Things Out - Classification and Its Consequences |
Tidy Modeling with R | Sigle | Руководство по созданию и использованию моделей при помощи пакетов из пространства tidyverse: recipes, parsnip, workflows, yardstick, and others. |
Turtles, termites, and traffic jams: explorations in massively parallel microworld | Resnick | Книга "Черепахи, термиты и дорожные пробки: исследования в микромире массово-параллельных вычислений" Децентрализованный подход к феноменам окружающего мира - на основе использования микромира с тысячами черепашек |
Мировой суперорганизм | Heylighen | Франсис Хейлиген Мировой Суперорганизм: эволюционно-кибернетическая модель возникновения сетевого сообщества |
Незримый колледж МЭШ | Patarakin | Статья, в которой понятие незримого колледжа применяется к сообществу учителей, сотрудничающих внутри репозитория московской электронной школы. |
Объекты и пространства | Ло | Использование объектов само создает пространственные условия возможности и невозможности. Пространственности порождаются и приводятся в действие расположенными в них объектами – именно этим определяются границы возможного. (Следуя первому утверждению, стоит упомянуть, что пространственные возможности по своему характеру также множественны.) Существуют различные формы пространственностей; те, о которых говорим мы, включают в себя регионы, сети и потоки. В-третьих, я предполагаю, что эти пространственности и объекты, которые заполняют и создают их, плохо совместимы, т.е. находятся в напряженных отношениях. |
Феномен науки: Кибернетический подход к эволюции | Турчин | В книге изложена концепция метасистемного перехода и с ее позиций прослеживает эволюцию мира от простейших одноклеточных организмов до возникновения мышления, развития науки и культуры. |
Датасеты
Цифровые средства