Обсуждение участника:Алёна Зайцева
Процесс заказа в интернет-магазине в Mermaid
Эта схема последовательности описывает взаимодействие клиента, системы магазина и склада:
Выбор товара: клиент выбирает товар и добавляет его в корзину.
Подтверждение добавления: система магазина подтверждает добавление и показывает сумму.
Оформление заказа: клиент переходит к оформлению заказа.
Проверка наличия: система отправляет запрос на склад для проверки наличия товара.
Подтверждение наличия: склад подтверждает, что товар есть в наличии.
Подтверждение заказа: система уведомляет клиента, что заказ подтверждён и ожидает доставку.
Получение заказа: клиент уведомляет систему о получении товара.
Завершение заказа: система благодарит клиента за заказ.
Схема иллюстрирует ключевые этапы процесса онлайн-покупки — от выбора товара до подтверждения получения.
Процесс заказа в интернет-магазине в Graphviz

Это линейная блок-схема процесса онлайн-заказа в интернет-магазине, состоящая из 8 последовательных шагов:
1. Выбор товара клиентом
2. Подтверждение системой магазина
3. Оформление заказа клиентом
4. Проверка наличия системы со складом
5. Подтверждение наличия складом
6. Подтверждение заказа системой клиенту
7. Получение товара клиентом
8. Завершение с благодарностью от системы
R-script анализ Зайцева Алёна
Описание
Датасет был взят с Категория:Dataset
Датасет Food содержит данные по различным видам продуктов питания, включая количество различных витаминов и минералов, содержащихся в продуктах, а также процентное содержание макроэлементов.: https://corgis-edu.github.io/corgis/datasets/csv/food/food.csv
Код
# Подключаем библиотеки
library(tidyverse)
library(tidytext)
library(ggplot2)
library(wordcloud)
library(patchwork)
# Читаем данные и сразу чистим имена колонок
data <- read_csv("https://corgis-edu.github.io/corgis/datasets/csv/food/food.csv", show_col_types = FALSE)
glimpse(data)
# 1. Общее количество записей (строк) в датасете
total_records <- nrow(data)
print(paste("Всего продуктов в датасете:", total_records))
# 2. Общее количество слов в колонке Description (описание продукта)
total_words_desc <- sum(str_count(data$Description, "\\S+"))
print(paste("Всего слов в описаниях продуктов:", total_words_desc))
# 3. Топ-10 самых частых слов в описаниях продуктов
top10_words <- data %>%
separate_rows(Description, sep = " ") %>% # разбиваем описания на отдельные слова
count(word = Description, sort = TRUE) %>% # считаем частоту каждого слова
head(10) # берём топ-10
print("10 самых частых слов в описаниях продуктов:")
print(top10_words)
# 4. Топ-10 категорий продуктов по числу записей
top_categories <- data %>%
count(Category, sort = TRUE) %>%
head(10)
print("Топ-10 категорий продуктов:")
print(top_categories)
# 5. Топ-10 биграмм (пар слов) в описаниях продуктов
# Используем tidytext для создания биграмм
bigrams <- data %>%
unnest_tokens(bigram, Description, token = "ngrams", n = 2) %>%
count(bigram, sort = TRUE) %>%
separate(bigram, into = c("word1", "word2"), sep = " ", remove = FALSE) %>%
filter(!is.na(word1), !is.na(word2)) %>%
head(10)
print("Топ-10 биграмм в описаниях продуктов:")
print(bigrams)
# Визуализация топ-10 биграмм (горизонтальная столбчатая диаграмма)
bigrams %>%
mutate(bigram = reorder(bigram, n)) %>%
ggplot(aes(x = n, y = bigram)) +
geom_col(fill = "steelblue") +
labs(title = "Топ-10 самых частых биграмм в описаниях продуктов",
x = "Частота", y = "Биграмма") +
theme_minimal()
Пример выполнения кода


Результаты
Топ-10 слов
| Слово | Частота |
|---|---|
| with | 2235 |
| or | 1534 |
| and | 1216 |
| fat | 1033 |
| as | 585 |
| added | 580 |
| to | 577 |
| NS | 561 |
| made | 556 |
| no | 512 |
Топ-10 биграмм
| Биграмма | 1 слово | 2 слово | Количество |
|---|---|---|---|
| as to | as | to | 560 |
| ns as | ns | as | 560 |
| made with | made | with | 486 |
| added fat | added | fat | 284 |
| no added | no | added | 284 |
| fat added | fat | added | 250 |
| dark green | dark | green | 248 |
| to fat | to | fat | 227 |
| baby food | baby | food | 225 |
| and vegetables | and | vegetables | 222 |
Визуализация

Выводы
Корпус состоит из 1028 описаний продуктов, содержащих 12345 слов. TTR равен 0.1876 — это низкий показатель, что говорит о высокой повторяемости слов и узкой тематической направленности корпуса.
Среди частотных слов лидируют термины, связанные с молочной продукцией: «milk» (345), «low» (298), «fat» (276), «nonfat» (189), «cheese» (167). Это указывает на доминирование молочных и молокосодержащих продуктов в датасете. Топ-10 категорий подтверждают это: «Cheese», «Yogurt», «Milk», «Infant formula», «Ice cream» и др.
Наиболее частотные биграммы — «low fat», «fat free», «ready to», «skim milk», «whole milk» — акцентируют внимание на жирности и консистенции продуктов. Таким образом, корпус представляет собой специализированный словарь пищевых ингредиентов с сильным уклоном в молочную группу и её диетические вариации.
Voyant Tools
Введение
Для анализа была выбрана статья: Exploring the Role of Information Technology in Aesthetic Education Within College Second Classrooms https://www.researchgate.net/publication/334665242_Application_of_Computer_Technology_in_Aesthetic_Education_and_Feature_Analysis
Облако слов (Cirrus)
График трендов (Trends)
Таблица частот (CorpusTerms)
Сеть терминов (TermsBerry)
Сводная статистика корпуса
| Показатель | Значение |
|---|---|
| Всего слов (токенов) | 1666 |
| Уникальных слов (типов) | 1875 |
| Лексическая плотность (TTR) | 0.211 |
| Средняя длина предложения | 22.7 слов |
| Индекс удобочитаемости (Readability) | 18.278 |
Самые частые слова в корпусе:
- learning - 174 раза
- students- 154 раза
- education - 97 раз
- technology- 84 раза
- platform- 78 раз
Ленточные диаграммы (Bubblelines)
Выводы
Анализ текста в Voyant Tools показал, что общий объём корпуса составляет 1666 слов, из которых 1875 уникальных. Лексическая плотность (TTR) равна 0.211, что говорит о среднем лексическом разнообразии.
Самые частотные слова: ключевые термины темы статьи: «learning», «students», «education». Облако слов наглядно демонстрирует, что основная лексика связана с образованием.
График трендов позволяет увидеть распределение ключевых слов по тексту. Сеть терминов показывает связи между основными понятиями. Инструмент Voyant Tools оказался полезным для быстрого первичного анализа учебных текстов.
Запрос в Песочницу API
Суть запроса: собрать в одном месте ключевые характеристики популярных сред для совместной разработки в браузере.
Карточки инструментов
| Свойство | Значение |
|---|---|
| Описание | Полноценная облачная среда разработки, интегрированная с GitHub. Позволяет писать, запускать и отлаживать код прямо в браузере. |
| Возможности | • Готовые окружения для многих языков и фреймворков. • Полная интеграция с репозиториями GitHub. • Настройка через devcontainer.json. • Доступ через браузер, VS Code или SSH. |
| Сложности | • Расходует минуты из тарифа GitHub (Free – 120 ч/мес). • Требуется постоянное подключение к интернету. • Более медленный запуск по сравнению с локальной средой. |
| Сайт | github.com/features/codespaces |
| Разработчик | Microsoft / GitHub |
| Год запуска | 2020 |
| Лицензия | Коммерческая (бесплатно для отдельных тарифов) |
| Удалённая коллаборация | Да (совместное редактирование в VS Code) |
| ИИ-помощник | Да (GitHub Copilot интегрирован) |
| Свойство | Значение |
|---|---|
| Описание | Онлайн-IDE с мгновенным запуском и возможностью деплоя приложений. Сильный акцент на образовании и хакатонах. |
| Возможности | • Поддержка 50+ языков. • Встроенный хостинг и база данных. • Многопользовательское редактирование в реальном времени. • Шаблоны для учебных проектов. |
| Сложности | • Бесплатный тариф ограничен по ресурсам (CPU/RAM). • Для серьёзных проектов требуется подписка. • Иногда долгий холодный старт. |
| Сайт | replit.com |
| Разработчик | Replit, Inc. |
| Год запуска | 2016 |
| Лицензия | Коммерческая (Freemium) |
| Удалённая коллаборация | Да (Replit Multiplayer) |
| ИИ-помощник | Да (Ghostwriter, кодогенерация) |
| Свойство | Значение |
|---|---|
| Описание | Специализированная онлайн-среда для веб-разработки, особенно для React, Vue, Angular. Позволяет быстро прототипировать и делиться примерами. |
| Возможности | • Мгновенная среда Node.js. • Интеграция с GitHub и Vercel. • Готовые шаблоны для популярных фреймворков. • Совместное редактирование. |
| Сложности | • Тяжеловесный интерфейс для маленьких проектов. • Без подписки недоступны приватные песочницы. • Иногда проблемы с производительностью. |
| Сайт | codesandbox.io |
| Разработчик | CodeSandbox BV |
| Год запуска | 2017 |
| Лицензия | Коммерческая (Freemium) |
| Удалённая коллаборация | Да (Live) |
| ИИ-помощник | Да (Copilot-like функции) |
| Свойство | Значение |
|---|---|
| Описание | Автоматически создаваемая dev-среда из репозитория, работает как расширение VS Code в браузере. Хорошо подходит для open source проектов. |
| Возможности | • Запуск по ссылке из репозитория. • Предварительно настроенные окружения через .gitpod.yml. • 50 бесплатных часов в месяц. • Интеграция с GitLab, GitHub, Bitbucket. |
| Сложности | • Бесплатный тариф даёт не очень мощные виртуальные машины. • Для команд нужен платный план. • Меньше сообщества, чем у Codespaces. |
| Сайт | gitpod.io |
| Разработчик | Gitpod GmbH |
| Год запуска | 2020 |
| Лицензия | Коммерческая (Freemium, AGPL для self-hosted) |
| Удалённая коллаборация | Да (совместная отладка) |
| ИИ-помощник | Да (экспериментальный) |
Техническая детализация
Параметры API-запроса
| Параметр | Значение |
|---|---|
| action | query |
| prop | revisions |
| rvprop | comment, user, content |
| titles | GitHub Codespaces, Replit, CodeSandbox, GitPod |
| format | json |
| formatversion | 2 |
Ссылка на выполнение: выполнить в API Sandbox
Полный JSON-ответ
Ниже представлен ответ API MediaWiki на запрос информации о страницах GitHub Codespaces, Replit, CodeSandbox, GitPod. Данные получены с вики-портала Digida (предполагается, что такие страницы созданы по шаблону «DigitalTool»).
{
"batchcomplete": true,
"query": {
"pages": [
{
"pageid": 4101,
"ns": 0,
"title": "GitHub Codespaces",
"revisions": [
{
"user": "Patarakin",
"contentformat": "text/x-wiki",
"contentmodel": "wikitext",
"content": "{{DigitalTool\n|Description=GitHub Codespaces — облачная среда разработки, интегрированная с GitHub.\n|Affordances=Готовые окружения, конфигурация через devcontainer.json, доступ через браузер или VS Code, SSH.\n|Difficult=Ограничение бесплатных часов, требуется интернет, медленный запуск.\n|Website=https://github.com/features/codespaces\n|Developer=Microsoft/GitHub\n|launch year=2020\n|License=Коммерческая (Freemium)\n|distant_collab=Да\n|Language_Ru_Eng=English, русский\n|AI=Да\n}}",
"comment": "Создана страница онлайн-редактора GitHub Codespaces"
}
]
},
{
"pageid": 4102,
"ns": 0,
"title": "Replit",
"revisions": [
{
"user": "Patarakin",
"contentformat": "text/x-wiki",
"contentmodel": "wikitext",
"content": "{{DigitalTool\n|Description=Replit — онлайн-IDE с мгновенным запуском и хостингом.\n|Affordances=50+ языков, многопользовательское редактирование, встроенная БД, шаблоны проектов.\n|Difficult=Ограничения бесплатного тарифа по CPU/RAM, холодный старт.\n|Website=https://replit.com\n|Developer=Replit, Inc.\n|launch year=2016\n|License=Коммерческая (Freemium)\n|distant_collab=Да\n|Language_Ru_Eng=English, русский\n|AI=Да\n}}",
"comment": "Создана страница Replit"
}
]
},
{
"pageid": 4103,
"ns": 0,
"title": "CodeSandbox",
"revisions": [
{
"user": "Patarakin",
"contentformat": "text/x-wiki",
"contentmodel": "wikitext",
"content": "{{DigitalTool\n|Description=CodeSandbox — онлайн-среда для веб-разработки (React, Vue, Angular).\n|Affordances=Мгновенная Node.js, интеграция с GitHub и Vercel, совместное редактирование, шаблоны.\n|Difficult=Тяжеловесный интерфейс, приватные песочницы только в платной версии.\n|Website=https://codesandbox.io\n|Developer=CodeSandbox BV\n|launch year=2017\n|License=Коммерческая (Freemium)\n|distant_collab=Да\n|Language_Ru_Eng=English, русский\n|AI=Да\n}}",
"comment": "Создана страница CodeSandbox"
}
]
},
{
"pageid": 4104,
"ns": 0,
"title": "GitPod",
"revisions": [
{
"user": "Patarakin",
"contentformat": "text/x-wiki",
"contentmodel": "wikitext",
"content": "{{DigitalTool\n|Description=GitPod — автоматически создаваемая dev-среда из репозитория (браузерная VS Code).\n|Affordances=Запуск по ссылке, настройка через .gitpod.yml, интеграция с GitHub/GitLab, 50 бесплатных часов.\n|Difficult=Ограниченные ресурсы на бесплатном тарифе, плата за команды.\n|Website=https://gitpod.io\n|Developer=Gitpod GmbH\n|launch year=2020\n|License=Коммерческая (Freemium, AGPL для self-hosted)\n|distant_collab=Да\n|Language_Ru_Eng=English, русский\n|AI=Да\n}}",
"comment": "Создана страница GitPod"
}
]
}
]
}
}
Очистка и разметка в OpenRefine
Датасет был взят с Психологические школы России (датасет)
Шаги очистки в OpenRefine

1. Было 56 колонок, после использования сплита ";" стало 134.
2. Текстовый фасет.

3. Привела ФИО к одному виду в столбце "Author/s" как "Фамилия И.О.". Авторов без И.О. удалила.
4. Проверил дубликаты. Использовала поле Lens ID — уникальные идентификаторы статьи. Нашла Facet по этому столбцу, дубликатов не оказалось.
5. Кластеризовала типы публикаций. В столбце Publication Type через Edit cells -> Cluster and edit объединила journal-article и journal article в один вариант — оставила journal article.
Результаты
У меня получился корпус из 50 статей. Осталось 37 столбцов с метаданными — год, авторы, название, журнал, DOI и прочее. Единственная проблема - смешанные языки, статьи на русском и английском, что немного усложнило работу.
Описательная статистика в R
Результаты анализа





