Анализ частот встречаемости слов — история изменений

Материал из Поле цифровой дидактики

Выбор версий: отметьте версии страницы, которые вы хотите сравнить, и нажмите Enter или кнопку ниже.
Пояснения: (текущ.) — отличия от текущей версии; (пред.) — отличия от предыдущей версии; м — малые изменения.

24 февраля 2026

  • текущ.пред. 08:5008:50, 24 февраля 2026 Patarakin обсуждение вклад 1618 байт +1618 Новая страница: « Токенизация и частоты слов в литературе с tidytext Основные понятия: Токенизация (unnest_tokens), стоп-слова (stop_words, anti_join), загрузка корпусов (gutenberg_download), пропорции частот (proportion = n / sum(n)), переформатирование данных (pivot_wider/long). <syntaxhighlight lang="R" line> text <- c("Because I could not stop fo...»