Как провести семантический анализ текста
Материал из Поле цифровой дидактики
| Описание | Анализ тональности - анализ эмоциональной окраски текста (позитивная, негативная, нейтральная). |
|---|---|
| Область знаний | Лингвистика, Статистика |
| Область использования (ISTE) | Global Collaborator |
| Возрастная категория | 16
|
| Поясняющее видео | |
| Близкие рецепту понятия | |
| Среды и средства для приготовления рецепта: | R |
Анализ тональности =
- Анализ эмоциональной окраски текста (позитивная, негативная, нейтральная).
<syntaxhighlight lang="r">
- Пример с простым русским словарем
sentiment_dict <- tibble(
word = c("хороший", "отличный", "великолепный", "позитивный", "успех",
"плохой", "ужасный", "негативный", "проблема", "ошибка", "конфликт"),
sentiment = c(1, 1, 1, 1, 1, -1, -1, -1, -1, -1, -1)
)
text_sentiment <- tokens_clean %>%
left_join(sentiment_dict, by = "word") %>% group_by(title, category) %>% summarise( positive_words = sum(sentiment == 1, na.rm = TRUE), negative_words = sum(sentiment == -1, na.rm = TRUE), neutral_words = sum(is.na(sentiment), na.rm = TRUE), sentiment_score = (positive_words - negative_words) / n(), .groups = "drop" )
