Как очистить датасет от дублей имен авторов в OpenRefine

Материал из Поле цифровой дидактики
Версия от 08:12, 10 марта 2026; Patarakin (обсуждение | вклад) (Новая страница: «{{Scripting Tutorials |Description=Распространенная проблема в библиометрических датасетах имена авторов написаны по-разному. В результате при анализе в VOSviwer мы видим больше узлов, чем есть на самом деле. Нам нужно избавиться от этих лишних узлов |Field_of_knowledge=Информати...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Описание Распространенная проблема в библиометрических датасетах имена авторов написаны по-разному. В результате при анализе в VOSviwer мы видим больше узлов, чем есть на самом деле. Нам нужно избавиться от этих лишних узлов
Область знаний Информатика, Лингвистика
Область использования (ISTE)
Возрастная категория


Поясняющее видео
Близкие рецепту понятия кластер
Среды и средства для приготовления рецепта: VOSviewer, OpenRefine

Постановка проблемы

Рассмотрим проблему на примере нескольких датесетов:

Использование OpenRefine