Как очистить датасет от дублей имен авторов в OpenRefine

Материал из Поле цифровой дидактики
Описание Распространенная проблема в библиометрических датасетах имена авторов написаны по-разному. В результате при анализе в VOSviwer мы видим больше узлов, чем есть на самом деле. Нам нужно избавиться от этих лишних узлов
Область знаний Информатика, Лингвистика
Область использования (ISTE)
Возрастная категория


Поясняющее видео
Близкие рецепту понятия кластер
Среды и средства для приготовления рецепта: VOSviewer, OpenRefine

Постановка проблемы

Рассмотрим проблему на примере нескольких датесетов:

Использование OpenRefine