Как очистить датасет от дублей имен авторов в OpenRefine
Материал из Поле цифровой дидактики
| Описание | Распространенная проблема в библиометрических датасетах имена авторов написаны по-разному. В результате при анализе в VOSviwer мы видим больше узлов, чем есть на самом деле. Нам нужно избавиться от этих лишних узлов |
|---|---|
| Область знаний | Информатика, Лингвистика |
| Область использования (ISTE) | |
| Возрастная категория |
|
| Поясняющее видео | |
| Близкие рецепту понятия | кластер |
| Среды и средства для приготовления рецепта: | VOSviewer, OpenRefine |
Постановка проблемы
Рассмотрим проблему на примере нескольких датесетов:
