K-means

Материал из Поле цифровой дидактики


Описание Метод k-средних (англ. k-means) — наиболее популярный метод кластеризации. Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров.
Область знаний Информатика
Авторы
Поясняющее видео
Близкие понятия Нейронная сеть, Искусственный интеллект, классификация
Среды и средства для освоения понятия Scratch, Snap!

Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров:

[math]\displaystyle{ V = \sum_{i=1}^{k} \sum_{x \in S_i} (x - \mu_i)^2 }[/math]

где [math]\displaystyle{ k }[/math] — число кластеров, [math]\displaystyle{ S_i }[/math] — полученные кластеры, [math]\displaystyle{ i = 1, 2, \dots, k }[/math], а [math]\displaystyle{ \mu_i }[/math] — центры масс всех векторов [math]\displaystyle{ x }[/math] из кластера [math]\displaystyle{ S_i }[/math].

Примеры

Литературы

  1. Estevez J., Garate G., Graña M. Gentle Introduction to Artificial Intelligence for High-School Students Using Scratch // IEEE Access. 2019. Vol. 7. P. 179027–179036.
  2. J. MacQueen, Some methods for classification and analysis of multivariate observations, in Proc. 5th Berkeley Symp. Math. Statist. Probab., vol. 1. Berkeley, CA, USA: Univ. California Press, 1967, pp. 281–297.