K-means
Материал из Поле цифровой дидактики
Описание | Метод k-средних (англ. k-means) — наиболее популярный метод кластеризации. Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров. |
---|---|
Область знаний | Информатика |
Авторы | |
Поясняющее видео | |
Близкие понятия | Нейронная сеть, Искусственный интеллект, классификация |
Среды и средства для освоения понятия | Scratch, Snap! |
Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров:
- [math]\displaystyle{ V = \sum_{i=1}^{k} \sum_{x \in S_i} (x - \mu_i)^2 }[/math]
где [math]\displaystyle{ k }[/math] — число кластеров, [math]\displaystyle{ S_i }[/math] — полученные кластеры, [math]\displaystyle{ i = 1, 2, \dots, k }[/math], а [math]\displaystyle{ \mu_i }[/math] — центры масс всех векторов [math]\displaystyle{ x }[/math] из кластера [math]\displaystyle{ S_i }[/math].
Примеры
Литературы
- Estevez J., Garate G., Graña M. Gentle Introduction to Artificial Intelligence for High-School Students Using Scratch // IEEE Access. 2019. Vol. 7. P. 179027–179036.
- J. MacQueen, Some methods for classification and analysis of multivariate observations, in Proc. 5th Berkeley Symp. Math. Statist. Probab., vol. 1. Berkeley, CA, USA: Univ. California Press, 1967, pp. 281–297.