K-means: различия между версиями

Материал из Поле цифровой дидактики
(Новая страница: «{{Понятие |Description=Метод k-средних (англ. k-means) — наиболее популярный метод кластеризации. Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров. |Field_of_knowledge=Информатика |simil...»)
 
 
(не показаны 2 промежуточные версии этого же участника)
Строка 2: Строка 2:
|Description=Метод k-средних (англ. k-means) — наиболее популярный метод кластеризации. Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров.
|Description=Метод k-средних (англ. k-means) — наиболее популярный метод кластеризации. Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров.
|Field_of_knowledge=Информатика
|Field_of_knowledge=Информатика
|similar_concepts=нейронная сеть, искусственный интеллект
|similar_concepts=нейронная сеть, искусственный интеллект, классификация
|Environment=Scratch, Snap!
}}
}}
Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров:
Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров:
:: <math>V = \sum_{i=1}^{k} \sum_{x \in S_i} (x - \mu_i)^2 </math>
:: <math>V = \sum_{i=1}^{k} \sum_{x \in S_i} (x - \mu_i)^2 </math>
где <math>k</math> — число кластеров, <math>S_i</math> — полученные кластеры, <math>i = 1, 2, \dots, k</math>, а <math>\mu_i</math> — центры масс всех векторов <math>x</math> из кластера <math>S_i</math>.
где <math>k</math> — число кластеров, <math>S_i</math> — полученные кластеры, <math>i = 1, 2, \dots, k</math>, а <math>\mu_i</math> — центры масс всех векторов <math>x</math> из кластера <math>S_i</math>.
=== Примеры ===
<scratch project="190300489" />
=== Литературы ===
# Estevez J., Garate G., Graña M. Gentle Introduction to [[Artificial Intelligence]] for High-School Students Using [[Scratch]] // IEEE Access. 2019. Vol. 7. P. 179027–179036.
# J. MacQueen, Some methods for classification and analysis of multivariate observations, in Proc. 5th Berkeley Symp. Math. Statist. Probab., vol. 1. Berkeley, CA, USA: Univ. California Press, 1967, pp. 281–297.

Текущая версия на 11:33, 6 января 2023


Описание Метод k-средних (англ. k-means) — наиболее популярный метод кластеризации. Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров.
Область знаний Информатика
Авторы
Поясняющее видео
Близкие понятия Нейронная сеть, Искусственный интеллект, классификация
Среды и средства для освоения понятия Scratch, Snap!

Действие алгоритма таково, что он стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров:

[math]\displaystyle{ V = \sum_{i=1}^{k} \sum_{x \in S_i} (x - \mu_i)^2 }[/math]

где [math]\displaystyle{ k }[/math] — число кластеров, [math]\displaystyle{ S_i }[/math] — полученные кластеры, [math]\displaystyle{ i = 1, 2, \dots, k }[/math], а [math]\displaystyle{ \mu_i }[/math] — центры масс всех векторов [math]\displaystyle{ x }[/math] из кластера [math]\displaystyle{ S_i }[/math].

Примеры

Литературы

  1. Estevez J., Garate G., Graña M. Gentle Introduction to Artificial Intelligence for High-School Students Using Scratch // IEEE Access. 2019. Vol. 7. P. 179027–179036.
  2. J. MacQueen, Some methods for classification and analysis of multivariate observations, in Proc. 5th Berkeley Symp. Math. Statist. Probab., vol. 1. Berkeley, CA, USA: Univ. California Press, 1967, pp. 281–297.