Кластеризация: различия между версиями
Patarakin (обсуждение | вклад) |
Patarakin (обсуждение | вклад) |
||
(не показано 6 промежуточных версий этого же участника) | |||
Строка 4: | Строка 4: | ||
Задача кластеризации относится к классу задач обучения без учителя. | Задача кластеризации относится к классу задач обучения без учителя. | ||
* Сетевая метрика / Кластеризация. Коэффициент кластеризации данного узла есть вероятность того, что два ближайших соседа этого узла сами есть ближайшие соседи. | * Сетевая метрика / Кластеризация. Коэффициент кластеризации данного узла есть вероятность того, что два ближайших соседа этого узла сами есть ближайшие соседи. | ||
|similar_concepts=кластер | |similar_concepts=кластер, коэффициент кластеризации | ||
|Environment=R, NetLogo, Python, OpenRepGrid, WenGrid | |Environment=R, NetLogo, Python, OpenRepGrid, WenGrid | ||
|FieldActivity=Дизайнер Сообществ | |FieldActivity=Дизайнер Сообществ | ||
Строка 10: | Строка 10: | ||
|Examples=социограмма | |Examples=социограмма | ||
}} | }} | ||
; [[ru_wikipedia:Кластерный анализ]] - interwiki | |||
Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя. | |||
https://upload.wikimedia.org/wikipedia/commons/thumb/c/c8/Cluster-2.svg/330px-Cluster-2.svg.png | |||
== Формальная постановка задачи кластеризации == | |||
Пусть <math>X</math> — множество объектов, <math>Y</math> — множество номеров (имён, меток) кластеров. Задана функция расстояния между объектами <math>\rho(x,x')</math>. Имеется конечная обучающая выборка объектов <math>X^m = \{ x_1, \dots, x_m \} \subset X</math>. Требуется разбить выборку на непересекающиеся подмножества, называемые ''кластерами'', так, чтобы каждый кластер состоял из объектов, близких по метрике <math>\rho</math>, а объекты разных кластеров существенно отличались. При этом каждому объекту <math>x_i\in X^m</math> | |||
приписывается номер кластера <math>y_i</math>. | |||
''Алгоритм кластеризации'' — это функция <math>a\colon X\to Y</math>, которая любому объекту <math>x\in X</math> ставит в соответствие номер кластера <math>y\in Y</math>. Множество <math>Y</math> в некоторых случаях известно заранее, однако чаще ставится задача определить оптимальное число кластеров, с точки зрения того или иного ''критерия качества'' кластеризации. | |||
== Кластеризация педагогических технологий == | |||
{{#mermaid:graph LR | |||
A[Pedagogical Technologies] --> B1(Active Learning) | |||
A --> B2(Collaborative Learning) | |||
A --> B3(Blended Learning) | |||
A --> B4(Game-based Learning) | |||
A --> B5(Adaptive Learning) | |||
B1 --> C1(Project-based Learning) | |||
B1 --> C2(Problem-based Learning) | |||
B1 --> C3(Inquiry-based Learning) | |||
B1 --> C4(Case-based Learning) | |||
B2 --> C5(Group Projects) | |||
B2 --> C6(Peer Teaching) | |||
B2 --> C7(Jigsaw Technique) | |||
B2 --> C8(Cooperative Learning) | |||
B3 --> C9(Online Discussions) | |||
B3 --> C10(Flipped Classroom) | |||
B3 --> C11(Mobile Learning) | |||
B3 --> C12(Synchronous/Asynchronous Learning) | |||
B4 --> C13(Gamification) | |||
B4 --> C14(Simulations) | |||
B4 --> C15(Virtual Reality/Augmented Reality) | |||
B4 --> C16(Game-based Assessments) | |||
B5 --> C17(Personalized Learning Paths) | |||
B5 --> C18(Intelligent Tutoring Systems) | |||
B5 --> C19(Learning Analytics) | |||
B5 --> C20(Adaptive Assessments) | |||
}} |
Текущая версия на 16:18, 17 мая 2024
Описание | Кластеризация (англ. cluster analysis) — задача группировки множества объектов на подмножества (кластеры) таким образом, чтобы объекты из одного кластера были более похожи друг на друга, чем на объекты из других кластеров по какому-либо критерию.
Задача кластеризации относится к классу задач обучения без учителя.
|
---|---|
Область знаний | |
Авторы | |
Поясняющее видео | |
Близкие понятия | кластер, Коэффициент кластеризации |
Среды и средства для освоения понятия | R, NetLogo, Python, OpenRepGrid, WenGrid |
- ru_wikipedia:Кластерный анализ - interwiki
Кластерный анализ (англ. cluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.
Формальная постановка задачи кластеризации
Пусть [math]\displaystyle{ X }[/math] — множество объектов, [math]\displaystyle{ Y }[/math] — множество номеров (имён, меток) кластеров. Задана функция расстояния между объектами [math]\displaystyle{ \rho(x,x') }[/math]. Имеется конечная обучающая выборка объектов [math]\displaystyle{ X^m = \{ x_1, \dots, x_m \} \subset X }[/math]. Требуется разбить выборку на непересекающиеся подмножества, называемые кластерами, так, чтобы каждый кластер состоял из объектов, близких по метрике [math]\displaystyle{ \rho }[/math], а объекты разных кластеров существенно отличались. При этом каждому объекту [math]\displaystyle{ x_i\in X^m }[/math] приписывается номер кластера [math]\displaystyle{ y_i }[/math].
Алгоритм кластеризации — это функция [math]\displaystyle{ a\colon X\to Y }[/math], которая любому объекту [math]\displaystyle{ x\in X }[/math] ставит в соответствие номер кластера [math]\displaystyle{ y\in Y }[/math]. Множество [math]\displaystyle{ Y }[/math] в некоторых случаях известно заранее, однако чаще ставится задача определить оптимальное число кластеров, с точки зрения того или иного критерия качества кластеризации.