Divisive_Hierarchical_Clustering

Uploaded by

amrithkala shetty

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

42 views11 pages

Divisive_Hierarchical_Clustering

Uploaded by

amrithkala shetty

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 11

Divisive Hierarchical Clustering

Author: Amrithkala M Shetty

Date: September 2024

Table of Contents
1. Introduction

2. Divisive Hierarchical Clustering: An Overview

3. The Algorithm

4. Distance Metrics and Splitting Criteria

5. Example

6. Advantages and Disadvantages

7. Applications

8. Conclusion

9. References
1. Introduction
Hierarchical clustering is a popular method of cluster analysis that seeks to build a
hierarchy of clusters. It can be broadly categorized into two types: agglomerative (bottom-
up) and divisive (top-down) clustering. While agglomerative clustering starts with
individual points and merges them to form clusters, divisive clustering takes the opposite
approach. This document will focus on divisive hierarchical clustering, its significance,
algorithm, and applications.
2. Divisive Hierarchical Clustering: An Overview
Divisive hierarchical clustering, also known as the top-down approach, starts with all data
points in a single cluster. It recursively splits the clusters into smaller ones until each data
point is in its own cluster, or until another stopping criterion is met. This method is less
commonly used compared to agglomerative clustering but is particularly useful in certain
scenarios where large clusters need to be divided into more granular subgroups.
3. The Algorithm
The divisive clustering algorithm follows these steps:

1. Start with all data points in a single cluster.

2. Recursively split the cluster into two or more sub-clusters based on a chosen criterion,
such as distance.
3. Continue splitting until each data point is its own cluster or another stopping condition is
met.

Pseudo-code for the divisive hierarchical clustering algorithm:

```
function DIVISIVE_CLUSTERING(data_points):
cluster = [all data_points]
clusters = [cluster]
while not stopping_condition(clusters):
for each cluster in clusters:
split cluster into two or more sub-clusters
replace cluster with sub-clusters
return clusters
```
4. Distance Metrics and Splitting Criteria
The choice of distance metric and splitting criterion significantly impacts the results of
divisive clustering. Common distance metrics include Euclidean distance, Manhattan
distance, and cosine similarity. The splitting criterion might involve maximizing the inter-
cluster distance or minimizing the intra-cluster distance. These choices should be made
based on the specific characteristics of the data and the desired outcome.
5. Example
Consider a simple example with a small dataset. Suppose we have a dataset of five points in
a 2D space: A(1,2), B(2,3), C(3,4), D(5,6), and E(8,9). The divisive clustering process might
start by placing all points in a single cluster. The algorithm then evaluates and splits the
cluster into sub-clusters based on the distance between points, resulting in a hierarchy of
clusters. A visual representation of the resulting dendrogram can help illustrate the
clustering process.
6. Advantages and Disadvantages
### Advantages
- **Intuitive and Easy to Understand:** Divisive hierarchical clustering is straightforward
and easy to interpret, making it accessible to users.
- **Dendrogram Visualization:** The hierarchical nature allows for the creation of a
dendrogram, which visually represents the relationships between clusters.
- **No Need to Pre-specify Number of Clusters:** Unlike k-means clustering, divisive
clustering does not require the user to specify the number of clusters in advance.

### Disadvantages
- **Computationally Expensive:** The recursive splitting process is computationally
intensive, especially for large datasets.
- **Sensitive to Noise and Outliers:** Divisive clustering can be affected by noise and
outliers, potentially leading to inaccurate clustering results.
- **Imbalanced Clusters:** The algorithm may produce clusters of significantly different
sizes, which can be undesirable in some applications.
7. Applications
Divisive hierarchical clustering has applications in various domains, including:
- **Biology:** It is used to classify species into hierarchical taxonomies based on genetic
similarities.
- **Marketing:** Helps in segmenting customers into distinct groups based on purchasing
behavior.
- **Social Network Analysis:** Divisive clustering is used to identify communities within
social networks, where users are grouped based on interaction patterns.
8. Conclusion
Divisive hierarchical clustering is a powerful method for clustering data, particularly when
there is a need to break down large clusters into more detailed sub-clusters. Despite its
computational challenges, it provides a clear and interpretable structure for analyzing
complex datasets. The ability to create a dendrogram adds an extra layer of insight, making
divisive clustering a valuable tool in various fields of study.
9. References
1. Hastie, T., Tibshirani, R., & Friedman, J. (2009). *The Elements of Statistical Learning: Data
Mining, Inference, and Prediction*. Springer.
2. Kaufman, L., & Rousseeuw, P. J. (1990). *Finding Groups in Data: An Introduction to
Cluster Analysis*. Wiley.
3. Xu, R., & Wunsch, D. (2005). *Clustering*. Wiley-IEEE Press.
4. Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). *Cluster Analysis*. Wiley.

ADAA - Internal Audit Manual
100% (2)
ADAA - Internal Audit Manual
166 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
4 pages
476 emt abstract
No ratings yet
476 emt abstract
3 pages
report 2
No ratings yet
report 2
7 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
10 pages
10Hierarchical&Probabilistic Clustering & GMM (ML)
No ratings yet
10Hierarchical&Probabilistic Clustering & GMM (ML)
24 pages
Hierarchical-Clustering-in-Machine-Learning
No ratings yet
Hierarchical-Clustering-in-Machine-Learning
10 pages
Hierarchical Clustering in Unsupervised Learning
No ratings yet
Hierarchical Clustering in Unsupervised Learning
9 pages
Hierarchical Clustering Unit 4 ML
No ratings yet
Hierarchical Clustering Unit 4 ML
14 pages
Hierarchical clustering
No ratings yet
Hierarchical clustering
2 pages
Hierarchical_Clustering_Case_Study
No ratings yet
Hierarchical_Clustering_Case_Study
4 pages
Hierarchical Clustering Algorithm
No ratings yet
Hierarchical Clustering Algorithm
9 pages
Heirarchical clustering
No ratings yet
Heirarchical clustering
22 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
26 pages
Agnes
No ratings yet
Agnes
25 pages
Lecture - 11 Hierarchical Clustering
No ratings yet
Lecture - 11 Hierarchical Clustering
28 pages
ML CO4 SESSION 30 Hierarchical Clustering
No ratings yet
ML CO4 SESSION 30 Hierarchical Clustering
20 pages
P 3.1.3 Hierarchical
No ratings yet
P 3.1.3 Hierarchical
30 pages
Hierarchical Clusters
No ratings yet
Hierarchical Clusters
6 pages
4.4 Hierarchical Clustering Methods
No ratings yet
4.4 Hierarchical Clustering Methods
39 pages
HierarchicalClusteringASurvey - Published7 3 9 871
No ratings yet
HierarchicalClusteringASurvey - Published7 3 9 871
5 pages
Exp 8
No ratings yet
Exp 8
5 pages
Hierarchical Clustering in Data Mining
No ratings yet
Hierarchical Clustering in Data Mining
4 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
3 pages
Chapter 4 _ Clustering
No ratings yet
Chapter 4 _ Clustering
21 pages
Chap15 Cluster Analysis
No ratings yet
Chap15 Cluster Analysis
55 pages
unit5_CSM_ML
No ratings yet
unit5_CSM_ML
32 pages
MACHINE LEARNING NOTES ANNA UNIVERSITY
No ratings yet
MACHINE LEARNING NOTES ANNA UNIVERSITY
14 pages
ML-UNIT-5
No ratings yet
ML-UNIT-5
20 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
41 pages
HierarchicalClusteringASurvey Published7-3!9!871
No ratings yet
HierarchicalClusteringASurvey Published7-3!9!871
5 pages
Week-9-Part-2 Agglomerative Clustering
No ratings yet
Week-9-Part-2 Agglomerative Clustering
40 pages
ML Module Iv
No ratings yet
ML Module Iv
27 pages
DA Seminar
No ratings yet
DA Seminar
29 pages
Clustering
No ratings yet
Clustering
19 pages
Hierarchical Clustering - 11.3.2024 - Full
No ratings yet
Hierarchical Clustering - 11.3.2024 - Full
14 pages
13_BIRCH
No ratings yet
13_BIRCH
8 pages
Hierarchical Clustering in Machine Learning
No ratings yet
Hierarchical Clustering in Machine Learning
11 pages
Hierar Scale4
No ratings yet
Hierar Scale4
51 pages
Data Mining - Lecture 9
No ratings yet
Data Mining - Lecture 9
29 pages
ifferent methods of clustering
No ratings yet
ifferent methods of clustering
8 pages
Data Science Session 8 Clustering V0
No ratings yet
Data Science Session 8 Clustering V0
30 pages
UNIT III - ML
No ratings yet
UNIT III - ML
13 pages
Cluster Analysis Concept & Methods
No ratings yet
Cluster Analysis Concept & Methods
14 pages
Unit 4 Descriptive Modeling
No ratings yet
Unit 4 Descriptive Modeling
18 pages
Marketing Analytics Week-10 LAQ
No ratings yet
Marketing Analytics Week-10 LAQ
5 pages
Scalable Hierarchical Agglomerative Clustering
No ratings yet
Scalable Hierarchical Agglomerative Clustering
11 pages
Group 3 Assignment
No ratings yet
Group 3 Assignment
10 pages
Hierarchical Clustering pdf
No ratings yet
Hierarchical Clustering pdf
7 pages
Hierarchical Clustering PDF
No ratings yet
Hierarchical Clustering PDF
5 pages
9536 DWM Expt 7 Merged
No ratings yet
9536 DWM Expt 7 Merged
14 pages
Partition
No ratings yet
Partition
52 pages
A_new_hierarchical_clustering_algorithm (1)
No ratings yet
A_new_hierarchical_clustering_algorithm (1)
5 pages
Clustering: EE-671 Prof L. Behera, IITK
No ratings yet
Clustering: EE-671 Prof L. Behera, IITK
33 pages
Lect 11 DM
No ratings yet
Lect 11 DM
41 pages
Week-10
No ratings yet
Week-10
84 pages
Joseph Xavier J - FML
No ratings yet
Joseph Xavier J - FML
15 pages
Unit 4 Clustering
No ratings yet
Unit 4 Clustering
18 pages
DWDM Unit 3
No ratings yet
DWDM Unit 3
21 pages
Clustering: An Overview: Key Concepts Objective
No ratings yet
Clustering: An Overview: Key Concepts Objective
12 pages
Decision Tree Pruning: Fundamentals and Applications
From Everand
Decision Tree Pruning: Fundamentals and Applications
Fouad Sabry
No ratings yet
1. AI basic ch 1
No ratings yet
1. AI basic ch 1
27 pages
798
No ratings yet
798
1 page
Computer Science Notes
No ratings yet
Computer Science Notes
1 page
20-gaussian-mixture-model
No ratings yet
20-gaussian-mixture-model
55 pages
Lstm Notes
No ratings yet
Lstm Notes
1 page
Linear_Regression_Deviation_Example
No ratings yet
Linear_Regression_Deviation_Example
3 pages
Deep Learning Notes
No ratings yet
Deep Learning Notes
1 page
Unix-and-Windows
No ratings yet
Unix-and-Windows
14 pages
SYSTEMS SOFTWARE U3
No ratings yet
SYSTEMS SOFTWARE U3
22 pages
Constitutional_Law_and_Constitutionalism
No ratings yet
Constitutional_Law_and_Constitutionalism
10 pages
SYSTEMS SOFTWARE
No ratings yet
SYSTEMS SOFTWARE
19 pages
modulewise questions
No ratings yet
modulewise questions
4 pages
perceptron
No ratings yet
perceptron
32 pages
Enhancing Transparency and Fairness in Automated C
No ratings yet
Enhancing Transparency and Fairness in Automated C
21 pages
Lec 06
No ratings yet
Lec 06
30 pages
Traditional Villages of India
No ratings yet
Traditional Villages of India
21 pages
Hubble Display Manual - 1.24
No ratings yet
Hubble Display Manual - 1.24
8 pages
Customer Relation Management in The Vodafone Group
No ratings yet
Customer Relation Management in The Vodafone Group
14 pages
Ubaid CV-1
No ratings yet
Ubaid CV-1
2 pages
Cp7721 1036 0010 Operator Touch Panel Beckhoff Manual
No ratings yet
Cp7721 1036 0010 Operator Touch Panel Beckhoff Manual
2 pages
Comptia Security Plus Mini Course Handbook
100% (3)
Comptia Security Plus Mini Course Handbook
26 pages
Ram BOP Manual Book
100% (2)
Ram BOP Manual Book
28 pages
Early Thermal BD28 87
No ratings yet
Early Thermal BD28 87
5 pages
Successfactor Consultant Resume
No ratings yet
Successfactor Consultant Resume
2 pages
Business Analyst Syllabus
No ratings yet
Business Analyst Syllabus
11 pages
BAFE Updates Partner Alert
No ratings yet
BAFE Updates Partner Alert
2 pages
Full Circle Magazine Issue206 - en
No ratings yet
Full Circle Magazine Issue206 - en
67 pages
RAC On Windows - Oracle Cluster Ware Installation Steps Particular For Windows 2008 Clusters - ID 782795.1
No ratings yet
RAC On Windows - Oracle Cluster Ware Installation Steps Particular For Windows 2008 Clusters - ID 782795.1
2 pages
Case IIMU GSCM DEM 17jul2024
No ratings yet
Case IIMU GSCM DEM 17jul2024
90 pages
Code For Folder Lock
No ratings yet
Code For Folder Lock
1 page
BCAC602 - Lession Plan
No ratings yet
BCAC602 - Lession Plan
2 pages
Questions On Simple Resistive Circuits
100% (1)
Questions On Simple Resistive Circuits
18 pages
RAR EXERCISES
No ratings yet
RAR EXERCISES
8 pages
K Scheme OOP Unit Test-1 Question Bank
No ratings yet
K Scheme OOP Unit Test-1 Question Bank
12 pages
Midterm Exam Schedule
No ratings yet
Midterm Exam Schedule
1 page
GE Jenbacher DIA NE XT System Information
100% (1)
GE Jenbacher DIA NE XT System Information
87 pages
Computer Security Chapter 5
No ratings yet
Computer Security Chapter 5
11 pages
The Language of Sets
No ratings yet
The Language of Sets
20 pages
Nguyễn Đức Phi Hồng ITITIU 17022- Introduction to artificial intelligence Lab 3
No ratings yet
Nguyễn Đức Phi Hồng ITITIU 17022- Introduction to artificial intelligence Lab 3
9 pages
Free For Personal and Commercial Use WITH ATTRIBUTION License
No ratings yet
Free For Personal and Commercial Use WITH ATTRIBUTION License
2 pages
Server Content Guide
No ratings yet
Server Content Guide
4 pages
Compiler Construction Week 4
No ratings yet
Compiler Construction Week 4
16 pages
Maintenance Management
100% (3)
Maintenance Management
27 pages
Working From Home Checklist
No ratings yet
Working From Home Checklist
2 pages
Performance comparison of indoor navigation and obstacle avoidance methods for low-cost implementation in wheelchairs
No ratings yet
Performance comparison of indoor navigation and obstacle avoidance methods for low-cost implementation in wheelchairs
9 pages

Divisive_Hierarchical_Clustering

Uploaded by

Divisive_Hierarchical_Clustering

Uploaded by

Divisive Hierarchical Clustering

Author: Amrithkala M Shetty

Date: September 2024

2. Divisive Hierarchical Clustering: An Overview

4. Distance Metrics and Splitting Criteria

6. Advantages and Disadvantages

1. Start with all data points in a single cluster.

Pseudo-code for the divisive hierarchical clustering algorithm:

You might also like