0% found this document useful (0 votes)

7 views5 pages

Python

Python concepts

Uploaded by

Girish Reddy

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views5 pages

Python

Python concepts

Uploaded by

Girish Reddy

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

Dimensionality reduction , Hierarchical clustering in machine learning

Prerequisites
1. Install Python: Make sure you have Python installed. You can download it
from Python's official website (https://www.python.org/downloads/).

2. Install Required Libraries: You will need the following libraries: 'pandas',
'numpy', and 'matplotlib'. You can install them using pip.

pip install pandas numpy matplotlib

3. Set Up Your IDE: You can use any Python IDE or text editor (like Jupyter
Notebook, VS Code, or PyCharm).
Step 1: Gather Data
For demonstration, let’s create a sample dataset in CSV format. Save the
following data in a file named 'business_data.csv'.

CustomerID,Name,Email,JoinDate,AmountSpent
1,John Doe,[email protected],2024-01-15,150.00
2,Jane Smith,[email protected],2024-02-20,200.00
3,Bob Johnson,,2024-03-05,150.00
4,Mary Johnson,[email protected],2024-02-30,300.00
5,Tom Brown,[email protected],2024-03-15,400.00
6,Emily Davis,[email protected],2024-01-25,
1,John Doe,[email protected],2024-01-15,150.00

Step 2: Load the Data

Use Pandas to load the dataset and inspect its contents.

# Load a sample dataset (Iris dataset)

data = load_iris()

df = pd.DataFrame(data.data,

columns=data.feature_names)

print(df.head())
Step 3: Dimensionality Reduction Techniques

Dimensionality reduction helps in reducing the number of features while retaining

essential patterns.

a. Principal Component Analysis (PCA)

from sklearn.decomposition import PCA

pca = PCA(n_components=2)

df_pca = pca.fit_transform(df)

print(df_pca[:5])

Sample Output:

[[-2.68412563 0.31939725]

[-2.71414169 -0.17700123]

[-2.88899057 -0.14494943]

[-2.74534286 -0.31829898]

[-2.72871654 0.32675451]]
b. t-Distributed Stochastic Neighbor Embedding (t-SNE)

Sample Code:

from sklearn.manifold import TSNE

tsne = TSNE(n_components=2, random_state=42)

df_tsne = tsne.fit_transform(df)

print(df_tsne[:5])

Sample Output:

[[ 1.2379045 12.769159 ]

[ 8.755232 7.7505245]

[ 9.419792 8.941869 ]

[ 9.378086 7.217551 ]

[ 2.849782 6.5989175]]

Step 4: Hierarchical Clustering

Sample Code:

-----------

from scipy.cluster.hierarchy import dendrogram, linkage

import matplotlib.pyplot as plt

linked = linkage(df, method='ward')

plt.figure(figsize=(10, 7))

dendrogram(linked, truncate_mode='lastp')
plt.title("Hierarchical Clustering Dendrogram")

plt.show()

Expected Output: A dendrogram plot will display showing hierarchical relationships between data

points.

Step 5: Evaluation and Visualization

Sample Code:

from sklearn.metrics import silhouette_score

from sklearn.cluster import AgglomerativeClustering

cluster = AgglomerativeClustering(n_clusters=3)

labels = cluster.fit_predict(df)

score = silhouette_score(df, labels)

print("Silhouette Score:", score)

Sample Output:

Silhouette Score: 0.554323

This score evaluates clustering quality, where higher values indicate better-defined

clusters.

SC-200: Microsoft Security Operations Analyst Preparation
From Everand
SC-200: Microsoft Security Operations Analyst Preparation
Georgio Daccache
No ratings yet
(Feature Engineering) (Extended-Cheatsheet)
No ratings yet
(Feature Engineering) (Extended-Cheatsheet)
9 pages
1.1 Read The Data and Do Exploratory Data Analysis. Describe The Data Briefly
100% (19)
1.1 Read The Data and Do Exploratory Data Analysis. Describe The Data Briefly
50 pages
Week 8 DS Practical (1)
No ratings yet
Week 8 DS Practical (1)
13 pages
DSBA+Master+Codebook+-+Unsupervised+Learning
No ratings yet
DSBA+Master+Codebook+-+Unsupervised+Learning
7 pages
21MIC0107_Da4
No ratings yet
21MIC0107_Da4
4 pages
Clustering Algorithms CheatSheet 1710438661
No ratings yet
Clustering Algorithms CheatSheet 1710438661
6 pages
Aiml Unit 3 4
No ratings yet
Aiml Unit 3 4
19 pages
Practical 5
No ratings yet
Practical 5
6 pages
Ass6(DMDS)
No ratings yet
Ass6(DMDS)
7 pages
Agglomerative Clustering
No ratings yet
Agglomerative Clustering
2 pages
PRACTICAL5
No ratings yet
PRACTICAL5
23 pages
Marketing Analytics Week-10 LAQ
No ratings yet
Marketing Analytics Week-10 LAQ
5 pages
Ds Paper
No ratings yet
Ds Paper
35 pages
3_Modeling.ipynb - Colaboratory
No ratings yet
3_Modeling.ipynb - Colaboratory
31 pages
Unit1 ML Programs
No ratings yet
Unit1 ML Programs
5 pages
IntroQugates
No ratings yet
IntroQugates
4 pages
Asset-V1 VIT+MBA109+2020+type@asset+block@Introductio To ML Using Python
No ratings yet
Asset-V1 VIT+MBA109+2020+type@asset+block@Introductio To ML Using Python
7 pages
Atelier N5 PDF
No ratings yet
Atelier N5 PDF
5 pages
Project Data Mining (AMAN YADAV)
No ratings yet
Project Data Mining (AMAN YADAV)
12 pages
liner regression chapter N5
No ratings yet
liner regression chapter N5
2 pages
Pattern Recognition Practicals
No ratings yet
Pattern Recognition Practicals
8 pages
23CC554
No ratings yet
23CC554
10 pages
Cheat Sheet-Building Unsupervised Learning Models
No ratings yet
Cheat Sheet-Building Unsupervised Learning Models
3 pages
MLFILE
No ratings yet
MLFILE
21 pages
Reading Data: #Importing Required Libraries
No ratings yet
Reading Data: #Importing Required Libraries
16 pages
Dimension Reduction
No ratings yet
Dimension Reduction
15 pages
ML assignment
No ratings yet
ML assignment
11 pages
Kmeansclustering Sales Dataset
No ratings yet
Kmeansclustering Sales Dataset
6 pages
SPPUML6
No ratings yet
SPPUML6
9 pages
Market analysis by pchandru
No ratings yet
Market analysis by pchandru
10 pages
Warpper Method
No ratings yet
Warpper Method
8 pages
MODELS (AutoRecovered)
No ratings yet
MODELS (AutoRecovered)
9 pages
6
No ratings yet
6
4 pages
Untitled document-2-1-13-7-11.4
No ratings yet
Untitled document-2-1-13-7-11.4
5 pages
ml lab
No ratings yet
ml lab
14 pages
Ml Short Code_under Updating
No ratings yet
Ml Short Code_under Updating
4 pages
Principal Component Analysis Notes : Info
No ratings yet
Principal Component Analysis Notes : Info
22 pages
FMLASS3Q7 - Jupyter Notebook
No ratings yet
FMLASS3Q7 - Jupyter Notebook
6 pages
sales-data-clustering
No ratings yet
sales-data-clustering
15 pages
advertising in ML
No ratings yet
advertising in ML
9 pages
IMP_Hierarchical_Clustering
No ratings yet
IMP_Hierarchical_Clustering
3 pages
8. ML_Lab Manual
No ratings yet
8. ML_Lab Manual
54 pages
PCA_Explained -
No ratings yet
PCA_Explained -
9 pages
Data Reduction Using Pythonh
No ratings yet
Data Reduction Using Pythonh
5 pages
M pdf
No ratings yet
M pdf
13 pages
Mall Customer Segmentation Using KMeans Clustering Algorithm and Classification Algorithm
No ratings yet
Mall Customer Segmentation Using KMeans Clustering Algorithm and Classification Algorithm
40 pages
Feature Extraction: 4.1. Principal Component Analysis (PCA)
No ratings yet
Feature Extraction: 4.1. Principal Component Analysis (PCA)
10 pages
Experiment 4 1
No ratings yet
Experiment 4 1
4 pages
Joseph Xavier J - FML
No ratings yet
Joseph Xavier J - FML
15 pages
Dimensionality - Reduction - Principal - Component - Analysis - Ipynb at Master Llsourcell - Dimensionality - Reduction GitHub
No ratings yet
Dimensionality - Reduction - Principal - Component - Analysis - Ipynb at Master Llsourcell - Dimensionality - Reduction GitHub
14 pages
ml lab
No ratings yet
ml lab
8 pages
Reduce Data Dimensionality Using PCA
No ratings yet
Reduce Data Dimensionality Using PCA
6 pages
Compute2
No ratings yet
Compute2
10 pages
Presentation1
No ratings yet
Presentation1
15 pages
DAVL PR1.2 Mit
No ratings yet
DAVL PR1.2 Mit
10 pages
AAM 7th prac
No ratings yet
AAM 7th prac
4 pages
D3 docs
No ratings yet
D3 docs
6 pages
TWP
No ratings yet
TWP
2 pages
PHP Package Mastery: 100 Essential Tools in One Hour - 2024 Edition
From Everand
PHP Package Mastery: 100 Essential Tools in One Hour - 2024 Edition
Kanto
No ratings yet
1 s2.0 S1296207419308064 Main
No ratings yet
1 s2.0 S1296207419308064 Main
12 pages
CS771 IITK EndSem Solutions
100% (1)
CS771 IITK EndSem Solutions
8 pages
Kurukshetra: Seminar On Electronic Nose
No ratings yet
Kurukshetra: Seminar On Electronic Nose
15 pages
Face Detection & Face Recognition Using Open Computer Vision Classifies
0% (1)
Face Detection & Face Recognition Using Open Computer Vision Classifies
19 pages
Chap1-Overview of Data Science
No ratings yet
Chap1-Overview of Data Science
50 pages
428799
No ratings yet
428799
365 pages
Machine Learning Laboratory: Manual
No ratings yet
Machine Learning Laboratory: Manual
52 pages
2024 05 Exam SRM Syllabus
No ratings yet
2024 05 Exam SRM Syllabus
6 pages
Proprietary Content.: Great Learning. All Right Reserved. Unauthorized Use or Distribution Prohibited
0% (1)
Proprietary Content.: Great Learning. All Right Reserved. Unauthorized Use or Distribution Prohibited
4 pages
Impact of Brand Image On Customer Loyalty in India
100% (1)
Impact of Brand Image On Customer Loyalty in India
17 pages
5 - Pca & Garett Rank
No ratings yet
5 - Pca & Garett Rank
14 pages
80 Recommendation
No ratings yet
80 Recommendation
16 pages
HP Laserjet Pro 300 400 Color m351 m451 Part List
No ratings yet
HP Laserjet Pro 300 400 Color m351 m451 Part List
32 pages
Sustainability Assessment in the Steel Industry Using Partial Least Squares - Structural Equation Model
No ratings yet
Sustainability Assessment in the Steel Industry Using Partial Least Squares - Structural Equation Model
12 pages
Yuan He PDF
No ratings yet
Yuan He PDF
15 pages
Bits & Bytes Data Digest February Edition 2024+
No ratings yet
Bits & Bytes Data Digest February Edition 2024+
17 pages
Applied Neuro Cryptography
100% (1)
Applied Neuro Cryptography
191 pages
1471 2458 14 995 PDF
No ratings yet
1471 2458 14 995 PDF
10 pages
Yo Sakaidani Minoru KONDO Ken Takahashi: Keywords
No ratings yet
Yo Sakaidani Minoru KONDO Ken Takahashi: Keywords
6 pages
Poly ML SIR
No ratings yet
Poly ML SIR
378 pages
ML Q
No ratings yet
ML Q
40 pages
Key Concepts in Exploratory Data Analysis (EDA)
No ratings yet
Key Concepts in Exploratory Data Analysis (EDA)
5 pages
NCA-GENL Exam Dumps
No ratings yet
NCA-GENL Exam Dumps
13 pages
Hiding in The Crowd: Privacy Preservation On Evolving Streams Through Correlation Tracking
No ratings yet
Hiding in The Crowd: Privacy Preservation On Evolving Streams Through Correlation Tracking
10 pages
Biomedical Signal Processing and Control: Rekha Rajagopal, Vidhyapriya Ranganathan
No ratings yet
Biomedical Signal Processing and Control: Rekha Rajagopal, Vidhyapriya Ranganathan
8 pages
The Resentment Rating Scale For Couples RRS-C Deve
No ratings yet
The Resentment Rating Scale For Couples RRS-C Deve
8 pages
Soane Et Al. (2012) - Development and Application of A New Measure of Empoyee Engagement
No ratings yet
Soane Et Al. (2012) - Development and Application of A New Measure of Empoyee Engagement
21 pages
MY Final Year Project
No ratings yet
MY Final Year Project
20 pages
Advanced Statistics (AS) Project Report
No ratings yet
Advanced Statistics (AS) Project Report
52 pages

Python

Uploaded by

Python

Uploaded by

Dimensionality reduction , Hierarchical clustering in machine learning

pip install pandas numpy matplotlib

Step 2: Load the Data

# Load a sample dataset (Iris dataset)

Dimensionality reduction helps in reducing the number of features while retaining

a. Principal Component Analysis (PCA)

from sklearn.decomposition import PCA

from sklearn.manifold import TSNE

tsne = TSNE(n_components=2, random_state=42)

Step 4: Hierarchical Clustering

from scipy.cluster.hierarchy import dendrogram, linkage

import matplotlib.pyplot as plt

linked = linkage(df, method='ward')

Step 5: Evaluation and Visualization

from sklearn.metrics import silhouette_score

from sklearn.cluster import AgglomerativeClustering

score = silhouette_score(df, labels)

print("Silhouette Score:", score)

Silhouette Score: 0.554323

You might also like