0% found this document useful (0 votes)

12 views

K Means On IRIS Dataset

Uploaded by

bucky17d

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views

K Means On IRIS Dataset

Uploaded by

bucky17d

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

K Means on IRIS dataset

#Suppress warnings
import warnings
warnings.filterwarnings('ignore')

#Importing Libraries
import numpy as np
import pandas as pd

#Creating a dataframe
data=pd.read_csv("IRIS.csv")

data.head()

sepal_length sepal_width petal_length petal_width species

0 5.1 3.5 1.4 0.2 Iris-setosa

1 4.9 3.0 1.4 0.2 Iris-setosa

2 4.7 3.2 1.3 0.2 Iris-setosa

3 4.6 3.1 1.5 0.2 Iris-setosa

4 5.0 3.6 1.4 0.2 Iris-setosa

data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 150 entries, 0 to 149
Data columns (total 5 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 sepal_length 150 non-null float64
1 sepal_width 150 non-null float64
2 petal_length 150 non-null float64
3 petal_width 150 non-null float64
4 species 150 non-null object
dtypes: float64(4), object(1)
memory usage: 6.0+ KB

data.describe

<bound method NDFrame.describe of sepal_length sepal_width petal_length petal_width species

0 5.1 3.5 1.4 0.2 Iris-setosa
1 4.9 3.0 1.4 0.2 Iris-setosa
2 4.7 3.2 1.3 0.2 Iris-setosa
3 4.6 3.1 1.5 0.2 Iris-setosa
4 5.0 3.6 1.4 0.2 Iris-setosa
.. ... ... ... ... ...
145 6.7 3.0 5.2 2.3 Iris-virginica
146 6.3 2.5 5.0 1.9 Iris-virginica
147 6.5 3.0 5.2 2.0 Iris-virginica
148 6.2 3.4 5.4 2.3 Iris-virginica
149 5.9 3.0 5.1 1.8 Iris-virginica

[150 rows x 5 columns]>

Data Visualization
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

#Histogram
plt.hist(data["sepal_length"],bins=10,color="green")
plt.xlabel("sepla_length")
plt.ylabel("petal_length")
plt.show()
#Scatter Plot
sns.pairplot(data, hue="species")
plt.show()

#Histogrm with Line Graph

sns.histplot(data,x="petal_length",bins=25,kde=True,hue="species")
plt.xlabel("petal_length")
plt.ylabel("count")
plt.title("Petal Length distribution")
plt.show()
df1=data.drop(['species'],axis=1)

sns.heatmap(df1.corr(),annot=True)
plt.show()

Mapping the Species into number from 0 to 2

flower_mapping = {'Iris-setosa': 0,'Iris-versicolor': 1,'Iris-virginica':2}

data["species"] = data["species"].map(flower_mapping)

KMeans
from sklearn.cluster import KMeans

kmeans = KMeans(n_clusters=3)

kmeans.fit(data[['petal_length','petal_width']])

▾ KMeans
KMeans(n_clusters=3)

kmeans.cluster_centers_
array([[5.59583333, 2.0375 ],
[1.464 , 0.244 ],
[4.26923077, 1.34230769]])

plt.scatter(data['petal_length'],data['petal_width'],c=data['species'], cmap='rainbow')
plt.scatter(1.464, 0.244, s=200, c='b', marker='s')
plt.scatter(5.59583333, 2.0375, s=200, c='r', marker='s')
plt.scatter(4.26923077, 1.34230769, s=200, c='g', marker='s')
plt.show()

# Compute cluster centers and predict cluster index for each sample.
pred = kmeans.predict(data[['petal_length','petal_width']])

pred

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

sample_test=np.array([6,2])
second_test=sample_test.reshape(1, -1)
kmeans.predict(second_test)

array([0])

Loading [MathJax]/jax/output/CommonHTML/fonts/TeX/fontdata.js

Trần Mạnh Hùng 20192643.Ipynb - Colab
No ratings yet
Trần Mạnh Hùng 20192643.Ipynb - Colab
6 pages
DSBDA 3B
No ratings yet
DSBDA 3B
5 pages
6 in 1 PRGM
No ratings yet
6 in 1 PRGM
1 page
Experiment 3
No ratings yet
Experiment 3
4 pages
IRIS PCA
No ratings yet
IRIS PCA
13 pages
DSBDA 3B
No ratings yet
DSBDA 3B
5 pages
Ass_10.ipynb - Colab
No ratings yet
Ass_10.ipynb - Colab
8 pages
VSEC PW 7
No ratings yet
VSEC PW 7
3 pages
Aula Big Data
No ratings yet
Aula Big Data
5 pages
Practical 10 code
No ratings yet
Practical 10 code
5 pages
Homework 0 - Report
No ratings yet
Homework 0 - Report
7 pages
Assignment 10
No ratings yet
Assignment 10
9 pages
Kmeansrcode
No ratings yet
Kmeansrcode
2 pages
Assignment 3 Iris
No ratings yet
Assignment 3 Iris
2 pages
Iris - Ipynb - Colaboratory
No ratings yet
Iris - Ipynb - Colaboratory
8 pages
# Common Datatype: Print Type Print Type Print Type Print Type Print Type
No ratings yet
# Common Datatype: Print Type Print Type Print Type Print Type Print Type
4 pages
HW0 Script
No ratings yet
HW0 Script
6 pages
Summary (Iris) #View Statistical Summary of Dataset
No ratings yet
Summary (Iris) #View Statistical Summary of Dataset
1 page
DSBDA3
No ratings yet
DSBDA3
3 pages
SVM and KNN
No ratings yet
SVM and KNN
3 pages
DML About Put
No ratings yet
DML About Put
2 pages
Notes Dv
No ratings yet
Notes Dv
19 pages
Name:-Nisha Ambike: Roll No: - 02
No ratings yet
Name:-Nisha Ambike: Roll No: - 02
2 pages
b21 DSBDA Assignment No 10
No ratings yet
b21 DSBDA Assignment No 10
1 page
Assignment 5'
No ratings yet
Assignment 5'
4 pages
25 - Assignment10.ipynb - Colaboratory
No ratings yet
25 - Assignment10.ipynb - Colaboratory
13 pages
Data Visualization With Maplotlib
No ratings yet
Data Visualization With Maplotlib
8 pages
cota12-6
No ratings yet
cota12-6
4 pages
Pra 10
No ratings yet
Pra 10
3 pages
data_visualization_3[1]
No ratings yet
data_visualization_3[1]
3 pages
Support Vector Machine (SVM Classifier) Implemenation in Python With Scikit-Learn
No ratings yet
Support Vector Machine (SVM Classifier) Implemenation in Python With Scikit-Learn
21 pages
Experiment 11 Pml
No ratings yet
Experiment 11 Pml
3 pages
Anuj Khandelwal 3029 BCP a Business Analytics Continuous Assessment 2
No ratings yet
Anuj Khandelwal 3029 BCP a Business Analytics Continuous Assessment 2
20 pages
ML Lab Record
No ratings yet
ML Lab Record
64 pages
Program1_MLA_lab_2025_250109_144615
No ratings yet
Program1_MLA_lab_2025_250109_144615
17 pages
Import As Import As Import As From Import Import As Import
No ratings yet
Import As Import As Import As From Import Import As Import
7 pages
dsbdalab10 (1)
No ratings yet
dsbdalab10 (1)
12 pages
Unsupervised ML
No ratings yet
Unsupervised ML
17 pages
dsbda10
No ratings yet
dsbda10
8 pages
137 VSEC 6
No ratings yet
137 VSEC 6
2 pages
Exno 4
No ratings yet
Exno 4
13 pages
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
No ratings yet
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
6 pages
Vansh3089CA2
No ratings yet
Vansh3089CA2
13 pages
Data Visualization and Matplot
No ratings yet
Data Visualization and Matplot
11 pages
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
No ratings yet
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
5 pages
Lab Manual
No ratings yet
Lab Manual
32 pages
DSBDA Assignment 3 Jupyter Notebook
No ratings yet
DSBDA Assignment 3 Jupyter Notebook
3 pages
PW4 python solution
No ratings yet
PW4 python solution
6 pages
Iris Species IB
No ratings yet
Iris Species IB
7 pages
Dsbda Ouput 1-10
No ratings yet
Dsbda Ouput 1-10
89 pages
Nandini_matplotlib_ws
No ratings yet
Nandini_matplotlib_ws
10 pages
10(3146) (1)
No ratings yet
10(3146) (1)
2 pages
K Means Algorithm
No ratings yet
K Means Algorithm
1 page
Iris - Ipynb - Colab
No ratings yet
Iris - Ipynb - Colab
1 page
Base de Datos IRIS Codigos R Utilizados para El Analisis
No ratings yet
Base de Datos IRIS Codigos R Utilizados para El Analisis
4 pages
b21 DSBDA Assignment No 3
No ratings yet
b21 DSBDA Assignment No 3
3 pages
NUMPY-case Study
100% (1)
NUMPY-case Study
4 pages
DSBDA_LA_10
No ratings yet
DSBDA_LA_10
4 pages
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
From Everand
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
Kanto
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
AD3271 DSD Lab Manual
No ratings yet
AD3271 DSD Lab Manual
81 pages
Matlab Course Brochure
No ratings yet
Matlab Course Brochure
8 pages
University of Southeastern Philippines College of Engineering
No ratings yet
University of Southeastern Philippines College of Engineering
4 pages
Lesson4 Probabiity
100% (1)
Lesson4 Probabiity
70 pages
g11 Phy q2 Final 2015
No ratings yet
g11 Phy q2 Final 2015
6 pages
Periodical Exam
No ratings yet
Periodical Exam
13 pages
CSE 102L Data Structures and Algorithms Lab (Common For B.Tech EEE, ECE, EI) Cycle Sheet - 1
0% (1)
CSE 102L Data Structures and Algorithms Lab (Common For B.Tech EEE, ECE, EI) Cycle Sheet - 1
4 pages
Digital Logic Families
No ratings yet
Digital Logic Families
26 pages
Lab Exercises For Visual Basic 6.0
0% (1)
Lab Exercises For Visual Basic 6.0
11 pages
Sinngle Layer Perceptron1
No ratings yet
Sinngle Layer Perceptron1
28 pages
Inclusion of A Point in A Polygon
No ratings yet
Inclusion of A Point in A Polygon
6 pages
Relative Motion - Study Material For IIT JEE AskIITians 2
No ratings yet
Relative Motion - Study Material For IIT JEE AskIITians 2
1 page
Quantum Mechanics Math Review
No ratings yet
Quantum Mechanics Math Review
5 pages
Report of Thermodynamic
No ratings yet
Report of Thermodynamic
9 pages
XI Sample Papers 2023
No ratings yet
XI Sample Papers 2023
33 pages
Second Law
No ratings yet
Second Law
14 pages
Event-Based PID Control:: Application To A Mini Quadrotor Helicopter
No ratings yet
Event-Based PID Control:: Application To A Mini Quadrotor Helicopter
12 pages
Distributed Entanglement
No ratings yet
Distributed Entanglement
13 pages
Railway Security System Based On Wireless Sensor Networks: State of The Art
No ratings yet
Railway Security System Based On Wireless Sensor Networks: State of The Art
4 pages
4.4.4 Practice - Modeling - Two-Variable Systems of Inequalities (Practice)
0% (1)
4.4.4 Practice - Modeling - Two-Variable Systems of Inequalities (Practice)
4 pages
Design-Grid Structures and Syntax - Cde - Article
No ratings yet
Design-Grid Structures and Syntax - Cde - Article
8 pages
Kay - Solutions
100% (2)
Kay - Solutions
47 pages
Business Analytics Notes
No ratings yet
Business Analytics Notes
41 pages
Materials Letters: H.W. Zhang, K. Cai, L. Wang
No ratings yet
Materials Letters: H.W. Zhang, K. Cai, L. Wang
4 pages
GATE Production Engineering Solved 2011
No ratings yet
GATE Production Engineering Solved 2011
13 pages
Pre-Test and Post-Test Item Analysis
No ratings yet
Pre-Test and Post-Test Item Analysis
15 pages
Unit 2 - Week 1: Assignment 1
No ratings yet
Unit 2 - Week 1: Assignment 1
3 pages
M.tech Power Electronics Power Electronics Electrical Drives
No ratings yet
M.tech Power Electronics Power Electronics Electrical Drives
66 pages
Bayesian Hierarchical Models - With Applications Using R - Congdon P.D. (CRC 2020) (2nd Ed.)
100% (3)
Bayesian Hierarchical Models - With Applications Using R - Congdon P.D. (CRC 2020) (2nd Ed.)
593 pages
Guide To Mechanics 4th Edition Philip P. G. Dyke All Chapters Instant Download
100% (5)
Guide To Mechanics 4th Edition Philip P. G. Dyke All Chapters Instant Download
62 pages

K Means On IRIS Dataset

Uploaded by

K Means On IRIS Dataset

Uploaded by

K Means on IRIS dataset

sepal_length sepal_width petal_length petal_width species

0 5.1 3.5 1.4 0.2 Iris-setosa

1 4.9 3.0 1.4 0.2 Iris-setosa

2 4.7 3.2 1.3 0.2 Iris-setosa

3 4.6 3.1 1.5 0.2 Iris-setosa

4 5.0 3.6 1.4 0.2 Iris-setosa

<bound method NDFrame.describe of sepal_length sepal_width petal_length petal_width species

[150 rows x 5 columns]>

#Histogrm with Line Graph

Mapping the Species into number from 0 to 2

flower_mapping = {'Iris-setosa': 0,'Iris-versicolor': 1,'Iris-virginica':2}

You might also like