0% found this document useful (0 votes)

6 views

Import As From Import From Import Import As

Uploaded by

Shantanu Dhage

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views

Import As From Import From Import Import As

Uploaded by

Shantanu Dhage

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

import pandas as pd

from sklearn.decomposition import PCA

from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt

df = pd.read_csv('Wine_p1.csv')

df.keys()

Index(['Alcohol', 'Malic_Acid', 'Ash', 'Ash_Alcanity', 'Magnesium',

'Total_Phenols', 'Flavanoids', 'Nonflavanoid_Phenols',
'Proanthocyanins', 'Color_Intensity', 'Hue', 'OD280',
'Proline',
'Customer_Segment'],
dtype='object')

df.head(5)

Alcohol Malic_Acid Ash Ash_Alcanity Magnesium

Total_Phenols \
0 14.23 1.71 2.43 15.6 127 2.80

1 13.20 1.78 2.14 11.2 100 2.65

2 13.16 2.36 2.67 18.6 101 2.80

3 14.37 1.95 2.50 16.8 113 3.85

4 13.24 2.59 2.87 21.0 118 2.80

Flavanoids Nonflavanoid_Phenols Proanthocyanins Color_Intensity

Hue \
0 3.06 0.28 2.29 5.64
1.04
1 2.76 0.26 1.28 4.38
1.05
2 3.24 0.30 2.81 5.68
1.03
3 3.49 0.24 2.18 7.80
0.86
4 2.69 0.39 1.82 4.32
1.04

OD280 Proline Customer_Segment

0 3.92 1065 1
1 3.40 1050 1
2 3.17 1185 1
3 3.45 1480 1
4 2.93 735 1
df.Customer_Segment.unique()

array([1, 2, 3], dtype=int64)

print(df.isnull().sum())

Alcohol 0
Malic_Acid 0
Ash 0
Ash_Alcanity 0
Magnesium 0
Total_Phenols 0
Flavanoids 0
Nonflavanoid_Phenols 0
Proanthocyanins 0
Color_Intensity 0
Hue 0
OD280 0
Proline 0
Customer_Segment 0
dtype: int64

X = df.drop('Customer_Segment', axis=1) # Features

y = df['Customer_Segment'] # Target variable

for col in X.columns:

sc = StandardScaler() #Standardize features by removing the mean
and scaling to unit variance. z = (x - u) / s mean=0, Stddeviation=1
X[col] = sc.fit_transform(X[[col]]) #Fit to data, then transform
it.Compute the mean and std to be used for later scaling.

X.head(5)

Alcohol Malic_Acid Ash Ash_Alcanity Magnesium

Total_Phenols \
0 1.518613 -0.562250 0.232053 -1.169593 1.913905
0.808997
1 0.246290 -0.499413 -0.827996 -2.490847 0.018145
0.568648
2 0.196879 0.021231 1.109334 -0.268738 0.088358
0.808997
3 1.691550 -0.346811 0.487926 -0.809251 0.930918
2.491446
4 0.295700 0.227694 1.840403 0.451946 1.281985
0.808997

Flavanoids Nonflavanoid_Phenols Proanthocyanins Color_Intensity

\
0 1.034819 -0.659563 1.224884 0.251717

1 0.733629 -0.820719 -0.544721 -0.293321

2 1.215533 -0.498407 2.135968 0.269020

3 1.466525 -0.981875 1.032155 1.186068

4 0.663351 0.226796 0.401404 -0.319276

Hue OD280 Proline

0 0.362177 1.847920 1.013009
1 0.406051 1.113449 0.965242
2 0.318304 0.788587 1.395148
3 -0.427544 1.184071 2.334574
4 0.362177 0.449601 -0.037874

pca = PCA()
X_pca = pca.fit_transform(X)
explained_variance_ratio = pca.explained_variance_ratio_

plt.plot(range(1, len(explained_variance_ratio) + 1),

explained_variance_ratio.cumsum(), marker='o',
linestyle='--')
plt.xlabel('Number of Principal Components')
plt.ylabel('Cumulative Explained Variance')
plt.title('Explained Variance Ratio')
plt.show()
n_components = 12 # Choose the desired number of principal components
you want to reduce a dimension to
pca = PCA(n_components=n_components)
X_pca = pca.fit_transform(X)

X_pca.shape

(178, 12)

X.shape

(178, 13)

red_indices = y[y == 1].index

white_indices = y[y == 2].index

plt.scatter(X_pca[red_indices, 0], X_pca[red_indices, 1], c='red',

label='Red Wine')
plt.scatter(X_pca[white_indices, 0], X_pca[white_indices, 1],
c='blue', label='White Wine')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.legend()
plt.title('PCA: Red Wine vs. White Wine')
plt.show()

Data Mining - Wine Classification Assignment
No ratings yet
Data Mining - Wine Classification Assignment
66 pages
k_means_wine_clustering
No ratings yet
k_means_wine_clustering
3 pages
CODE
No ratings yet
CODE
7 pages
From Import Import As From Import From Import From Import Import Import From Import From Import From Import
No ratings yet
From Import Import As From Import From Import From Import Import Import From Import From Import From Import
3 pages
PCA Problem Statement With Answer
No ratings yet
PCA Problem Statement With Answer
22 pages
45B AIML Practical07 Clustering
No ratings yet
45B AIML Practical07 Clustering
8 pages
Wine
No ratings yet
Wine
22 pages
USL - 21070126112 - Colaboratory
No ratings yet
USL - 21070126112 - Colaboratory
3 pages
AS Notebook - PCA - Wine Data-4
100% (1)
AS Notebook - PCA - Wine Data-4
1 page
Water Portability Sunig R
No ratings yet
Water Portability Sunig R
4 pages
Assignment4 VidulGarg
No ratings yet
Assignment4 VidulGarg
14 pages
Exercise#9 Instructions 2021
No ratings yet
Exercise#9 Instructions 2021
5 pages
Empirical Crop Suitability Model 1694688954
No ratings yet
Empirical Crop Suitability Model 1694688954
24 pages
DST Python Code With Explanation
No ratings yet
DST Python Code With Explanation
9 pages
wine
No ratings yet
wine
15 pages
20BCE2126 ML Da 5
No ratings yet
20BCE2126 ML Da 5
3 pages
phần code r tới câu f của phần 4
No ratings yet
phần code r tới câu f của phần 4
9 pages
Wine DS
No ratings yet
Wine DS
14 pages
SUBQUERIES.docx
No ratings yet
SUBQUERIES.docx
8 pages
Scikit Learn1
No ratings yet
Scikit Learn1
4 pages
Name: Reg. No.: Lab Exercise:: Shivam Batra 19BPS1131
100% (1)
Name: Reg. No.: Lab Exercise:: Shivam Batra 19BPS1131
10 pages
EXP-15
No ratings yet
EXP-15
1 page
Quality Prediction
No ratings yet
Quality Prediction
20 pages
02-PCA
No ratings yet
02-PCA
14 pages
Coding An
No ratings yet
Coding An
19 pages
The Art of Effective Visualization of Multi-Dimensional Data
No ratings yet
The Art of Effective Visualization of Multi-Dimensional Data
51 pages
Kakora Column Graphs
No ratings yet
Kakora Column Graphs
6 pages
Wine Quality Prediction
No ratings yet
Wine Quality Prediction
6 pages
Pandas Usefull Code
No ratings yet
Pandas Usefull Code
2 pages
14-May - Jupyter Notebook
No ratings yet
14-May - Jupyter Notebook
15 pages
Cluster
No ratings yet
Cluster
3 pages
EDA RED WINE
No ratings yet
EDA RED WINE
16 pages
CODER
No ratings yet
CODER
18 pages
LightGBM - An In-Depth Guide Python
No ratings yet
LightGBM - An In-Depth Guide Python
26 pages
code R
No ratings yet
code R
3 pages
Grupo Turing - Processo Seletivo 2019.1: Exemplo de Análise de Dados - Red Wine Quality
No ratings yet
Grupo Turing - Processo Seletivo 2019.1: Exemplo de Análise de Dados - Red Wine Quality
7 pages
Data Science Libraries
No ratings yet
Data Science Libraries
4 pages
water_qualit… (2) - JupyterLab
No ratings yet
water_qualit… (2) - JupyterLab
10 pages
Mettler Toledo Application M624-2012: Determination of Peroxide Value in Edible Oils and Fats
No ratings yet
Mettler Toledo Application M624-2012: Determination of Peroxide Value in Edible Oils and Fats
6 pages
Mini Project Report
No ratings yet
Mini Project Report
12 pages
Practical 2 51
No ratings yet
Practical 2 51
5 pages
Code Analysis
No ratings yet
Code Analysis
6 pages
CatBoost - An In-Depth Guide Python
No ratings yet
CatBoost - An In-Depth Guide Python
33 pages
LAB-3
No ratings yet
LAB-3
3 pages
Project Data Mining (AMAN YADAV)
No ratings yet
Project Data Mining (AMAN YADAV)
12 pages
Descriptive Sensory Analysis in Different Classes of Orange Juice by A Robust Free-Choice Profile Method
No ratings yet
Descriptive Sensory Analysis in Different Classes of Orange Juice by A Robust Free-Choice Profile Method
10 pages
Machine Learning in Agriculture
No ratings yet
Machine Learning in Agriculture
29 pages
Content SL-101 FR-101 BF-101 RDR-101 WB-101 TDR-101 RDR-102 GR-101 GR-102 FP-101 RC-101 HX-101
No ratings yet
Content SL-101 FR-101 BF-101 RDR-101 WB-101 TDR-101 RDR-102 GR-101 GR-102 FP-101 RC-101 HX-101
1 page
Quality Prediction Checkpoint
No ratings yet
Quality Prediction Checkpoint
14 pages
Lab Assignment 10: Web Mining
No ratings yet
Lab Assignment 10: Web Mining
5 pages
Lab Assignment 10: Web Mining
No ratings yet
Lab Assignment 10: Web Mining
5 pages
Copy of File Code BTL
No ratings yet
Copy of File Code BTL
2 pages
Les Codes R
No ratings yet
Les Codes R
2 pages
vertopal.com_EDA
No ratings yet
vertopal.com_EDA
16 pages
PCA For Removal of Noise PCA For Removal of Noise: GC/MS Example
No ratings yet
PCA For Removal of Noise PCA For Removal of Noise: GC/MS Example
9 pages
Food Recommendation System
No ratings yet
Food Recommendation System
13 pages
Decision Trees
No ratings yet
Decision Trees
2 pages
Unsupervised ML
No ratings yet
Unsupervised ML
17 pages
Purification by Chromatography
No ratings yet
Purification by Chromatography
13 pages
The Data Science Workshop: A New, Interactive Approach to Learning Data Science
From Everand
The Data Science Workshop: A New, Interactive Approach to Learning Data Science
Anthony So
No ratings yet
Ces Eac
No ratings yet
Ces Eac
2 pages
BE EXTRA CLASSES Time Table
No ratings yet
BE EXTRA CLASSES Time Table
1 page
QAI Practical No. 1
No ratings yet
QAI Practical No. 1
1 page
Audit Course7 Report Format-1
No ratings yet
Audit Course7 Report Format-1
3 pages
CG Project +output PDF
No ratings yet
CG Project +output PDF
5 pages
TE Seminar Report Template 20 21 Sem II 3
No ratings yet
TE Seminar Report Template 20 21 Sem II 3
18 pages
Ticket Details: Gmail - Your DSC Jaipur Literature Festival Regist..
No ratings yet
Ticket Details: Gmail - Your DSC Jaipur Literature Festival Regist..
3 pages
Documentation_Practices_in_Agile_Software_Developm
No ratings yet
Documentation_Practices_in_Agile_Software_Developm
10 pages
Advanement Exam Review Sheet
No ratings yet
Advanement Exam Review Sheet
4 pages
Download ebooks file Clinical Bioinformatics 2nd Edition Ronald Trent (Eds.) all chapters
No ratings yet
Download ebooks file Clinical Bioinformatics 2nd Edition Ronald Trent (Eds.) all chapters
25 pages
Bbs Sump Pit
No ratings yet
Bbs Sump Pit
34 pages
Ashrae 62.1 and 90.1 Compliance
100% (1)
Ashrae 62.1 and 90.1 Compliance
18 pages
Pushbutton Relay Selector
No ratings yet
Pushbutton Relay Selector
2 pages
BCPL Training Report
100% (1)
BCPL Training Report
28 pages
FDS STEAMATE NA6520
No ratings yet
FDS STEAMATE NA6520
10 pages
Contextualizing Language - Building Language Awareness Modules 2 - 3
No ratings yet
Contextualizing Language - Building Language Awareness Modules 2 - 3
31 pages
02-knn Notes
No ratings yet
02-knn Notes
23 pages
SCED 404.04 Fall23
No ratings yet
SCED 404.04 Fall23
2 pages
Ward Patterson Final Report
No ratings yet
Ward Patterson Final Report
28 pages
Brochure
No ratings yet
Brochure
8 pages
10 Semi/ MM Subject - English L.L. Set - 1: Model Answer
No ratings yet
10 Semi/ MM Subject - English L.L. Set - 1: Model Answer
6 pages
Chemguard C335 3%x3% AR-AFFF Concentrate: Description
No ratings yet
Chemguard C335 3%x3% AR-AFFF Concentrate: Description
2 pages
1756 Um535 - en P
No ratings yet
1756 Um535 - en P
254 pages
50HE-3020 Waterjet Cutting Machine Specification
No ratings yet
50HE-3020 Waterjet Cutting Machine Specification
12 pages
Ents01b Reviewer
No ratings yet
Ents01b Reviewer
5 pages
Lecture2 - BS5-AIOU-01102024 - 241008 - 133418
No ratings yet
Lecture2 - BS5-AIOU-01102024 - 241008 - 133418
10 pages
Kia L. Steele: Intern
100% (1)
Kia L. Steele: Intern
1 page
Building-A-Successful-ESG-Strategy-A-Practical-Guide
No ratings yet
Building-A-Successful-ESG-Strategy-A-Practical-Guide
12 pages
Teks Story Telling Maling Kundang
No ratings yet
Teks Story Telling Maling Kundang
2 pages
Literature Review On Warehouse Receipt System
No ratings yet
Literature Review On Warehouse Receipt System
5 pages
[Ebooks PDF] download The Politics of New Immigrant Destinations Transatlantic Perspectives 1st Edition Stefanie Chambers (Editor) full chapters
No ratings yet
[Ebooks PDF] download The Politics of New Immigrant Destinations Transatlantic Perspectives 1st Edition Stefanie Chambers (Editor) full chapters
90 pages
1747-ASB Replacement PDF
No ratings yet
1747-ASB Replacement PDF
3 pages
Two Port Parameters
No ratings yet
Two Port Parameters
18 pages
Chapter 4: Leadership Training: Prof. Jason E. Cama
No ratings yet
Chapter 4: Leadership Training: Prof. Jason E. Cama
12 pages
1 Quantity Estimation (Foundation and Load Bearing Wall
No ratings yet
1 Quantity Estimation (Foundation and Load Bearing Wall
30 pages
Department of Education: Budget of Work (Bow) For Catch-Up Fridays (Cuf) Lesson Scripts
No ratings yet
Department of Education: Budget of Work (Bow) For Catch-Up Fridays (Cuf) Lesson Scripts
5 pages