0% found this document useful (0 votes)

11 views

Lab - 8 - 21130616 - TranThanhVu - Ipynb - Colab

The main aim of this lab is to apply machine learning pipelines and the MultilayerPerceptron algorithm to various datasets. Several tasks are completed including applying pipelines to the iris dataset, tuning a MultilayerPerceptron model on a fashion dataset using GridSearchCV, and comparing model performance on breast cancer data.

Uploaded by

nguyennhutoan722003

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views

Lab - 8 - 21130616 - TranThanhVu - Ipynb - Colab

Uploaded by

nguyennhutoan722003

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

06/05/2024, 23:54 Lab_8_21130616_TranThanhVu.

ipynb - Colab

The main aim of this lab is to deal with the pipeline technique and MultilayerPerceptron algorithm

keyboard_arrow_down Import libraries

from sklearn.pipeline import Pipeline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.impute import SimpleImputer
from sklearn import preprocessing
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression,LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn import metrics
from prettytable import PrettyTable
from sklearn import svm, datasets
from sklearn.feature_selection import SelectKBest, chi2
from sklearn.model_selection import GridSearchCV
from sklearn import set_config
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import f1_score
from sklearn.metrics import recall_score
from sklearn.neural_network import MLPClassifier

from google.colab import drive

drive.mount('/content/gdrive')
%cd '/content/gdrive/MyDrive/ML_Data/lab6'

Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).
/content/gdrive/MyDrive/ML_Data/lab6

keyboard_arrow_down Task 1. With iris dataset

Apply pipeline including preprocessing steps (i.e., StandardScaler, SimpleImputer, feature selection, KBinsDiscretizer, …) and
classification algorithms (i.e., Random forest, kNN, Naïve Bayes).

map = {
'clf': RandomForestClassifier(),
'kNN': KNeighborsClassifier(),

}
data = datasets.load_iris()
X,y = data.data, data.target
# y = data.target
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.3,random_state=42)
for name,al in map.items():
pipe_lr = Pipeline([('scl', StandardScaler()),('si', SimpleImputer(strategy='mean')),(name, al)])
pipe_lr.fit(X_train, y_train)
# predict the X_test
y_pred=pipe_lr.predict(X_test)
# get accuracy of the trained model
print(pipe_lr.score(X_test, y_test))
# or using accuracy_score from metrics
print(accuracy_score(y_test, y_pred))

1.0
1.0
1.0
1.0

https://colab.research.google.com/drive/1lh4gnwJbiX5zT9aSW6j345ZU5R_-64hF?hl=vi#printMode=true 1/4
06/05/2024, 23:54 Lab_8_21130616_TranThanhVu.ipynb - Colab

keyboard_arrow_down Task 2. With fashion dataset

2.1. Apply MultilayerPerceptron classification with 1 hidden layer having 10 nodes

train = pd.read_csv('fashion_train.csv')
test = pd.read_csv('fashion_test.csv')

X_train = train.drop(columns = "y")

y_train = train[["y"]]
X_test = test.drop(columns = "y")
y_test = test[["y"]]

clf = MLPClassifier(solver='lbfgs', alpha=1e-5,

hidden_layer_sizes=(10), random_state=1,activation='tanh',max_iter = 1000)
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
accuracy_score(y_test, y_pred)

/usr/local/lib/python3.10/dist-packages/sklearn/neural_network/_multilayer_perceptron.py:1098: DataConversionWarning: A column-vector y

y = column_or_1d(y, warn=True)
/usr/local/lib/python3.10/dist-packages/sklearn/neural_network/_multilayer_perceptron.py:541: ConvergenceWarning: lbfgs failed to conver
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
https://scikit-learn.org/stable/modules/preprocessing.html
self.n_iter_ = _check_optimize_result("lbfgs", opt_res, self.max_iter)
0.522

2.2. Apply MultilayerPerceptron algorithm with the following settings (the first hidden layer has 250 neuron, the second one has 100
neurons).

# code
clf = MLPClassifier(solver='lbfgs', alpha=1e-5,
hidden_layer_sizes=(250,100), random_state=1,activation='tanh',max_iter = 1000)
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
accuracy_score(y_test, y_pred)

/usr/local/lib/python3.10/dist-packages/sklearn/neural_network/_multilayer_perceptron.py:1098: DataConversionWarning: A column-vector y

y = column_or_1d(y, warn=True)
0.784

2.3. Find the best hyperparameters using GridSearchCV

#code
param_grid = {
'hidden_layer_sizes': [(150,100,50), (120,80,40), (100,50,30)],
'max_iter': [50, 100, 150],
'activation': ['tanh', 'relu'],
'solver': ['sgd', 'adam'],
# 'alpha': [0.0001, 0.05],
# 'learning_rate': ['constant','adaptive'],
}
clf = MLPClassifier()
#n_jobs=-1: means using all processors
grid = GridSearchCV(estimator=clf,param_grid= param_grid, n_jobs= 2, cv=5)
grid.fit(X_train, y_train)
grid.predict(X_test)
print(grid.best_params_)
# grid_predictions = grid.predict(testX_scaled)

/usr/local/lib/python3.10/dist-packages/sklearn/neural_network/_multilayer_perceptron.py:1098: DataConversionWarning: A column-vector y

y = column_or_1d(y, warn=True)
{'activation': 'relu', 'hidden_layer_sizes': (150, 100, 50), 'max_iter': 50, 'solver': 'adam'}
/usr/local/lib/python3.10/dist-packages/sklearn/neural_network/_multilayer_perceptron.py:686: ConvergenceWarning: Stochastic Optimizer:
warnings.warn(

https://colab.research.google.com/drive/1lh4gnwJbiX5zT9aSW6j345ZU5R_-64hF?hl=vi#printMode=true 2/4
06/05/2024, 23:54 Lab_8_21130616_TranThanhVu.ipynb - Colab

2.4. Compare the MultilayerPerceptron using the best hyperparameters in 2.3 and other classification algorithms (i.e., Random forest,
kNN, Naïve Bayes) in termns of accuracy, precision, recall, and F1

table2 = PrettyTable(["algo","Accuracy","Precision","Recall","F1"])
table2.add_row(getScore(RandomForestClassifier(),RandomForestClassifier(),X_train,X_test,y_train.values.ravel(),y_test.values.ravel()))
table2.add_row(getScore(KNeighborsClassifier(),KNeighborsClassifier(),X_train,X_test,y_train.values.ravel(),y_test.values.ravel()))
table2.add_row(getScore(GaussianNB(),GaussianNB(),X_train,X_test,y_train.values.ravel(),y_test.values.ravel()))
table2.add_row(getScore(grid_fashion,grid_fashion.best_estimator_,X_train,X_test,y_train.values.ravel(),y_test.values.ravel(),fit=False))
print(table2)

+--------------------------------------------------------------------------------+----------+---------------------+---------------------
| algo | Accuracy | Precision | Recall
+--------------------------------------------------------------------------------+----------+---------------------+---------------------
| RandomForestClassifier() | 0.472 | 0.5078111784127922 | 0.46880913502793514
| KNeighborsClassifier() | 0.516 | 0.541269501536488 | 0.5154440130909421
| GaussianNB() | 0.175 | 0.069421918767507 | 0.16362223756303312
| MLPClassifier(activation='tanh', hidden_layer_sizes=(100, 50), max_iter=10000) | 0.391 | 0.40307983346332776 | 0.3904590904545075
+--------------------------------------------------------------------------------+----------+---------------------+---------------------
/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344: UndefinedMetricWarning: Precision is ill-defined and be
_warn_prf(average, modifier, msg_start, len(result))
/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344: UndefinedMetricWarning: Precision is ill-defined and be
_warn_prf(average, modifier, msg_start, len(result))
/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344: UndefinedMetricWarning: Precision is ill-defined and be
_warn_prf(average, modifier, msg_start, len(result))

keyboard_arrow_down Task 3. With breast cancer dataset

3.1. Apply GridSearchCV to MultilayperPerceptron to find the best hyperparameters (the setting of hyperparameters chosen by students)

canncer = datasets.load_breast_cancer()
X = canncer.data
y = canncer.target
X = SelectKBest(chi2,k=10).fit_transform(X,y)
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2)

param_grid = {
'hidden_layer_sizes': [(100,50), (100,60,20), (100,)],
'activation': ['tanh', 'relu'],
}
grid_cancer = GridSearchCV(estimator=MLPClassifier(max_iter=10000),param_grid=param_grid,n_jobs=-1)
grid_cancer.fit(X_train,y_train)
grid_cancer.best_estimator_

▾ MLPClassifier
MLPClassifier(activation='tanh', hidden_layer_sizes=(100, 60, 20),
max_iter=10000)

3.2. Compare the MultilayerPerceptron using the best hyperparameters in 3.1) and other classification algorithms (i.e., Random forest,
kNN, Naïve Bayes) in termns of accuracy, precision, recall, and F1

table3 = PrettyTable(["algo","Accuracy","Precision","Recall","F1"])
table3.add_row(getScore(RandomForestClassifier(),RandomForestClassifier(),X_train,X_test,y_train,y_test))
table3.add_row(getScore(KNeighborsClassifier(),KNeighborsClassifier(),X_train,X_test,y_train,y_test))
table3.add_row(getScore(GaussianNB(),GaussianNB(),X_train,X_test,y_train,y_test))
table3.add_row(getScore(grid_cancer,grid_cancer.best_estimator_,X_train,X_test,y_train,y_test,fit=False))
print(table3)

+--------------------------------------------------------------------+--------------------+--------------------+--------------------+---
| algo | Accuracy | Precision | Recall |
+--------------------------------------------------------------------+--------------------+--------------------+--------------------+---
| RandomForestClassifier() | 0.956140350877193 | 0.9603978300180831 | 0.9407894736842105 | 0.
| KNeighborsClassifier() | 0.956140350877193 | 0.9534924534924535 | 0.9473684210526316 | 0.
| GaussianNB() | 0.9473684210526315 | 0.9634146341463414 | 0.9210526315789473 | 0.
| MLPClassifier(activation='tanh', hidden_layer_sizes=(100, 60, 20), | 0.9122807017543859 | 0.9013157894736843 | 0.9013157894736843 | 0.
| max_iter=10000) | | | |
+--------------------------------------------------------------------+--------------------+--------------------+--------------------+---

https://colab.research.google.com/drive/1lh4gnwJbiX5zT9aSW6j345ZU5R_-64hF?hl=vi#printMode=true 3/4
06/05/2024, 23:54 Lab_8_21130616_TranThanhVu.ipynb - Colab

keyboard_arrow_down Task 4. With mobile price classification dataset

4.1. Build your own Neural Network using MultilayerPerceptron

mobile = pd.read_csv("mobile.csv")
X = mobile.drop(columns="price_range")
y = mobile[["price_range"]]
X = SelectKBest(chi2,k=10).fit_transform(X,y)
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2)
myMLP = MLPClassifier(max_iter=10000,hidden_layer_sizes=(200,100,20))
myMLP.fit(X_train,y_train)
table4 = PrettyTable(["algo","Accuracy","Precision","Recall","F1"])
table4.add_row(getScore(myMLP,myMLP,X_train,X_test,y_train,y_test,fit=False))
print(table4)

/usr/local/lib/python3.10/dist-packages/sklearn/neural_network/_multilayer_perceptron.py:1098: DataConversionWarning: A column-vector y

y = column_or_1d(y, warn=True)
+------------------------------------------------------------------+----------+--------------------+---------------------+--------------
| algo | Accuracy | Precision | Recall | F1
+------------------------------------------------------------------+----------+--------------------+---------------------+--------------
| MLPClassifier(hidden_layer_sizes=(200, 100, 20), max_iter=10000) | 0.4725 | 0.4774781648910644 | 0.45940853897375633 | 0.38861867595
+------------------------------------------------------------------+----------+--------------------+---------------------+--------------
/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344: UndefinedMetricWarning: Precision is ill-defined and be
_warn_prf(average, modifier, msg_start, len(result))

4.2. Apply GridSearchCV to MultilayperPerceptron to find the best hyperparameters (the setting of hyperparameters chosen by students)

grid_moblie = GridSearchCV(estimator=MLPClassifier(max_iter=10000),param_grid=param_grid,n_jobs=-1)
grid_moblie.fit(X_train,y_train.values.ravel())
grid_moblie.best_estimator_

▾ MLPClassifier
MLPClassifier(activation='tanh', max_iter=10000)

Finally,
Save a copy in your Github. Remember renaming the notebook.

https://colab.research.google.com/drive/1lh4gnwJbiX5zT9aSW6j345ZU5R_-64hF?hl=vi#printMode=true 4/4

Stahl's Essential Psychopharmacology: Neuroscientific Basis and Practical Applications, Third Edition
0% (1)
Stahl's Essential Psychopharmacology: Neuroscientific Basis and Practical Applications, Third Edition
2 pages
Lab - 8 - 21130568 - NguyenNhuToan - Ipynb - Colab
No ratings yet
Lab - 8 - 21130568 - NguyenNhuToan - Ipynb - Colab
4 pages
Amazing Java: Learn Java Quickly
From Everand
Amazing Java: Learn Java Quickly
Andrei Besedin
No ratings yet
Practicals 1 to
No ratings yet
Practicals 1 to
5 pages
DNN ALL Practical 28
No ratings yet
DNN ALL Practical 28
34 pages
command_classifier
No ratings yet
command_classifier
4 pages
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
From Everand
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
Kanto
No ratings yet
Tushar ML
No ratings yet
Tushar ML
52 pages
AIML 7 To 11
No ratings yet
AIML 7 To 11
7 pages
Programming Questions
No ratings yet
Programming Questions
5 pages
DLP Lab
No ratings yet
DLP Lab
81 pages
AI Lab M.Tech
No ratings yet
AI Lab M.Tech
29 pages
Shaurya DL file
No ratings yet
Shaurya DL file
75 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet
deep learning
No ratings yet
deep learning
13 pages
Advanced Deep Learning Practical File
No ratings yet
Advanced Deep Learning Practical File
29 pages
DL_Lab_12212039
No ratings yet
DL_Lab_12212039
72 pages
Deep Learning Perceptron
No ratings yet
Deep Learning Perceptron
10 pages
ML_Industry_Lab_File_With_Code_and_IO
No ratings yet
ML_Industry_Lab_File_With_Code_and_IO
8 pages
Deep Learning With Tensorflow
No ratings yet
Deep Learning With Tensorflow
15 pages
exp 5 (1)
No ratings yet
exp 5 (1)
9 pages
AI Manual
No ratings yet
AI Manual
69 pages
Exp 1_Exp 2_Exp 3_merged
No ratings yet
Exp 1_Exp 2_Exp 3_merged
9 pages
MCS-011: Problem Solving and Programming
From Everand
MCS-011: Problem Solving and Programming
Dr. DK Sukhani
No ratings yet
Deep Learning
No ratings yet
Deep Learning
46 pages
Ritik DL
No ratings yet
Ritik DL
17 pages
AML Programs
No ratings yet
AML Programs
13 pages
Deep Learning With Python File
No ratings yet
Deep Learning With Python File
22 pages
amll
No ratings yet
amll
1 page
Transform
No ratings yet
Transform
1 page
DEEP LEARNING EXPERIMENTS
No ratings yet
DEEP LEARNING EXPERIMENTS
42 pages
ML 1
No ratings yet
ML 1
6 pages
ML Priyesha - 778
No ratings yet
ML Priyesha - 778
23 pages
Spec Alm
No ratings yet
Spec Alm
15 pages
DL Lab Manual
100% (1)
DL Lab Manual
35 pages
DL Practical
No ratings yet
DL Practical
14 pages
ML LAB 146
No ratings yet
ML LAB 146
50 pages
Deep Learning Practical
No ratings yet
Deep Learning Practical
12 pages
DEEP LEARNING TECHNIQUES: CLUSTER ANALYSIS and PATTERN RECOGNITION with NEURAL NETWORKS. Examples with MATLAB
From Everand
DEEP LEARNING TECHNIQUES: CLUSTER ANALYSIS and PATTERN RECOGNITION with NEURAL NETWORKS. Examples with MATLAB
César Pérez López
No ratings yet
Cover Page
No ratings yet
Cover Page
11 pages
Introduction to PHP, Part 2, Second Edition
From Everand
Introduction to PHP, Part 2, Second Edition
Adam Majczak
No ratings yet
ML Recommndations
No ratings yet
ML Recommndations
6 pages
Deep Learning
No ratings yet
Deep Learning
43 pages
12212159
No ratings yet
12212159
59 pages
DM Practical File
No ratings yet
DM Practical File
21 pages
Week_2
No ratings yet
Week_2
17 pages
Assignment-1
No ratings yet
Assignment-1
2 pages
WDM - Week - I
No ratings yet
WDM - Week - I
24 pages
dl_5
No ratings yet
dl_5
7 pages
Backpropagation: Fundamentals and Applications for Preparing Data for Training in Deep Learning
From Everand
Backpropagation: Fundamentals and Applications for Preparing Data for Training in Deep Learning
Fouad Sabry
No ratings yet
Pythonfile
No ratings yet
Pythonfile
36 pages
NNDL Lab Record
No ratings yet
NNDL Lab Record
26 pages
Lab Manual-MLT (1)
No ratings yet
Lab Manual-MLT (1)
42 pages
Notebook - Main Code
No ratings yet
Notebook - Main Code
4 pages
IT,HARDWARE_EXP1[1]
No ratings yet
IT,HARDWARE_EXP1[1]
10 pages
Python Advanced Programming: The Guide to Learn Python Programming. Reference with Exercises and Samples About Dynamical Programming, Multithreading, Multiprocessing, Debugging, Testing and More
From Everand
Python Advanced Programming: The Guide to Learn Python Programming. Reference with Exercises and Samples About Dynamical Programming, Multithreading, Multiprocessing, Debugging, Testing and More
Marcus Richards
No ratings yet
MLP - Week 5 - MNIST - Perceptron - Ipynb - Colaboratory
No ratings yet
MLP - Week 5 - MNIST - Perceptron - Ipynb - Colaboratory
31 pages
dl_3
No ratings yet
dl_3
5 pages
ML 4 To 9 Keyur
No ratings yet
ML 4 To 9 Keyur
21 pages
Synopsis Amity University Mba
No ratings yet
Synopsis Amity University Mba
6 pages
MDL 5 - Assignment
No ratings yet
MDL 5 - Assignment
5 pages
Meaning and Relevance of History: College of Allied Health Sciences Batch 2024
100% (1)
Meaning and Relevance of History: College of Allied Health Sciences Batch 2024
19 pages
CV Updated
No ratings yet
CV Updated
6 pages
Case Study Identification
No ratings yet
Case Study Identification
9 pages
Insight Paper About Laos
No ratings yet
Insight Paper About Laos
2 pages
Sample Literature Review Summary Table
100% (2)
Sample Literature Review Summary Table
7 pages
Department of Civil Engineering, IIT Delhi CVL 742: Traffic Engineering Problem Set 2: Traffic Stream Characteristics Problem 1
No ratings yet
Department of Civil Engineering, IIT Delhi CVL 742: Traffic Engineering Problem Set 2: Traffic Stream Characteristics Problem 1
1 page
Chronological History of Wind Turbine Technology
No ratings yet
Chronological History of Wind Turbine Technology
2 pages
A List of CMM 5
No ratings yet
A List of CMM 5
3 pages
Talkabout T4500 PDF
No ratings yet
Talkabout T4500 PDF
20 pages
The Dawn of The Human Machine Era A Forecast Report 2021
No ratings yet
The Dawn of The Human Machine Era A Forecast Report 2021
78 pages
DX Diag
No ratings yet
DX Diag
27 pages
Qian Et Al 2024 Rapid Single Particle Chemical Imaging of Nanoplastics by Srs Micros
No ratings yet
Qian Et Al 2024 Rapid Single Particle Chemical Imaging of Nanoplastics by Srs Micros
12 pages
Market Penetration Strategy of Smartphone Companies From China For India Market: A Multiple-Case Study
No ratings yet
Market Penetration Strategy of Smartphone Companies From China For India Market: A Multiple-Case Study
7 pages
6 Diphtheria
No ratings yet
6 Diphtheria
63 pages
The Hobbit 2
No ratings yet
The Hobbit 2
10 pages
HTTP 1
No ratings yet
HTTP 1
896 pages
Topic 02 A Brief History of Microbiology
No ratings yet
Topic 02 A Brief History of Microbiology
4 pages
H Calculations - Enthalpy of Solution
No ratings yet
H Calculations - Enthalpy of Solution
3 pages
CV - Ahmad A Borazan 1
No ratings yet
CV - Ahmad A Borazan 1
3 pages
Department of Mechanical Engineering: List of Experiments Hvac Lab
No ratings yet
Department of Mechanical Engineering: List of Experiments Hvac Lab
3 pages
The Role of Media in Language Standardization
100% (1)
The Role of Media in Language Standardization
14 pages
TRB Cookery
100% (1)
TRB Cookery
34 pages
Concept of Knowledge Management
No ratings yet
Concept of Knowledge Management
9 pages
2021 Mod Maths Specialist Complex Test
No ratings yet
2021 Mod Maths Specialist Complex Test
5 pages
Construction Stage Health and Safety Plan Template: Project Name: Sample Plan Company Name: Sample Safety
No ratings yet
Construction Stage Health and Safety Plan Template: Project Name: Sample Plan Company Name: Sample Safety
6 pages
Research Roadmap Ayurvedic Perspectives
No ratings yet
Research Roadmap Ayurvedic Perspectives
26 pages
Case Analysis El-Joy Garments
No ratings yet
Case Analysis El-Joy Garments
3 pages