Machine Learning Scikit Handson

The document covers hands-on exercises for various machine learning algorithms including preprocessing, classification, regression, clustering, and ensembles. It loads sample datasets, splits data into training and test sets, trains models, and evaluates performance. For each algorithm, it explores different parameters and evaluates their effect on model performance.

Uploaded by

Akshay Sharada Hanmant Suryawanshi

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (1 vote)

772 views

Machine Learning Scikit Handson

Uploaded by

Akshay Sharada Hanmant Suryawanshi

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 4

1st hands-on

import sklearn.datasets as skl

import sklearn.preprocessing as skp
import numpy as np
iris = skl.load_iris()
iris_normalized = skp.normalize(iris.data, norm='l2')
print(iris_normalized.mean(axis=0))

enc = skp.OneHotEncoder()
iris_target_onehot = enc.fit_transform(iris.target.reshape(-1, 1))
print(iris_target_onehot.toarray()[[0,50,100]])

iris.data[:50,:] = np.nan
iris_imputed = skp.Imputer(missing_values="NaN", strategy="mean", axis = 0)
iris_imputed = iris_imputed.fit(iris.data).transform(iris.data)
print(iris_imputed.mean(axis=0))

********************************************************************
2nd hands-on

import sklearn.datasets as datasets

from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

iris = datasets.load_iris()
X_train, X_test, Y_train, Y_test = train_test_split(iris.data, iris.target,
stratify=iris.target, random_state=30)

print(X_train.shape)
print(X_test.shape)

knn_clf = KNeighborsClassifier()
knn_clf = knn_clf.fit(X_train, Y_train)

print(knn_clf.score(X_train,Y_train))
print(knn_clf.score(X_test,Y_test))

ls = []
prev_score = 0
n_val = 0
for i in range(3,11):
knn_clf = KNeighborsClassifier(n_neighbors = i)
knn_clf = knn_clf.fit(X_train, Y_train)
score = knn_clf.score(X_test,Y_test)
if prev_score<=score:
prev_score = score
n_val = i
print(n_val)

*****************************Desicion Tree*****************************

import sklearn.datasets as datasets

from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor
import numpy as np

np.random.seed(100)
boston = datasets.load_boston()
X_train, X_test, Y_train, Y_test = train_test_split(boston.data, boston.target,
random_state=30)
print(X_train.shape)
print(X_test.shape)

dt_reg = DecisionTreeRegressor()
dt_reg = dt_reg.fit(X_train, Y_train)
print(dt_reg.score(X_train,Y_train))
print(dt_reg.score(X_test,Y_test))
y_pred = dt_reg.predict(X_test[:2])
print(y_pred)

myList = list(range(2,5))
scores =[]
for i in myList:
dt_reg = DecisionTreeRegressor(max_depth=i)
dt_reg.fit(X_train,Y_train)
scores.append(dt_reg.score(X_test, Y_test))
print(myList[scores.index(max(scores))])

*****************************SVM*****************************

import sklearn.datasets as datasets

from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
import sklearn.preprocessing as preprocessing

digits = datasets.load_digits()
X = digits.data
y = digits.target

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=30,

stratify=y)

print(X_train.shape)
print(X_test.shape)

svm_clf = SVC().fit(X_train, y_train)

print(svm_clf.score(X_test,y_test))

standardizer = preprocessing.StandardScaler()
standardizer = standardizer.fit(digits.data)
digits_standardized = standardizer.transform(digits.data)
X = digits_standardized
y = digits.target
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=30,
stratify=y)
svm_clf2 = SVC().fit(X_train, y_train)
print(svm_clf2.score(X_test,y_test))

*****************************Ensemble*****************************
import sklearn.datasets as datasets
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
import numpy as np

np.random.seed(100)
max_depth = range(3,5)
boston = datasets.load_boston()
X_train, X_test, Y_train, Y_test = train_test_split(boston.data, boston.target,
random_state=30)
print(X_train.shape)
print(X_test.shape)

rf_reg = RandomForestRegressor()
rf_reg = rf_reg.fit(X_train, Y_train)
print(rf_reg.score(X_train,Y_train))
print(rf_reg.score(X_test,Y_test))
y_pred = rf_reg.predict(X_test[:2])
print(y_pred)

a = [3,4,5]
b = [50,100,200]
score = []

for i in range(3):
rf_reg = RandomForestRegressor(n_estimators=b[i], max_depth=a[i])
rf_reg = rf_reg.fit(X_train, Y_train)
score.append(rf_reg.score(X_test,Y_test))
print(max(score))
print(tuple([5,100]))

*****************************Clustering *****************************

import sklearn.datasets as datasets

from sklearn.cluster import KMeans
from sklearn import metrics
from sklearn.model_selection import train_test_split
from sklearn.cluster import AgglomerativeClustering
from sklearn.metrics import homogeneity_score
from sklearn.cluster import AffinityPropagation
iris = datasets.load_iris()
X_train, X_test, Y_train, Y_test = train_test_split(iris.data, iris.target,
stratify=iris.target, random_state=30)

km_cls= KMeans(n_clusters=3)
km_cls = km_cls.fit(X_train)
km_cls.predict(X_test)
print(metrics.homogeneity_score(km_cls.predict(X_test), Y_test))

agg_cls= AgglomerativeClustering(n_clusters=3)
agg_cls = agg_cls.fit(X_train)
agg_cls.fit_predict(X_test)
print(metrics.homogeneity_score(agg_cls.fit_predict(X_test), Y_test))

af_cls= AffinityPropagation()
af_cls = af_cls.fit(X_train)
af_cls.fit_predict(X_test)
print(metrics.homogeneity_score(af_cls.fit_predict(X_test), Y_test))

Final - DNN - Hands - On - Jupyter Notebook
25% (8)
Final - DNN - Hands - On - Jupyter Notebook
8 pages
Exercise - Descriptive Statistics - Fresco
100% (1)
Exercise - Descriptive Statistics - Fresco
1 page
Fresco Play Course Detail
50% (4)
Fresco Play Course Detail
4 pages
Hands On Data Visualization Using Matplotlib
100% (1)
Hands On Data Visualization Using Matplotlib
7 pages
R Basics
88% (8)
R Basics
8 pages
Stats With Python
75% (4)
Stats With Python
4 pages
CNN Numpy 1st Handson
100% (1)
CNN Numpy 1st Handson
5 pages
In This Hands-On You Will Be Performing CNN Operations Using Tensorflow Package
No ratings yet
In This Hands-On You Will Be Performing CNN Operations Using Tensorflow Package
6 pages
AdvanceTS1handson - Jupyter Notebook
100% (2)
AdvanceTS1handson - Jupyter Notebook
3 pages
Fresco
100% (2)
Fresco
17 pages
DNN Handson
No ratings yet
DNN Handson
2 pages
Final - DNN - Hands - On - Jupyter Notebook
0% (1)
Final - DNN - Hands - On - Jupyter Notebook
6 pages
Unstructtured Data Classification Fresco
100% (1)
Unstructtured Data Classification Fresco
4 pages
Import As From Import Import: Problem 1
100% (1)
Import As From Import Import: Problem 1
5 pages
Image Processing
No ratings yet
Image Processing
5 pages
Association Rule Mining-Hands - On
39% (23)
Association Rule Mining-Hands - On
4 pages
DATAbase Connectivity
100% (2)
DATAbase Connectivity
4 pages
Finally Matplotlib MCQ Mil Gya
0% (1)
Finally Matplotlib MCQ Mil Gya
4 pages
Stat
No ratings yet
Stat
5 pages
R Handson
100% (3)
R Handson
3 pages
Spark SQL Hands - On
No ratings yet
Spark SQL Hands - On
3 pages
Python List Handson 1
No ratings yet
Python List Handson 1
2 pages
This Study Resource Was
No ratings yet
This Study Resource Was
6 pages
Modules 1
No ratings yet
Modules 1
9 pages
Future of Travel 2040
No ratings yet
Future of Travel 2040
46 pages
Basics of Statistics and Probability - FP: Statistical Measures
No ratings yet
Basics of Statistics and Probability - FP: Statistical Measures
12 pages
This Study Resource Was
No ratings yet
This Study Resource Was
4 pages
Num Py
No ratings yet
Num Py
20 pages
Regression Analysis - Notes
No ratings yet
Regression Analysis - Notes
3 pages
Unstructured Data Classification
No ratings yet
Unstructured Data Classification
2 pages
Stat 2
No ratings yet
Stat 2
3 pages
NumPy - Python Package For Data
No ratings yet
NumPy - Python Package For Data
3 pages
Unstructured
No ratings yet
Unstructured
37 pages
Data Visualization New
No ratings yet
Data Visualization New
3 pages
MLR-handson - Jupyter Notebook
No ratings yet
MLR-handson - Jupyter Notebook
5 pages
Python 3 Application Programming
100% (1)
Python 3 Application Programming
12 pages
Numpy - Python Package For Data
No ratings yet
Numpy - Python Package For Data
9 pages
Python Qualis
No ratings yet
Python Qualis
6 pages
Python Matplotlib Hands On
100% (1)
Python Matplotlib Hands On
6 pages
New Text Document
No ratings yet
New Text Document
10 pages
Context Manager 1
No ratings yet
Context Manager 1
1 page
Tensor Flow
No ratings yet
Tensor Flow
2 pages
Rsa
No ratings yet
Rsa
2 pages
Redux Async
No ratings yet
Redux Async
3 pages
Python 3 Programming
No ratings yet
Python 3 Programming
3 pages
Abstract Class 1
No ratings yet
Abstract Class 1
1 page
Hands On Python Qualis Pytest
No ratings yet
Hands On Python Qualis Pytest
7 pages
This Study Resource Was: Artificial Intelligence
No ratings yet
This Study Resource Was: Artificial Intelligence
4 pages
Python TCS
0% (1)
Python TCS
6 pages
Class N Static
No ratings yet
Class N Static
5 pages
Python Pandas MCQs
No ratings yet
Python Pandas MCQs
7 pages
Python 3 Functions and OOPs
No ratings yet
Python 3 Functions and OOPs
7 pages
Nodejs Mock Test III
No ratings yet
Nodejs Mock Test III
6 pages
Azure ML Fresco - Toaz - Info
No ratings yet
Azure ML Fresco - Toaz - Info
28 pages
Machine Learning Scikit Handson
No ratings yet
Machine Learning Scikit Handson
4 pages
Scikit
No ratings yet
Scikit
4 pages
Classification Review
No ratings yet
Classification Review
8 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
Machine Learning Practical PDF
No ratings yet
Machine Learning Practical PDF
12 pages
PCA Codebase
No ratings yet
PCA Codebase
6 pages
LAB-4 Report
No ratings yet
LAB-4 Report
21 pages
Deep Learning Unit1
No ratings yet
Deep Learning Unit1
63 pages
Air Power in 21st Cent (Agni)
No ratings yet
Air Power in 21st Cent (Agni)
18 pages
Tamil Nadu Ethical AI Policy 2020
No ratings yet
Tamil Nadu Ethical AI Policy 2020
48 pages
Lec16 - Autoencoders
No ratings yet
Lec16 - Autoencoders
18 pages
Marda 2018 Artificial Intelligence Policy in India A Framework For Engaging The Limits of Data Driven Decision Making
No ratings yet
Marda 2018 Artificial Intelligence Policy in India A Framework For Engaging The Limits of Data Driven Decision Making
19 pages
Role of Artificial Intelligence in A Digital Society: Future Prospect of Bangladesh
No ratings yet
Role of Artificial Intelligence in A Digital Society: Future Prospect of Bangladesh
15 pages
Efficient Hardware Architectures For Accelerating Deep Neural Networks Survey
No ratings yet
Efficient Hardware Architectures For Accelerating Deep Neural Networks Survey
41 pages
Literature Survey
No ratings yet
Literature Survey
3 pages
Ca-3 QB (Pec-It602b) - 2024-1
No ratings yet
Ca-3 QB (Pec-It602b) - 2024-1
12 pages
02 K-Means
No ratings yet
02 K-Means
25 pages
Ijst 2023 2979
No ratings yet
Ijst 2023 2979
12 pages
References
No ratings yet
References
21 pages
Computer Oxford Practical 7th Grade
No ratings yet
Computer Oxford Practical 7th Grade
2 pages
IQX 330 The Values of Technology
No ratings yet
IQX 330 The Values of Technology
2 pages
Towards Cognitive Autonomous Networks Network Management Automation For 5G and Beyond 1st Edition Stephen S Mwanje Editor Christian Mannweiler Editor
100% (4)
Towards Cognitive Autonomous Networks Network Management Automation For 5G and Beyond 1st Edition Stephen S Mwanje Editor Christian Mannweiler Editor
49 pages
AAAI-22 Special Track On AI For Social Impact - AAAI 2022 Conference
No ratings yet
AAAI-22 Special Track On AI For Social Impact - AAAI 2022 Conference
5 pages
SW Agent
No ratings yet
SW Agent
49 pages
ISG reply
No ratings yet
ISG reply
9 pages
BUSA3015 2023 S1 Report 2
No ratings yet
BUSA3015 2023 S1 Report 2
9 pages
VIT Online Learning (VITOL) Institute Summer Online Courses Internal Assessment Schedule
No ratings yet
VIT Online Learning (VITOL) Institute Summer Online Courses Internal Assessment Schedule
1 page
Oracle Questions
No ratings yet
Oracle Questions
11 pages
How Can Analytics and Data Science Leverage Machine Learning in Future - Swaraj - MDI
No ratings yet
How Can Analytics and Data Science Leverage Machine Learning in Future - Swaraj - MDI
7 pages
Classify Uppercase Letters and Lowercase Letters Using Perceptron Network
No ratings yet
Classify Uppercase Letters and Lowercase Letters Using Perceptron Network
6 pages
Domain Generalization Via Aggregation and Separation For Audio Deepfake Detection
No ratings yet
Domain Generalization Via Aggregation and Separation For Audio Deepfake Detection
15 pages
1 s2.0 S0039625722001163 Main
No ratings yet
1 s2.0 S0039625722001163 Main
25 pages
Random Forest Presentation
No ratings yet
Random Forest Presentation
37 pages
DataMind AI 2023
No ratings yet
DataMind AI 2023
4 pages
Monash University Indonesia Inspire Doctoral Scholarship Program
No ratings yet
Monash University Indonesia Inspire Doctoral Scholarship Program
6 pages
Deep Learning: Book Review
No ratings yet
Deep Learning: Book Review
4 pages