ML program 7 ,8,9 and10

The document outlines multiple programs demonstrating various machine learning techniques including Linear Regression, Polynomial Regression, Decision Trees, Naive Bayes Classifier, and K-Means Clustering. Each program utilizes specific datasets such as the Boston Housing, Auto MPG, Breast Cancer, and Olivetti Face datasets to train models and evaluate their performance. The outputs include metrics like Mean Squared Error, R^2 Score, accuracy, confusion matrices, and visualizations of clustering results.

Uploaded by

snehahs957

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

62 views

ML program 7 ,8,9 and10

Uploaded by

snehahs957

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 12

7.

Develop a program to demonstrate the working of Linear Regression and Polynomial

Regression. Use Boston Housing Dataset for Linear Regression and Auto MPG Dataset
(for vehicle fuel efficiency prediction) for Polynomial Regression.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures, StandardScaler
from sklearn.pipeline import make_pipeline
from sklearn.metrics import mean_squared_error, r2_score
def linear_regression_california():
housing = fetch_california_housing(as_frame=True)
X = housing.data[["AveRooms"]]
y = housing.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
model = LinearRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
plt.scatter(X_test, y_test, color="blue", label="Actual")
plt.plot(X_test, y_pred, color="red", label="Predicted")
plt.xlabel("Average number of rooms (AveRooms)")
plt.ylabel("Median value of homes ($100,000)")
plt.title("Linear Regression - California Housing Dataset")
plt.legend()
plt.show()
print("Linear Regression - California Housing Dataset")
print("Mean Squared Error:", mean_squared_error(y_test, y_pred))
print("R^2 Score:", r2_score(y_test, y_pred))
def polynomial_regression_auto_mpg():
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data"
column_names = ["mpg", "cylinders", "displacement", "horsepower", "weight",
"acceleration", "model_year", "origin"]
data = pd.read_csv(url, sep='\s+', names=column_names, na_values="?")
data = data.dropna()
X = data["displacement"].values.reshape(-1, 1)
y = data["mpg"].values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
poly_model = make_pipeline(PolynomialFeatures(degree=2), StandardScaler(),
LinearRegression())
poly_model.fit(X_train, y_train)
y_pred = poly_model.predict(X_test)
plt.scatter(X_test, y_test, color="blue", label="Actual")
plt.scatter(X_test, y_pred, color="red", label="Predicted")
plt.xlabel("Displacement")
plt.ylabel("Miles per gallon (mpg)")
plt.title("Polynomial Regression - Auto MPG Dataset")
plt.legend()
plt.show()
print("Polynomial Regression - Auto MPG Dataset")
print("Mean Squared Error:", mean_squared_error(y_test, y_pred))
print("R^2 Score:", r2_score(y_test, y_pred))
if __name__ == "__main__":
print("Demonstrating Linear Regression and Polynomial Regression\n")
linear_regression_california()
polynomial_regression_auto_mpg()

OUTPUT:
Demonstrating Linear Regression and Polynomial Regression
Linear Regression - California Housing Dataset
Mean Squared Error: 1.2923314440807299
R^2 Score: 0.013795337532284901
Polynomial Regression - Auto MPG Dataset
Mean Squared Error: 0.743149055720586
R^2 Score: 0.7505650609469626
8. Develop a program to demonstrate the working of the decision tree algorithm. Use
Breast Cancer Data set for building the decision tree and apply this knowledge to
classify a new sample.
# Importing necessary libraries
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn import treedata = load_breast_cancer()
X = data.data
y = data.targetX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)accuracy = accuracy_score(y_test, y_pred)
print(f"Model Accuracy: {accuracy * 100:.2f}%")
new_sample = np.array([X_test[0]])
prediction = clf.predict(new_sample)prediction_class = "Benign" if prediction == 1 else
"Malignant"
print(f"Predicted Class for the new sample: {prediction_class}")plt.figure(figsize=(12,8))
tree.plot_tree(clf,filled=True,feature_names=data.feature_names,class_names=data.target_na
mes)
plt.title("Decision Tree - Breast Cancer Dataset")
plt.show()
OUTPUT:
9. Develop a program to implement the Naive Bayesian classifier considering Olivetti
Face Data set for training. Compute the accuracy of the classifier, considering a few test
data sets.
import numpy as np
from sklearn.datasets import fetch_olivetti_faces
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import matplotlib.pyplot as pltdata = fetch_olivetti_faces(shuffle=True, random_state=42)
X = data.data
y = data.targetX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
random_state=42)gnb = GaussianNB()
gnb.fit(X_train, y_train)
y_pred = gnb.predict(X_test)accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: {accuracy * 100:.2f}%')print("\nClassification Report:")
print(classification_report(y_test, y_pred, zero_division=1))print("\nConfusion Matrix:")
print(confusion_matrix(y_test, y_pred))cross_val_accuracy = cross_val_score(gnb, X, y,
cv=5, scoring='accuracy')
print(f'\nCross-validation accuracy: {cross_val_accuracy.mean() * 100:.2f}%')fig, axes =
plt.subplots(3, 5, figsize=(12, 8))
for ax, image, label, prediction in zip(axes.ravel(), X_test, y_test, y_pred):
ax.imshow(image.reshape(64, 64), cmap=plt.cm.gray)
ax.set_title(f"True: {label}, Pred: {prediction}")
ax.axis('off')plt.show()
Output:
Accuracy: 80.83%
Classification Report:
precision recall f1-score support
0 0.67 1.00 0.80 2
1 1.00 1.00 1.00 2
2 0.33 0.67 0.44 3
3 1.00 0.00 0.00 5
4 1.00 0.50 0.67 4
5 1.00 1.00 1.00 2
7 1.00 0.75 0.86 4
8 1.00 0.67 0.80 3
9 1.00 0.75 0.86 4
10 1.00 1.00 1.00 3
11 1.00 1.00 1.00 1
12 0.40 1.00 0.57 4
13 1.00 0.80 0.89 5
14 1.00 0.40 0.57 5
15 0.67 1.00 0.80 2
16 1.00 0.67 0.80 3
17 1.00 1.00 1.00 3
18 1.00 1.00 1.00 3
19 0.67 1.00 0.80 2
20 1.00 1.00 1.00 3
21 1.00 0.67 0.80 3
22 1.00 0.60 0.75 5
23 1.00 0.75 0.86 4
24 1.00 1.00 1.00 3
25 1.00 0.75 0.86 4
26 1.00 1.00 1.00 2
27 1.00 1.00 1.00 5
28 0.50 1.00 0.67 2
29 1.00 1.00 1.00 2
30 1.00 1.00 1.00 2
31 1.00 0.75 0.86 4
32 1.00 1.00 1.00 2
34 0.25 1.00 0.40 1
35 1.00 1.00 1.00 5
36 1.00 1.00 1.00 3
37 1.00 1.00 1.00 1
38 1.00 0.75 0.86 4
39 0.50 1.00 0.67 5accuracy 0.81 120
macro avg 0.89 0.85 0.83 120
weighted avg 0.91 0.81 0.81 120Confusion Matrix:
[[2 0 0 ... 0 0 0]
[0 2 0 ... 0 0 0]
[0 0 2 ... 0 0 1]
...
[0 0 0 ... 1 0 0]
[0 0 0 ... 0 3 0]
[0 0 0 ... 0 0 5]]
Cross-validation accuracy: 87.25%

10. Develop a program to implement k-means clustering using Wisconsin Breast Cancer data
set and visualize the clustering result.

PROGRAM:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_breast_cancer
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.metrics import confusion_matrix, classification_report
data = load_breast_cancer()
X = data.data
y = data.target
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
kmeans = KMeans(n_clusters=2, random_state=42)
y_kmeans = kmeans.fit_predict(X_scaled)
print("Confusion Matrix:")
print(confusion_matrix(y, y_kmeans))
print("\nClassification Report:")
print(classification_report(y, y_kmeans))
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_scaled)
df = pd.DataFrame(X_pca, columns=['PC1', 'PC2'])
df['Cluster'] = y_kmeans
df['True Label'] = y
plt.figure(figsize=(8, 6))
sns.scatterplot(data=df, x='PC1', y='PC2', hue='Cluster', palette='Set1', s=100,
edgecolor='black', alpha=0.7)
plt.title('K-Means Clustering of Breast Cancer Dataset')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.legend(title="Cluster")
plt.show()
plt.figure(figsize=(8, 6))
sns.scatterplot(data=df, x='PC1', y='PC2', hue='True Label', palette='coolwarm', s=100,
edgecolor='black', alpha=0.7)
plt.title('True Labels of Breast Cancer Dataset')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.legend(title="True Label")
plt.show()
plt.figure(figsize=(8, 6))
sns.scatterplot(data=df, x='PC1', y='PC2', hue='Cluster', palette='Set1', s=100,
edgecolor='black', alpha=0.7)
centers = pca.transform(kmeans.cluster_centers_)
plt.scatter(centers[:, 0], centers[:, 1], s=200, c='red', marker='X', label='Centroids')
plt.title('K-Means Clustering with Centroids')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.legend(title="Cluster")
plt.show()
Output:
Confusion Matrix:
[[175 37]
[ 13 344]]

Classification Report:
precision recall f1-score support

0 0.93 0.83 0.88 212

1 0.90 0.96 0.93 357

accuracy 0.91 569

macro avg 0.92 0.89 0.90 569
weighted avg 0.91 0.91 0.91 569

CPDScardno 044-0141
No ratings yet
CPDScardno 044-0141
3 pages
Learning Curve Tables
No ratings yet
Learning Curve Tables
2 pages
Dork List
No ratings yet
Dork List
100 pages
K FOLD
No ratings yet
K FOLD
6 pages
Data Mining Lab Manual
No ratings yet
Data Mining Lab Manual
7 pages
KNN - Ipynb - Colaboratory
No ratings yet
KNN - Ipynb - Colaboratory
3 pages
EXP - 7- Prasham Doshi - 22bec097
No ratings yet
EXP - 7- Prasham Doshi - 22bec097
7 pages
Program -9
No ratings yet
Program -9
7 pages
Code
No ratings yet
Code
5 pages
Week 4 Naive Bayes Classifier
No ratings yet
Week 4 Naive Bayes Classifier
2 pages
Final Code-30 Bus Gauss Siedel
No ratings yet
Final Code-30 Bus Gauss Siedel
6 pages
Student - Linear Regression Example - Colaboratory
No ratings yet
Student - Linear Regression Example - Colaboratory
6 pages
Lecture 08 Nonlinearity
No ratings yet
Lecture 08 Nonlinearity
26 pages
Indi - Colab
No ratings yet
Indi - Colab
11 pages
Tugas Besar ASTL Lanjut&Softwarwe STL
No ratings yet
Tugas Besar ASTL Lanjut&Softwarwe STL
8 pages
Survival Models in SAS Part 7: PROC PHREG - Part 2: May 21, 2008 Charlie Hallahan
No ratings yet
Survival Models in SAS Part 7: PROC PHREG - Part 2: May 21, 2008 Charlie Hallahan
30 pages
Documents Downloader
No ratings yet
Documents Downloader
16 pages
Assignment 03
No ratings yet
Assignment 03
6 pages
Garishav Basra 102103129 2CO5
No ratings yet
Garishav Basra 102103129 2CO5
8 pages
Appendix
No ratings yet
Appendix
12 pages
Program Analisa Aliran Daya Pada Sistem 30 Bus Dengan Metode Newton Rapshon
No ratings yet
Program Analisa Aliran Daya Pada Sistem 30 Bus Dengan Metode Newton Rapshon
2 pages
Karisma_23011101119_eda_rec
No ratings yet
Karisma_23011101119_eda_rec
88 pages
22BBS0224
No ratings yet
22BBS0224
5 pages
KNN - Jupyter Notebook (1)
No ratings yet
KNN - Jupyter Notebook (1)
7 pages
4.4. Data Standardization - Ipynb - Colaboratory
No ratings yet
4.4. Data Standardization - Ipynb - Colaboratory
1 page
Lab 07 NR
No ratings yet
Lab 07 NR
6 pages
ML LAB 12 - Jupyter Notebook
No ratings yet
ML LAB 12 - Jupyter Notebook
11 pages
SystemData_033
No ratings yet
SystemData_033
2 pages
Pattern Recognition Assignment: Hari Narayan N.U B110490EE EEE A Batch
No ratings yet
Pattern Recognition Assignment: Hari Narayan N.U B110490EE EEE A Batch
18 pages
Project 1
No ratings yet
Project 1
6 pages
labpg3.ipynb - Colab
No ratings yet
labpg3.ipynb - Colab
2 pages
Load Flow Solution of IEEE 14 Bus System: Line Data
100% (1)
Load Flow Solution of IEEE 14 Bus System: Line Data
5 pages
Cse QP
100% (1)
Cse QP
5 pages
Activity 1 Admittance Matrix Formulation Lab
No ratings yet
Activity 1 Admittance Matrix Formulation Lab
4 pages
Ajuste de Curvas
No ratings yet
Ajuste de Curvas
35 pages
Lab 06 Guass
No ratings yet
Lab 06 Guass
7 pages
Curentul Electric in Functie de Radacina Patrata A Tensiunii de Franare
No ratings yet
Curentul Electric in Functie de Radacina Patrata A Tensiunii de Franare
5 pages
Coursework Unconstrained Optimization
No ratings yet
Coursework Unconstrained Optimization
26 pages
Classeur1
No ratings yet
Classeur1
21 pages
DW Criticalvalues
No ratings yet
DW Criticalvalues
95 pages
Import As As Import As From Import From Import From Import From Import From Import From Import From Import Import As
No ratings yet
Import As As Import As From Import From Import From Import From Import From Import From Import From Import Import As
8 pages
Chandigarh Group of Colleges College of Engineering Landran, Mohali
No ratings yet
Chandigarh Group of Colleges College of Engineering Landran, Mohali
47 pages
Name and Formula: Natl. Bur. Stand. (U.S.) Monogr. 25, 18, 59, (1981)
No ratings yet
Name and Formula: Natl. Bur. Stand. (U.S.) Monogr. 25, 18, 59, (1981)
3 pages
AI LAB
No ratings yet
AI LAB
19 pages
PM Chap 3c Ii1314
No ratings yet
PM Chap 3c Ii1314
30 pages
Presentation 1
No ratings yet
Presentation 1
2 pages
Tables Perf
No ratings yet
Tables Perf
3 pages
11zon - Merged-Files (1) - Removed - Removed
No ratings yet
11zon - Merged-Files (1) - Removed - Removed
7 pages
ADADELTA
No ratings yet
ADADELTA
2 pages
TI2134_PracticalAssignment_2
No ratings yet
TI2134_PracticalAssignment_2
4 pages
DOC-20250427-WA0046.
No ratings yet
DOC-20250427-WA0046.
2 pages
Ibf Risk
No ratings yet
Ibf Risk
3 pages
7 Distribuciones Probabilidades Tablas
No ratings yet
7 Distribuciones Probabilidades Tablas
27 pages
Keeraiit 2
No ratings yet
Keeraiit 2
19 pages
Soal 1:: Tugas Proyek Akhir Software Sistem Tenaga Listrik
No ratings yet
Soal 1:: Tugas Proyek Akhir Software Sistem Tenaga Listrik
5 pages
JCPDScardno 024-0735
No ratings yet
JCPDScardno 024-0735
3 pages
Final Result
No ratings yet
Final Result
353 pages
DISTRIBUCIÓN BINOMIAL - Términos Acumulativos
No ratings yet
DISTRIBUCIÓN BINOMIAL - Términos Acumulativos
5 pages
Core Concepts in Real Analysis
From Everand
Core Concepts in Real Analysis
Roshan Trivedi
No ratings yet
MCS-011: Problem Solving and Programming
From Everand
MCS-011: Problem Solving and Programming
Dr. DK Sukhani
No ratings yet
Develop Snakes & Ladders Game Complete Guide with Code & Design
From Everand
Develop Snakes & Ladders Game Complete Guide with Code & Design
Anurag Pandey
No ratings yet
740
No ratings yet
740
148 pages
RDS-Server 5 - Installation - en
No ratings yet
RDS-Server 5 - Installation - en
24 pages
Setec 1
No ratings yet
Setec 1
12 pages
Thank You for Your Order!
No ratings yet
Thank You for Your Order!
1 page
Download ebooks file (Ebook) The Guide to Managing Postproduction for Film, TV, and Digital Distribution: Managing the Process by Barbara Clark, Susan Spohr, Dawn Higginbotham, Kumari Bakhru ISBN 9781138482777, 9781138482814, 1138482773, 1138482811 all chapters
100% (11)
Download ebooks file (Ebook) The Guide to Managing Postproduction for Film, TV, and Digital Distribution: Managing the Process by Barbara Clark, Susan Spohr, Dawn Higginbotham, Kumari Bakhru ISBN 9781138482777, 9781138482814, 1138482773, 1138482811 all chapters
65 pages
RDMA Verb Programming
No ratings yet
RDMA Verb Programming
18 pages
The Push Pull Converter
No ratings yet
The Push Pull Converter
2 pages
Syntax and Meaning of Prolog Programs
No ratings yet
Syntax and Meaning of Prolog Programs
37 pages
Unit6 Software Coading and Testing
No ratings yet
Unit6 Software Coading and Testing
50 pages
Assignment Basic of Algebra Question
No ratings yet
Assignment Basic of Algebra Question
5 pages
Primary Copy Locking
No ratings yet
Primary Copy Locking
1 page
3 - Crossword Labs ans
No ratings yet
3 - Crossword Labs ans
1 page
Allelectricalinterviewquestions4u Blogspot in
No ratings yet
Allelectricalinterviewquestions4u Blogspot in
5 pages
Enrollment System Thesis
100% (3)
Enrollment System Thesis
7 pages
X 64 DBG
No ratings yet
X 64 DBG
239 pages
DN 32 Connection Archi
No ratings yet
DN 32 Connection Archi
40 pages
How To Apply A Rolling Opatch: Rac How To... Fold Patch Installation Instructions Patch Deinstallation Instructions
No ratings yet
How To Apply A Rolling Opatch: Rac How To... Fold Patch Installation Instructions Patch Deinstallation Instructions
6 pages
Binder 1
No ratings yet
Binder 1
36 pages
Sensors and Actuators
100% (1)
Sensors and Actuators
10 pages
SCADA - Topic - 2 - Updated (SCADA Hardware and Firmware)
No ratings yet
SCADA - Topic - 2 - Updated (SCADA Hardware and Firmware)
75 pages
Hi-Sincerity: Microelectronics Corp
No ratings yet
Hi-Sincerity: Microelectronics Corp
5 pages
Oh The Microservices You LL Build Learn Microservices From Zero To Hero
No ratings yet
Oh The Microservices You LL Build Learn Microservices From Zero To Hero
13 pages
Plastic Design Multistory Frames
No ratings yet
Plastic Design Multistory Frames
290 pages
Find Changes Logs For A Table Using SM30
No ratings yet
Find Changes Logs For A Table Using SM30
6 pages
khudkibook.web.appcomputersem1environmentandsustainability
No ratings yet
khudkibook.web.appcomputersem1environmentandsustainability
3 pages
DNVGL RP F110
No ratings yet
DNVGL RP F110
14 pages
Saffire Usb Manual
No ratings yet
Saffire Usb Manual
1 page
DCSA-Subscription-Callback-API 1.0 Final
No ratings yet
DCSA-Subscription-Callback-API 1.0 Final
17 pages
Sophos Partner Program Deal Reg Guidelines
No ratings yet
Sophos Partner Program Deal Reg Guidelines
4 pages

ML program 7 ,8,9 and10

Uploaded by

ML program 7 ,8,9 and10

Uploaded by

7.

Develop a program to demonstrate the working of Linear Regression and Polynomial

0 0.93 0.83 0.88 212

accuracy 0.91 569

You might also like