0% found this document useful (0 votes)

31 views

RO47002 - Lecture 2C - Hyperparameters and Cross-Validation

The document discusses hyperparameters and cross-validation in machine learning. It defines hyperparameters and describes challenges in selecting their values, such as overfitting training data. It recommends using cross-validation and validation data sets to select models and evaluate performance, rather than relying on training or test accuracy alone. Random search is presented as more efficient than grid search for hyperparameter optimization.

Uploaded by

Haia Al Sharif

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

31 views

RO47002 - Lecture 2C - Hyperparameters and Cross-Validation

Uploaded by

Haia Al Sharif

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 10

1

Hyperparameters
and cross-validation
Course: RO47002
Lecturer:Julian Kooij
2

Hyperparameters
Hyperparameters are parameters (modelling choices)
which are not optimized in the training phase:
• Parameters for feature extraction # of features, scaling
• Type parameter space of model linear vs polynomial fit
• The choice of model decision tree vs SVM
• Parameters that affect the used loss weight terms, ℓ1 vs ℓ2
• Parameters of optimization procedure the learning rate
• …
3

Hyperparameters
How to determine hyperparameter values?
1. Keep fixed, hope you have good values
– Probably not optimal. Requires good intuition of problem, experience, or literature
research
2. Optimize manually “tweaking”
– part of model exploration, but not systematic, ad-hoc 
3. Additional hyperparameter optimization
– systematic, but still requires human input on what to try. Curse of combinatorics

Fundamental challenge in ML:

• How can we compare modelling choices and draw correct conclusions?
4

(Wrong) idea 1: Use training performance

Q: Should I use a 1-Nearest Neighbour, or 3-NN classifier?
• Let’s test on the training data, what is classification error?

A: No, 1-NN will have no errors, per definition 1-NN Decision regions
• With infinite training data, all test cases are known
→ this would be a perfect classifier!
• But, we definitely will get unseen test samples
• Might have captured noise in data

Do not assume that good performance on training data

is indicative of good future performance

Don’t get obsessed with 100% training accuracy → trivial to achieve!

(Wrong) idea 2: Use test performance

Q: Ok, so should I evaluate my candidate models on test data,
and pick the best performing?

A: No, be careful!
• Test data is still used to optimize your hypothesis function
• Not “unseen” anymore, must be considered training data
• performance on this data is probably over-optimistic
when using in your actual application!
• Cannot compare anymore with reported test results
6

Validation split
• Voluntarily split apart part of training data as “validation” data
– E.g. keep 80% for training, use 20% for validation
– Train all models on reduced training data
– Make model selection choices on performance of validation split
– Afterwards, can use on all training data again for final model training

• Don’t touch your test data, until you present your results
– Must accept that your model’s performance on test data is suboptimal, but fair
– E.g. public benchmark servers keep true labels of test data hidden.
Participants cannot compute test performance and optimize on it!

• Best case: validation data is representative of test data

– Trade-off: larger validation split, fewer data left for training …

Problem: results may be affected by how data is split (e.g. where outliers go)
7

n-fold Cross-validation
• Divide training data
into n splits, called “folds”
• Perform n experiments
– Each time, validate on other split
– Train on remaining splits

Pros
• All training data used
for optimization and evaluation
• Generates statistics
on performance (mean, std.dev)
Cons
• N-times more work than single validation split
Image: https://scikit-learn.org/stable/modules/cross_validation.html
8

Hyperparameter search
Strategies to optimize hyperparameter combinations
• For discrete values, exhaustively try all → only works with few options, few hyperparameters
• For continues values:
Grid search Random search
best_err = None best_err = None
best_params = None best_params = None
for p1 in [0, 0.5, 1.0]: for p1 in numpy.random.rand(3):
for p2 in [0, 0.5, 1.0]: for p2 in numpy.random.rand(3):
err = run_crossval(p1,p2) err = run_crossval(p1,p2)
if err < best_err: if err < best_err:
best_err = err best_err = err
best_params = (p1,p2) best_params = (p1,p2)
print(’best params:’ + best_params) print(’best params:’ + best_params)
9

Hyperparameter search
9 trials … 9 trials …
optimum missed optimum found!

• In case of unimportant hyperparameters, grid search wastes time

• random search more efficient, better chance of finding maxima!
J. Bergstra, and Y. Bengio. "Random search for hyper-parameter optimization." JMLR 13.1 (2012): 281-305.
10

Conclusions
• Hyperparameter optimization non-trivial
• Selecting hyperparameters, model requires
separate validation data
• Don’t trick yourself with train or test performance
• When possible, use cross-validation
• Random search is preferred over grid search,
especially when hyperparameters are correlated or
irrelevant

DTS304TC_CW2_Paper
No ratings yet
DTS304TC_CW2_Paper
21 pages
IML 8 - Grid Search and Cross Validation
No ratings yet
IML 8 - Grid Search and Cross Validation
22 pages
Training Evaluation
No ratings yet
Training Evaluation
42 pages
Model Training: (Anything Done While We Train The Model)
No ratings yet
Model Training: (Anything Done While We Train The Model)
194 pages
AN2DL_03_2324_NeuralNetwroksTraining
No ratings yet
AN2DL_03_2324_NeuralNetwroksTraining
40 pages
Lecture6c HyperparameterOptimization
No ratings yet
Lecture6c HyperparameterOptimization
19 pages
06 Regularizations
No ratings yet
06 Regularizations
42 pages
Quiz 1 Materials
No ratings yet
Quiz 1 Materials
159 pages
Best Practices
No ratings yet
Best Practices
16 pages
Codes and Concepts of ML-Developer-2
No ratings yet
Codes and Concepts of ML-Developer-2
17 pages
Aula 4 (L) - Oggi La Tua Lezione È in Presenza
No ratings yet
Aula 4 (L) - Oggi La Tua Lezione È in Presenza
11 pages
Hyper Parameters
No ratings yet
Hyper Parameters
24 pages
2020 Evaluation PDF
No ratings yet
2020 Evaluation PDF
25 pages
ML 5
No ratings yet
ML 5
14 pages
14 Model Selection and Boosting
No ratings yet
14 Model Selection and Boosting
51 pages
Overfitting & Feature Engineering.pptx
No ratings yet
Overfitting & Feature Engineering.pptx
37 pages
DSOST3
No ratings yet
DSOST3
31 pages
SML Updated UNIT 4
No ratings yet
SML Updated UNIT 4
44 pages
Lecture 12 - Machine Learning
No ratings yet
Lecture 12 - Machine Learning
18 pages
Wa0001.
No ratings yet
Wa0001.
173 pages
ML Unit 2
No ratings yet
ML Unit 2
86 pages
19 ML Intro
No ratings yet
19 ML Intro
31 pages
Module2.3 Hyperparameter Optimization
No ratings yet
Module2.3 Hyperparameter Optimization
29 pages
Ovefitting, Generalization, Cross Validation
No ratings yet
Ovefitting, Generalization, Cross Validation
20 pages
DEEP LEARNING UNIT 3
No ratings yet
DEEP LEARNING UNIT 3
19 pages
Model Generalization
No ratings yet
Model Generalization
117 pages
T1 ML QB Soln
No ratings yet
T1 ML QB Soln
23 pages
Unit 5 New
No ratings yet
Unit 5 New
9 pages
Lecture 9 - Evaluations
No ratings yet
Lecture 9 - Evaluations
68 pages
Automl: A Perspective Where Industry Meets Academy
No ratings yet
Automl: A Perspective Where Industry Meets Academy
154 pages
Pattern Classification 11. Backpropagation & Time-Series Forecasting
No ratings yet
Pattern Classification 11. Backpropagation & Time-Series Forecasting
78 pages
Machine Learning General: Definiton
No ratings yet
Machine Learning General: Definiton
14 pages
Cofusion Matrix Cross- Validation
No ratings yet
Cofusion Matrix Cross- Validation
34 pages
Lecture 15 - Recap and Midterm Review
No ratings yet
Lecture 15 - Recap and Midterm Review
37 pages
Lecture-4 Model Evaluation
No ratings yet
Lecture-4 Model Evaluation
28 pages
04 - Model Selection
No ratings yet
04 - Model Selection
62 pages
Unit IV
No ratings yet
Unit IV
51 pages
Choosing Model and Tuning
No ratings yet
Choosing Model and Tuning
20 pages
Evaluating Machine Learning Algorithms and Model Selection
No ratings yet
Evaluating Machine Learning Algorithms and Model Selection
10 pages
P-2.1.2 Cross Validation and Regularization
No ratings yet
P-2.1.2 Cross Validation and Regularization
37 pages
EMBED LEC MIDTERM REVIEWER
No ratings yet
EMBED LEC MIDTERM REVIEWER
14 pages
Introduction to Machine Learning
No ratings yet
Introduction to Machine Learning
116 pages
Lec2 Intro to ML
No ratings yet
Lec2 Intro to ML
35 pages
MLT_Notes
No ratings yet
MLT_Notes
28 pages
Lecture_2
No ratings yet
Lecture_2
31 pages
ANDONIE, R. Hyperparameter Optimization in Learning Systems. Journal of Membrane Computing. 2019.
No ratings yet
ANDONIE, R. Hyperparameter Optimization in Learning Systems. Journal of Membrane Computing. 2019.
13 pages
19_ML_intro
No ratings yet
19_ML_intro
33 pages
Lec - 4
No ratings yet
Lec - 4
43 pages
CH 05 Optimization Technique
No ratings yet
CH 05 Optimization Technique
58 pages
ML Unit 2 Part 1
No ratings yet
ML Unit 2 Part 1
47 pages
Machine Leafning
No ratings yet
Machine Leafning
5 pages
ML U-4
No ratings yet
ML U-4
63 pages
10: Advice For Applying Machine Learning: Deciding What To Try Next
No ratings yet
10: Advice For Applying Machine Learning: Deciding What To Try Next
8 pages
Chapter2 1 33
No ratings yet
Chapter2 1 33
18 pages
Mining Process
No ratings yet
Mining Process
33 pages
Lec-1 Bias-variance-Tradeoff
No ratings yet
Lec-1 Bias-variance-Tradeoff
24 pages
ppt5dl
No ratings yet
ppt5dl
33 pages
Learning Best Practices For Model Evaluation and Hyperparameter Tuning
No ratings yet
Learning Best Practices For Model Evaluation and Hyperparameter Tuning
17 pages
ML.1Lecture.2 (Old)
No ratings yet
ML.1Lecture.2 (Old)
23 pages
DL UNIT2
No ratings yet
DL UNIT2
22 pages
Random Sample Consensus: Robust Estimation in Computer Vision
From Everand
Random Sample Consensus: Robust Estimation in Computer Vision
Fouad Sabry
No ratings yet
artificial-int-text-book-final
No ratings yet
artificial-int-text-book-final
101 pages
Radio Frequency Interference Detection and Automatic Modulation Recognition Based On Mask RCNN
No ratings yet
Radio Frequency Interference Detection and Automatic Modulation Recognition Based On Mask RCNN
20 pages
Brei 2020
No ratings yet
Brei 2020
67 pages
User Experience Design Using Machine Learning A Systematic Review
No ratings yet
User Experience Design Using Machine Learning A Systematic Review
14 pages
Thesis Book 2
No ratings yet
Thesis Book 2
57 pages
ML_TOx
No ratings yet
ML_TOx
23 pages
PM Guided Project Sample Business Report
No ratings yet
PM Guided Project Sample Business Report
52 pages
Data Science and Visualization (21CS644) : Text Books
No ratings yet
Data Science and Visualization (21CS644) : Text Books
27 pages
20BCS2334 - Jitesh Kumar CV
No ratings yet
20BCS2334 - Jitesh Kumar CV
3 pages
Naskah Publikasi Ilmiah Contoh
No ratings yet
Naskah Publikasi Ilmiah Contoh
19 pages
NLP - (1) (1) .Ipynb - Colab
No ratings yet
NLP - (1) (1) .Ipynb - Colab
10 pages
Escorcia-Gutierrez Et Al. - 2023
No ratings yet
Escorcia-Gutierrez Et Al. - 2023
16 pages
Ai&ml Unit 3
No ratings yet
Ai&ml Unit 3
81 pages
Metric3D v2: A Versatile Monocular Geometric Foundation Model For Zero-Shot Metric Depth and Surface Normal Estimation
No ratings yet
Metric3D v2: A Versatile Monocular Geometric Foundation Model For Zero-Shot Metric Depth and Surface Normal Estimation
30 pages
Andrew ML
No ratings yet
Andrew ML
218 pages
Nigercon Abuad IEEE 2024
No ratings yet
Nigercon Abuad IEEE 2024
5 pages
Unit 4 Data warehousing and Data mining
No ratings yet
Unit 4 Data warehousing and Data mining
15 pages
IEEE AIIooT Certified
No ratings yet
IEEE AIIooT Certified
8 pages
ML PATHWAY
No ratings yet
ML PATHWAY
4 pages
Research On Hotel Reservation Customer Churn Based On Deep Neural Networks
No ratings yet
Research On Hotel Reservation Customer Churn Based On Deep Neural Networks
8 pages
Quantifying and Analyzing Entity-Level Memorization in Large Language Models
No ratings yet
Quantifying and Analyzing Entity-Level Memorization in Large Language Models
9 pages
Stacked Ensemble Learning Based Approach For Anomaly Detection in IoT Environment
No ratings yet
Stacked Ensemble Learning Based Approach For Anomaly Detection in IoT Environment
6 pages
Heart Attack Risk Prediction Plag Check PDF
No ratings yet
Heart Attack Risk Prediction Plag Check PDF
49 pages
BT-2016 SEM-IV Project Report (Review 1)
No ratings yet
BT-2016 SEM-IV Project Report (Review 1)
42 pages
Us Presidential Vocabulary - Ipynb
No ratings yet
Us Presidential Vocabulary - Ipynb
40 pages
Chest CT Image Segmentation Using Deep Learning
No ratings yet
Chest CT Image Segmentation Using Deep Learning
44 pages
UNIT 4 K-Means Clustring
No ratings yet
UNIT 4 K-Means Clustring
13 pages
Main PPT Heart
No ratings yet
Main PPT Heart
20 pages
PR
No ratings yet
PR
23 pages

RO47002 - Lecture 2C - Hyperparameters and Cross-Validation

Uploaded by

RO47002 - Lecture 2C - Hyperparameters and Cross-Validation

Uploaded by

1

Fundamental challenge in ML:

(Wrong) idea 1: Use training performance

Do not assume that good performance on training data

Don’t get obsessed with 100% training accuracy → trivial to achieve!

(Wrong) idea 2: Use test performance

• Best case: validation data is representative of test data

• In case of unimportant hyperparameters, grid search wastes time

You might also like