Exercise Underfitting and Overfitting

Uploaded by

nhungnhung101200

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views

Exercise Underfitting and Overfitting

Uploaded by

nhungnhung101200

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

{"metadata":{"kernelspec":{"display_name":"Python

3","language":"python","name":"python3"},"language_info":{"codemirror_mode":
{"name":"ipython","version":3},"file_extension":".py","mimetype":"text/x-
python","name":"python","nbconvert_exporter":"python","pygments_lexer":"ipython3","vers
ion":"3.6.5"},"kaggle":{"accelerator":"none","dataSources":
[{"sourceId":10211,"databundleVersionId":111096,"sourceType":"competition"},
{"sourceId":15520,"sourceType":"datasetVersion","datasetId":11167},
{"sourceId":38454,"sourceType":"datasetVersion","datasetId":2709}],"isInternetEnabled":f
alse,"language":"python","sourceType":"notebook","isGpuEnabled":false}},"nbformat_mino
r":4,"nbformat":4,"cells":[{"cell_type":"markdown","source":"**This notebook is an exercise
in the [Introduction to Machine Learning](https://www.kaggle.com/learn/intro-to-machine-
learning) course. You can reference the tutorial at [this
link](https://www.kaggle.com/dansbecker/underfitting-and-overfitting).**\n\n---\
n","metadata":{}},{"cell_type":"markdown","source":"## Recap\nYou've built your first
model, and now it's time to optimize the size of the tree to make better predictions. Run
this cell to set up your coding environment where the previous step left off.","metadata":
{}},{"cell_type":"code","source":"# Code you have previously used to load data\nimport
pandas as pd\nfrom sklearn.metrics import mean_absolute_error\nfrom
sklearn.model_selection import train_test_split\nfrom sklearn.tree import
DecisionTreeRegressor\n\n\n# Path of the file to read\niowa_file_path = '../input/home-
data-for-ml-course/train.csv'\n\nhome_data = pd.read_csv(iowa_file_path)\n# Create target
object and call it y\ny = home_data.SalePrice\n# Create X\nfeatures = ['LotArea',
'YearBuilt', '1stFlrSF', '2ndFlrSF', 'FullBath', 'BedroomAbvGr', 'TotRmsAbvGrd']\nX =
home_data[features]\n\n# Split into validation and training data\ntrain_X, val_X, train_y,
val_y = train_test_split(X, y, random_state=1)\n\n# Specify Model\niowa_model =
DecisionTreeRegressor(random_state=1)\n# Fit Model\niowa_model.fit(train_X, train_y)\n\
n# Make validation predictions and calculate mean absolute error\nval_predictions =
iowa_model.predict(val_X)\nval_mae = mean_absolute_error(val_predictions, val_y)\
nprint(\"Validation MAE: {:,.0f}\".format(val_mae))\n\n# Set up code checking\nfrom
learntools.core import binder\nbinder.bind(globals())\nfrom
learntools.machine_learning.ex5 import *\nprint(\"\\nSetup complete\")","metadata":
{"collapsed":true,"jupyter":{"outputs_hidden":true}},"execution_count":null,"outputs":[]},
{"cell_type":"markdown","source":"# Exercises\nYou could write the function `get_mae`
yourself. For now, we'll supply it. This is the same function you read about in the previous
lesson. Just run the cell below.","metadata":{}},{"cell_type":"code","source":"def
get_mae(max_leaf_nodes, train_X, val_X, train_y, val_y):\n model =
DecisionTreeRegressor(max_leaf_nodes=max_leaf_nodes, random_state=0)\n
model.fit(train_X, train_y)\n preds_val = model.predict(val_X)\n mae =
mean_absolute_error(val_y, preds_val)\n return(mae)","metadata":
{},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":"## Step 1:
Compare Different Tree Sizes\nWrite a loop that tries the following values for
*max_leaf_nodes* from a set of possible values.\n\nCall the *get_mae* function on each
value of max_leaf_nodes. Store the output in some way that allows you to select the value of
`max_leaf_nodes` that gives the most accurate model on your data.","metadata":{}},
{"cell_type":"code","source":" candidate_max_leaf_nodes = [5, 25, 50, 100, 250, 500]\n#
Write loop to find the ideal tree size from candidate_max_leaf_nodes\nvalues=[]\n\n# Store
the best value of max_leaf_nodes (it will be either 5, 25, 50, 100, 250 or 500)\n\nfor l in
candidate_max_leaf_nodes:\n values.append(get_mae(l,train_X,val_X,train_y,val_y))\n if
get_mae(l,train_X,val_X,train_y,val_y)==min(values):\n best_tree_size=l\n \
nprint(best_tree_size)\n \n \n# Check your answer\nstep_1.check()","metadata":
{},"execution_count":null,"outputs":[]},{"cell_type":"code","source":"# The lines below will
show you a hint or the solution.\n# step_1.hint() \n# step_1.solution()","metadata":
{},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":"## Step 2: Fit
Model Using All Data\nYou know the best tree size. If you were going to deploy this model
in practice, you would make it even more accurate by using all of the data and keeping that
tree size. That is, you don't need to hold out the validation data now that you've made all
your modeling decisions.","metadata":{}},{"cell_type":"code","source":"# Fill in argument
to make optimal size and uncomment\nfinal_model =
DecisionTreeRegressor(max_leaf_nodes=best_tree_size,random_state=1)\n\n# fit the final
model and uncomment the next two lines\nfinal_model.fit(X,y)\n\n# Check your answer\
nstep_2.check()","metadata":{},"execution_count":null,"outputs":[]},
{"cell_type":"code","source":"# step_2.hint()\n# step_2.solution()","metadata":
{},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":"You've tuned
this model and improved your results. But we are still using Decision Tree models, which
are not very sophisticated by modern machine learning standards. In the next step you will
learn to use Random Forests to improve your models even more.\n\n# Keep Going\n\nYou
are ready for **[Random Forests](https://www.kaggle.com/dansbecker/random-forests).**\
n","metadata":{}},{"cell_type":"markdown","source":"---\n\n\n\n\n*Have questions or
comments? Visit the [course discussion forum](https://www.kaggle.com/learn/intro-to-
machine-learning/discussion) to chat with other learners.*","metadata":{}}]}

Chapter 2 Project Management Section 2.1 Critical Path Method (CPM) Using Activity On Arrow Example 2.1 Black Eyed Peas (I)
100% (1)
Chapter 2 Project Management Section 2.1 Critical Path Method (CPM) Using Activity On Arrow Example 2.1 Black Eyed Peas (I)
5 pages
Exercise Random Forests
No ratings yet
Exercise Random Forests
2 pages
Exercise Explore Your Data
No ratings yet
Exercise Explore Your Data
2 pages
students-exam-scores-analysis.ipynb
No ratings yet
students-exam-scores-analysis.ipynb
4 pages
Aula7_Myself
No ratings yet
Aula7_Myself
2 pages
10_neural_nets_with_keras.ipynb (1)
No ratings yet
10_neural_nets_with_keras.ipynb (1)
159 pages
C1_W1_Lab03_Model_Representation_Soln.ipynb
No ratings yet
C1_W1_Lab03_Model_Representation_Soln.ipynb
20 pages
Ì Ì Í Week3ì Ì Ipynb
No ratings yet
Ì Ì Í Week3ì Ì Ipynb
2 pages
CISC 504 Assignment 4.ipynb
No ratings yet
CISC 504 Assignment 4.ipynb
4 pages
SPARQL Wrapper (ASK)
No ratings yet
SPARQL Wrapper (ASK)
2 pages
a
No ratings yet
a
2 pages
Finding Optimal Locations of New Stores Using DO - Ipynb
No ratings yet
Finding Optimal Locations of New Stores Using DO - Ipynb
12 pages
Housing Project Using Tensor Flow Python Code
No ratings yet
Housing Project Using Tensor Flow Python Code
13 pages
02_poisson_pinns.ipynb
No ratings yet
02_poisson_pinns.ipynb
60 pages
CISC 504 Assignment 6.ipynb
No ratings yet
CISC 504 Assignment 6.ipynb
2 pages
03_nonlin_poisson_pinns.ipynb
No ratings yet
03_nonlin_poisson_pinns.ipynb
59 pages
Informatika 10-1.ipynb
No ratings yet
Informatika 10-1.ipynb
1 page
Raw.githubusercontent.com Dynamicslab Deep-learning-fluids Main Notebooks ML Tutorial.ipynb
No ratings yet
Raw.githubusercontent.com Dynamicslab Deep-learning-fluids Main Notebooks ML Tutorial.ipynb
55 pages
Donee
No ratings yet
Donee
61 pages
Notebook034d0e6953 Ipynb
No ratings yet
Notebook034d0e6953 Ipynb
8 pages
Assignment 4
No ratings yet
Assignment 4
216 pages
Notebook-Disease Prediction Using Machine Learning
No ratings yet
Notebook-Disease Prediction Using Machine Learning
141 pages
Principal Component Analysis - Ipynb
No ratings yet
Principal Component Analysis - Ipynb
27 pages
Plant Leaf.ipynb
No ratings yet
Plant Leaf.ipynb
962 pages
Lab04 Discrete Distributions - Ipynb
No ratings yet
Lab04 Discrete Distributions - Ipynb
2 pages
2 Node Classification - Ipynb
No ratings yet
2 Node Classification - Ipynb
135 pages
DOC-20250211-WA0009. (1)
No ratings yet
DOC-20250211-WA0009. (1)
26 pages
4 Practice - Introduction - Solutions - Ipynb
No ratings yet
4 Practice - Introduction - Solutions - Ipynb
7 pages
Exercise - First Machine Learning Model
No ratings yet
Exercise - First Machine Learning Model
2 pages
GuamÃ¡Jacob RemoverRuido - Ipynb
No ratings yet
GuamÃ¡Jacob RemoverRuido - Ipynb
354 pages
Chapter 04 Other Python Data Structures.ipynb
No ratings yet
Chapter 04 Other Python Data Structures.ipynb
62 pages
Mnist
No ratings yet
Mnist
3 pages
Retalking For High Resolution - Ipynb
No ratings yet
Retalking For High Resolution - Ipynb
1 page
ss
No ratings yet
ss
9 pages
Day - 5 - Numpy - Part - 1 (1) .Ipynb
No ratings yet
Day - 5 - Numpy - Part - 1 (1) .Ipynb
21 pages
Lab02 Summary Measures - Ipynb
No ratings yet
Lab02 Summary Measures - Ipynb
2 pages
Roop-3 6 7 Ipynb
No ratings yet
Roop-3 6 7 Ipynb
1 page
CDD_ML_Part_1_bioactivity_data.ipynb
No ratings yet
CDD_ML_Part_1_bioactivity_data.ipynb
40 pages
Lab Manual
No ratings yet
Lab Manual
7 pages
Intro To Pytorch - Ipynb
No ratings yet
Intro To Pytorch - Ipynb
59 pages
Stats_Practicals.ipynb (1)
No ratings yet
Stats_Practicals.ipynb (1)
9 pages
Safe_and_Sound_Protocol
No ratings yet
Safe_and_Sound_Protocol
42 pages
Docu 2
No ratings yet
Docu 2
43 pages
File Handling in Python
No ratings yet
File Handling in Python
56 pages
Assignment18 PythonBasic
No ratings yet
Assignment18 PythonBasic
4 pages
resnetppo.ipynb
No ratings yet
resnetppo.ipynb
16 pages
BCS
No ratings yet
BCS
10 pages
Node Stats
No ratings yet
Node Stats
85 pages
Us Presidential Vocabulary - Ipynb
No ratings yet
Us Presidential Vocabulary - Ipynb
40 pages
Panda Ipynb
No ratings yet
Panda Ipynb
3 pages
Salary Prediction - Ipynb
No ratings yet
Salary Prediction - Ipynb
3 pages
EDA Resume Classification - Ipynb
No ratings yet
EDA Resume Classification - Ipynb
408 pages
WEEK5
No ratings yet
WEEK5
4 pages
Ipynb
No ratings yet
Ipynb
10 pages
Notebook40476b8e91 Ipynb
No ratings yet
Notebook40476b8e91 Ipynb
1 page
Untitled1.ipynb
No ratings yet
Untitled1.ipynb
97 pages
Week 3 - Newton Fix Main Activity
No ratings yet
Week 3 - Newton Fix Main Activity
5 pages
COMP1001 LAB5.ipynb
No ratings yet
COMP1001 LAB5.ipynb
4 pages
Chatbot Agri
No ratings yet
Chatbot Agri
7 pages
Untitledd
No ratings yet
Untitledd
3 pages
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
From Everand
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
Kanto
No ratings yet
Earth Manual
No ratings yet
Earth Manual
7 pages
Curriculum Vitae: Md. Rezaur Rahman
No ratings yet
Curriculum Vitae: Md. Rezaur Rahman
2 pages
Mongodb Schema Validation
No ratings yet
Mongodb Schema Validation
8 pages
MMF-300-10 Ten Input Monitor Module: Installation and Maintenance Instructions
No ratings yet
MMF-300-10 Ten Input Monitor Module: Installation and Maintenance Instructions
4 pages
McMurdo FastFind 220 PLB Datasheet
No ratings yet
McMurdo FastFind 220 PLB Datasheet
4 pages
Mime and Dash - Google Search
No ratings yet
Mime and Dash - Google Search
1 page
Java XML Tutorial PDF
100% (1)
Java XML Tutorial PDF
111 pages
StoreSim Optimizing Information Leakage in Multi-Cloud Storage Services
No ratings yet
StoreSim Optimizing Information Leakage in Multi-Cloud Storage Services
6 pages
Signature Recognition Using Image Processing Artificial
No ratings yet
Signature Recognition Using Image Processing Artificial
104 pages
Technical Evalution Sheet
No ratings yet
Technical Evalution Sheet
2 pages
Thesis Q. Wang - Abs 2019
No ratings yet
Thesis Q. Wang - Abs 2019
176 pages
Viva Questions - Graphics
No ratings yet
Viva Questions - Graphics
2 pages
5 Days
No ratings yet
5 Days
135 pages
Assignment 10
No ratings yet
Assignment 10
9 pages
Email:: Samsung House, 1000 Hills Wood Drive, Chertsey, Surrey, KT16 0PS
No ratings yet
Email:: Samsung House, 1000 Hills Wood Drive, Chertsey, Surrey, KT16 0PS
1 page
Fsi Ansys
No ratings yet
Fsi Ansys
15 pages
Office Automation Question December 2017 PDF
No ratings yet
Office Automation Question December 2017 PDF
3 pages
128 Pid 110 PDF
No ratings yet
128 Pid 110 PDF
1 page
catalog_TURCK-MS24-112-R-datasheet
No ratings yet
catalog_TURCK-MS24-112-R-datasheet
2 pages
Etcuban, Et Al-Article
No ratings yet
Etcuban, Et Al-Article
25 pages
KNX Basics: Smart Home and Building Solutions. Global. Secure. Connected
No ratings yet
KNX Basics: Smart Home and Building Solutions. Global. Secure. Connected
24 pages
Internet of Things: An Introduction To Iot, Definition, Advantages and Disadvantages
No ratings yet
Internet of Things: An Introduction To Iot, Definition, Advantages and Disadvantages
14 pages
sm58 Specification Sheet English PDF
No ratings yet
sm58 Specification Sheet English PDF
1 page
Combined Graduate Level Recruitment OSSC Notice
No ratings yet
Combined Graduate Level Recruitment OSSC Notice
12 pages
Delta Full Stack Web Development By APNA College By Skill Up
100% (1)
Delta Full Stack Web Development By APNA College By Skill Up
4 pages
SA Review
No ratings yet
SA Review
5 pages
SPContentType - Workflowassociations Property (Microsoft
No ratings yet
SPContentType - Workflowassociations Property (Microsoft
4 pages
(PUBLIC) G4G20 - Wildfire Boundaries On Search and Maps
No ratings yet
(PUBLIC) G4G20 - Wildfire Boundaries On Search and Maps
11 pages
Pressure Gauge - O&M
No ratings yet
Pressure Gauge - O&M
16 pages

Exercise Underfitting and Overfitting

Uploaded by

Exercise Underfitting and Overfitting

Uploaded by

{"metadata":{"kernelspec":{"display_name":"Python

You might also like