Getting Started with WEKA Data Mining

The document provides steps to get started with data mining using the WEKA tool: 1) Open WEKA and select the Explorer tool for preprocessing, classification, and clustering tasks. 2) Import a CSV dataset and transform attributes from numeric to nominal values using a filter. 3) Split the dataset into 70% for training and 30% for testing using randomization and percentage filters. 4) Train classification models like OneR using cross-validation on the training set and evaluate on the test set. 5) Perform association rule learning using the Apriori algorithm to generate rules predicting class attributes.

Uploaded by

giovanni

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

219 views13 pages

Getting Started with WEKA Data Mining

Uploaded by

giovanni

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

DataminingwithWEKA

Ausecasetohelpyougetstarted

Charalampos Mavroforakis
BUCS105,Fall2011
StartingWEKA

OpenWeka :Start>AllPrograms>Weka 3.x.x>Weka 3.x

Fromthe"Weka GUIChooser",pick"Explorer".Thisisthe
mainWEKAtoolthatwearegoingtouse.
Openingadataset

Toopenadataset([Link] fileinourcase),weclick"Openfile..."inthe
Preprocess [Link] thatin
theopenmenuyouhavetochoosecsv [Link]
[Link]
Transformingvaluestonominal(ifneeded)

Weka classifiedeveryattributeinourdatasetasnumeric,sowehavetomanuallytransform
[Link],[Link],whichisin
Unsupervised >[Link],[Link],the
mostinterestingonehereistheattributeIndices,whichenumeratesalltheattributesthatyou
[Link],weclickApply.
Splittingthedataset

Wehavetosplitthedatasetintotwo,30%testingand70%[Link],wefirst
Randomize thedataset(Unsupervised >Instance),sothatwecreatearandompermutation.
Splittingthedataset

ThenweapplyRemovePercentage (Unsupervised >Instance)withpercentage30andsavethe

resultingdatasetastraining.
Splittingthedataset

Afterthat,weundoandapplythesamefilterchoosinginvertSelection [Link]
therestofthedata(30%)sowesavethemasthetesting.
Trainingmodels

[Link]"Classify"andwe
[Link]'sstartwithOneR,whichisthesamewiththeonewesawintheclass.
Trainingmodels

[Link]
wanttoseehowgoodOneR isasamodel,soweusecrossvalidation.,andonlyafterthat
willwegoandcheckwhatitpredictsontheunseendata.
Trainingmodels

Intheoutput,wegetinformationabouttheaverageaccuracyandtheconfusionmatrixof
ourmodel.
Trainingmodels

Inordertocheckhowwellwedoontheunseendata,weselect"supplied test set",weopen

[Link]
thealgorithmagainandwenoticethedifferencesintheconfusionmatrixandtheaccuracy.
Associationlearning

Ifallofourattributesarenominal(incasetheyarenot,wecandiscretizetheminthe
Preprocesstab)[Link],weswitchtothe
Association tabandwechoosetheApriori [Link]
parametersifyouwant.
Associationlearning

Wecouldsetcar toTrue(sothatitproducesrulesthatpredicttheclassattribute)and
[Link] setsthe
thresholdofconfidenceandnumRules [Link]
resultwillbeasetofrulesthatpredicttheclass,togetherwiththeirconfidence.

Weka Lab
No ratings yet
Weka Lab
11 pages
Overview of WEKA Machine Learning Tool
No ratings yet
Overview of WEKA Machine Learning Tool
20 pages
WEKA Guide for ML Practitioners
No ratings yet
WEKA Guide for ML Practitioners
58 pages
Weka Data Mining Overview and Techniques
No ratings yet
Weka Data Mining Overview and Techniques
63 pages
WEKA Explorer Tutorial
No ratings yet
WEKA Explorer Tutorial
45 pages
Weka Tutorial
No ratings yet
Weka Tutorial
45 pages
Data Mining Lab Questions
100% (1)
Data Mining Lab Questions
47 pages
WEKA Data Mining Tool Overview
No ratings yet
WEKA Data Mining Tool Overview
19 pages
Weka Data Mining & Preprocessing Guide
No ratings yet
Weka Data Mining & Preprocessing Guide
11 pages
Data Mining with WEKA Lab Manual
0% (1)
Data Mining with WEKA Lab Manual
30 pages
Introduction to WEKA Data Mining Tool
No ratings yet
Introduction to WEKA Data Mining Tool
69 pages
Introduction to WEKA: GUI Overview
No ratings yet
Introduction to WEKA: GUI Overview
13 pages
Weka-: Data Warehousing and Data Mining Lab Manual-Week 9
100% (1)
Weka-: Data Warehousing and Data Mining Lab Manual-Week 9
8 pages
Weka Tool Guide for Data Analysts
No ratings yet
Weka Tool Guide for Data Analysts
6 pages
AI32 Guide To Weka PDF
No ratings yet
AI32 Guide To Weka PDF
6 pages
WEKA Practical Protocol
No ratings yet
WEKA Practical Protocol
40 pages
Data Mining Lab Manual
No ratings yet
Data Mining Lab Manual
50 pages
Weka Tutorial
100% (1)
Weka Tutorial
32 pages
Weka Overview Slides
No ratings yet
Weka Overview Slides
31 pages
Weka Data Mining Overview and Features
No ratings yet
Weka Data Mining Overview and Features
7 pages
Data Warehousing & Mining Lab Record
No ratings yet
Data Warehousing & Mining Lab Record
54 pages
Data Mining (WEKA) en
No ratings yet
Data Mining (WEKA) en
51 pages
WEKA Explorer User Guide Overview
No ratings yet
WEKA Explorer User Guide Overview
13 pages
Data Warehousing and Data Mining Lab Manual
100% (1)
Data Warehousing and Data Mining Lab Manual
30 pages
Lab Manual (2024)
No ratings yet
Lab Manual (2024)
56 pages
DWDM Lab Manual
No ratings yet
DWDM Lab Manual
55 pages
Mooc On Weka
No ratings yet
Mooc On Weka
59 pages
Workshop 1
No ratings yet
Workshop 1
16 pages
Weka
No ratings yet
Weka
99 pages
DW Lab Manual
No ratings yet
DW Lab Manual
44 pages
Data Warehousing & Mining Lab Guide
No ratings yet
Data Warehousing & Mining Lab Guide
49 pages
Data Mining Lab Manual for CSE
No ratings yet
Data Mining Lab Manual for CSE
50 pages
Introduction to Weka for Machine Learning
No ratings yet
Introduction to Weka for Machine Learning
8 pages
DWM1 Riya
No ratings yet
DWM1 Riya
16 pages
Data Mining Lab Manual Using WEKA
No ratings yet
Data Mining Lab Manual Using WEKA
41 pages
Introduction To Weka-A Toolkit For Machine Learning
No ratings yet
Introduction To Weka-A Toolkit For Machine Learning
11 pages
Exploring Weka Tool Interfaces and Features
No ratings yet
Exploring Weka Tool Interfaces and Features
7 pages
Weka Machine Learning Quick Guide
No ratings yet
Weka Machine Learning Quick Guide
45 pages
WEKA: Comprehensive Data Mining Guide
No ratings yet
WEKA: Comprehensive Data Mining Guide
41 pages
Data Mining Lab Manual
No ratings yet
Data Mining Lab Manual
36 pages
Weka Data Preprocessing and Decision Trees
No ratings yet
Weka Data Preprocessing and Decision Trees
8 pages
DHW Lab (Ex1 To 3)
No ratings yet
DHW Lab (Ex1 To 3)
18 pages
WEKA Data Exploration and Analysis Guide
No ratings yet
WEKA Data Exploration and Analysis Guide
21 pages
Introduction to WEKA: Features & Usage
No ratings yet
Introduction to WEKA: Features & Usage
51 pages
Weka Data Mining Lab Guide
No ratings yet
Weka Data Mining Lab Guide
20 pages
Lab 04
No ratings yet
Lab 04
7 pages
Overview of WEKA Data Mining Tools
No ratings yet
Overview of WEKA Data Mining Tools
39 pages
Data Mining Complete Lab Manual - DRSNR
No ratings yet
Data Mining Complete Lab Manual - DRSNR
27 pages
Lecture 12 - Weka Tutorial
No ratings yet
Lecture 12 - Weka Tutorial
84 pages
Weka Guide for Data Scientists
No ratings yet
Weka Guide for Data Scientists
5 pages
Introduction To WEKA: Data Mining WEKA - What Is It? Weka Uis Integration With Pentaho Projects Based On Weka
No ratings yet
Introduction To WEKA: Data Mining WEKA - What Is It? Weka Uis Integration With Pentaho Projects Based On Weka
27 pages
Data Exploration and Integration in WEKA
No ratings yet
Data Exploration and Integration in WEKA
63 pages
DW 9 Exp 1
No ratings yet
DW 9 Exp 1
43 pages
Machine Learning With WEKA An Introduction
No ratings yet
Machine Learning With WEKA An Introduction
66 pages
Introduction to Weka Tool and Features
No ratings yet
Introduction to Weka Tool and Features
38 pages
Geotechnical Report: Leeds South Line
No ratings yet
Geotechnical Report: Leeds South Line
104 pages
10 Types of Cross Examinations Explained
100% (1)
10 Types of Cross Examinations Explained
13 pages
Settings Provider
No ratings yet
Settings Provider
16 pages
My Account Details
No ratings yet
My Account Details
2 pages
Week Wise Syllabus - CHNA
No ratings yet
Week Wise Syllabus - CHNA
4 pages
HCOB Flash Germany PMI: German Business Activity Rises Only Marginally in June As Growth Slows
No ratings yet
HCOB Flash Germany PMI: German Business Activity Rises Only Marginally in June As Growth Slows
4 pages
Pop Art Exploration for Students
No ratings yet
Pop Art Exploration for Students
3 pages
UCTE Operation Handbook Policy 1
No ratings yet
UCTE Operation Handbook Policy 1
18 pages
Saudi Arabia's Cyber Warfare Mitigation Strategies
No ratings yet
Saudi Arabia's Cyber Warfare Mitigation Strategies
3 pages
A Spanish Portrait: Llobet Tárrega Granados Albeniz
No ratings yet
A Spanish Portrait: Llobet Tárrega Granados Albeniz
5 pages
DAR 2021 Vol 1 Compressed
No ratings yet
DAR 2021 Vol 1 Compressed
2,323 pages
How To Read People Mind
No ratings yet
How To Read People Mind
3 pages
MCM Data Renewal Sanction 2013-14 Weblist
No ratings yet
MCM Data Renewal Sanction 2013-14 Weblist
35 pages
GATE 2024: 60-Day Physics Challenge
No ratings yet
GATE 2024: 60-Day Physics Challenge
158 pages
Natural-Convection and Radiation in Porous Cavities
No ratings yet
Natural-Convection and Radiation in Porous Cavities
13 pages
Bungee Jumping: Algebraic Modeling Project
No ratings yet
Bungee Jumping: Algebraic Modeling Project
11 pages
FireMon - User Guide - Getting Started Guide 9.12
No ratings yet
FireMon - User Guide - Getting Started Guide 9.12
105 pages
Customer Satisfaction in Hotel Services: Case-Lake Kivu Serena Hotel
100% (1)
Customer Satisfaction in Hotel Services: Case-Lake Kivu Serena Hotel
51 pages
Graphene: Mechanical and Electrical Properties
No ratings yet
Graphene: Mechanical and Electrical Properties
3 pages
Challenges and Opportunities in Ethiopia's Manufacturing Sector
100% (1)
Challenges and Opportunities in Ethiopia's Manufacturing Sector
7 pages
How Generative AI Will Change Sales1 T6 23
No ratings yet
How Generative AI Will Change Sales1 T6 23
8 pages
ENGLISH NOTE ON Transitive and Intransitive Verbs PROF DUKER
No ratings yet
ENGLISH NOTE ON Transitive and Intransitive Verbs PROF DUKER
4 pages
Cambridge IGCSE Global Perspectives Answers
0% (1)
Cambridge IGCSE Global Perspectives Answers
11 pages
Muhammad Abrar's Professional Profile
No ratings yet
Muhammad Abrar's Professional Profile
3 pages
Single-Channel Queuing System Analysis
No ratings yet
Single-Channel Queuing System Analysis
4 pages
48V DCDB 1 & 2
100% (2)
48V DCDB 1 & 2
16 pages
Unconventional Petroleum in Ordos Basin
No ratings yet
Unconventional Petroleum in Ordos Basin
12 pages
Environment and Competitiveness Redefined
No ratings yet
Environment and Competitiveness Redefined
23 pages
RTCReporting - Messagelog - 2024 06 11 19 21 34
No ratings yet
RTCReporting - Messagelog - 2024 06 11 19 21 34
357 pages
Evolution of the Philippine Constitution
No ratings yet
Evolution of the Philippine Constitution
2 pages

Getting Started with WEKA Data Mining

Uploaded by

Getting Started with WEKA Data Mining

Uploaded by

DataminingwithWEKA

OpenWeka :Start>AllPrograms>Weka 3.x.x>Weka 3.x

ThenweapplyRemovePercentage (Unsupervised >Instance)withpercentage30andsavethe

Inordertocheckhowwellwedoontheunseendata,weselect"supplied test set",weopen

You might also like