Weka Data Mining Overview and Techniques

Weka is an open source data mining software written in Java. It contains tools for data pre-processing, classification, regression, clustering, association rules, and visualization. Weka can import data from files or databases and contains filters for tasks like discretization, normalization, and attribute selection. It builds models using classification algorithms like decision trees, neural networks, and SVM. Results can be evaluated using cross-validation in the Explorer GUI.

Uploaded by

princessdiaress

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

226 views63 pages

Weka Data Mining Overview and Techniques

Uploaded by

princessdiaress

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

Introduction to Weka

Xingquan (Hill) Zhu

Slides copied from Jeffrey Junfeng Pan (UST)

Outline
Weka
Data Source
Feature selection
Model building
Classifier / Cross Validation
Result visualization
WEKA
[Link]
Data mining software in Java
Open source software

UCI Data Repository

[Link]
[Link]
Explorer: pre-processing the data

Data can be imported from a file in various

formats: ARFF, CSV, C4.5, binary
Data can also be read from a URL or from an
SQL database (using JDBC)
Pre-processing tools in WEKA are called
filters
WEKA contains filters for:
Discretization, normalization, resampling, attribute
selection, transforming and combining attributes,
WEKA only deals with flat files
@relation heart-disease-simplified

@attribute age numeric

@attribute sex { female, male}
@attribute chest_pain_type { typ_angina, asympt, non_anginal, atyp_angina}
@attribute cholesterol numeric
@attribute exercise_induced_angina { no, yes}
@attribute class { present, not_present}

@data
63,male,typ_angina,233,no,not_present
67,male,asympt,286,yes,present
67,male,asympt,229,yes,present
38,female,non_anginal,?,no,not_present
...
WEKA only deals with flat files
@relation heart-disease-simplified

@attribute age numeric

@data
63,male,typ_angina,233,no,not_present
67,male,asympt,286,yes,present
67,male,asympt,229,yes,present
38,female,non_anginal,?,no,not_present
...
Explorer: attribute selection
Panel that can be used to investigate which (subsets of)
attributes are the most predictive ones
Attribute selection methods contain two parts:
A search method: best-first, forward selection, random,

exhaustive, genetic algorithm, ranking

An evaluation method: correlation-based, wrapper,

information gain, chi-squared,

Very flexible: WEKA allows (almost) arbitrary combinations of
these two
Explorer: building classifiers

Classifiers in WEKA are models for predicting

nominal or numeric quantities
Implemented learning schemes include:
Decision trees and lists, instance-based classifiers,
support vector machines, multi-layer perceptrons,
logistic regression, Bayes nets,
Meta-classifiers include:
Bagging, boosting, stacking, error-correcting output
codes, locally weighted learning,
Problem with Running Weka
Problem : Out of memory for large data set

Solution : java -Xmx1000m -jar [Link]

Outline
Weka
Data Source
Feature selection
Model building
Classifier / Cross Validation
Result visualization

An Introduction To WEKA
No ratings yet
An Introduction To WEKA
85 pages
WEKA Lab Record
No ratings yet
WEKA Lab Record
69 pages
ML Tools: Weka & RapidMiner Guide
No ratings yet
ML Tools: Weka & RapidMiner Guide
15 pages
WEKA: ML Tool for Data Scientists
No ratings yet
WEKA: ML Tool for Data Scientists
23 pages
Weka Data Mining Lab Guide
No ratings yet
Weka Data Mining Lab Guide
20 pages
Overview of WEKA Data Mining Software
No ratings yet
Overview of WEKA Data Mining Software
17 pages
Distributed Weka for Data Mining
No ratings yet
Distributed Weka for Data Mining
36 pages
Introduction to WEKA for Data Mining
No ratings yet
Introduction to WEKA for Data Mining
24 pages
Data Mining Example (Using Weka)
50% (2)
Data Mining Example (Using Weka)
59 pages
Preprocessing Student.arff Dataset in WEKA
100% (1)
Preprocessing Student.arff Dataset in WEKA
4 pages
Credit Risk Assessment Lab Manual
No ratings yet
Credit Risk Assessment Lab Manual
34 pages
Data Mining Lab Guide
33% (3)
Data Mining Lab Guide
44 pages
Data Analysis Using WEKA
89% (9)
Data Analysis Using WEKA
24 pages
Weka Machine Learning Toolkit Guide
No ratings yet
Weka Machine Learning Toolkit Guide
4 pages
WEKA Guide for ML Enthusiasts
No ratings yet
WEKA Guide for ML Enthusiasts
52 pages
Data Warehouse Scheme and Syllabus
No ratings yet
Data Warehouse Scheme and Syllabus
2 pages
Data Analysis with WEKA Guide
No ratings yet
Data Analysis with WEKA Guide
21 pages
Understanding Nominal Attributes in Data Mining
No ratings yet
Understanding Nominal Attributes in Data Mining
16 pages
Big Data Analytics Course
No ratings yet
Big Data Analytics Course
3 pages
Database Systems Course Guide
No ratings yet
Database Systems Course Guide
35 pages
ML Unit 3
No ratings yet
ML Unit 3
30 pages
File Organization and Indexing Techniques
No ratings yet
File Organization and Indexing Techniques
23 pages
Clustering with iris.arff Dataset
No ratings yet
Clustering with iris.arff Dataset
41 pages
Chapter 5: Advanced SQL: Database System Concepts, 6 Ed
No ratings yet
Chapter 5: Advanced SQL: Database System Concepts, 6 Ed
77 pages
A* Search Algorithm Overview
No ratings yet
A* Search Algorithm Overview
20 pages
EC9560 Data Mining: Lab 02: Classification and Prediction Using WEKA
No ratings yet
EC9560 Data Mining: Lab 02: Classification and Prediction Using WEKA
5 pages
R23!3!1 DWDM Final Syllabus On 21-06-2025
No ratings yet
R23!3!1 DWDM Final Syllabus On 21-06-2025
5 pages
Rohini 29863966839
No ratings yet
Rohini 29863966839
6 pages
Object-Oriented Databases Guide
No ratings yet
Object-Oriented Databases Guide
31 pages
Spark SQL PPT 3.2.3 and 3.2.4
No ratings yet
Spark SQL PPT 3.2.3 and 3.2.4
17 pages
Understanding Data Mining Techniques
No ratings yet
Understanding Data Mining Techniques
47 pages
CS-3006 - Parallel and Distributed Computing - (BS All Programs) - Spring-2023
No ratings yet
CS-3006 - Parallel and Distributed Computing - (BS All Programs) - Spring-2023
6 pages
Star UML
No ratings yet
Star UML
25 pages
Chapter 5 - Requirement Validation
No ratings yet
Chapter 5 - Requirement Validation
31 pages
Data Mining Techniques Unit 2
No ratings yet
Data Mining Techniques Unit 2
48 pages
Data Mining Term Project Machine Learning With WEKA: Weka Explorer Tutorial For Version 3.4.3
No ratings yet
Data Mining Term Project Machine Learning With WEKA: Weka Explorer Tutorial For Version 3.4.3
42 pages
Systems Integration & ERP Overview
No ratings yet
Systems Integration & ERP Overview
7 pages
Data Mining and Warehouse Lab Manual
100% (1)
Data Mining and Warehouse Lab Manual
69 pages
DMDW Full Notes
No ratings yet
DMDW Full Notes
26 pages
Data Warehouse Basics & Models
No ratings yet
Data Warehouse Basics & Models
33 pages
Data Preprocessing: L1+ Freq
No ratings yet
Data Preprocessing: L1+ Freq
13 pages
Data Discretization Techniques
No ratings yet
Data Discretization Techniques
21 pages
ML m1-m5 NOTES
No ratings yet
ML m1-m5 NOTES
160 pages
Big Data and Data Analytics Cloudera.
No ratings yet
Big Data and Data Analytics Cloudera.
3 pages
Unit-3 DWDM
No ratings yet
Unit-3 DWDM
11 pages
Unsupervised Learning: Clustering Algorithms
No ratings yet
Unsupervised Learning: Clustering Algorithms
13 pages
Data Warehousing Lab Manual 2021
No ratings yet
Data Warehousing Lab Manual 2021
48 pages
Data Mining Lab Questions
100% (1)
Data Mining Lab Questions
47 pages
Lab Assignment Report: ECS 851 Data Warehousing and Data Mining
No ratings yet
Lab Assignment Report: ECS 851 Data Warehousing and Data Mining
69 pages
UNIT 3 Classification
No ratings yet
UNIT 3 Classification
17 pages
TE7265 - Introduction To Data Science
No ratings yet
TE7265 - Introduction To Data Science
4 pages
Pattern Recognition in AI
No ratings yet
Pattern Recognition in AI
3 pages
New Data Warehouse Lab Manual
No ratings yet
New Data Warehouse Lab Manual
19 pages
Overview of WEKA Data Mining Tools
No ratings yet
Overview of WEKA Data Mining Tools
39 pages
Introduction to Weka for Machine Learning
No ratings yet
Introduction to Weka for Machine Learning
8 pages
DWDM Lab Manual
No ratings yet
DWDM Lab Manual
55 pages
Introduction to Weka Data Mining Tool
No ratings yet
Introduction to Weka Data Mining Tool
17 pages
Data Mining Lab Manual for CSE
No ratings yet
Data Mining Lab Manual for CSE
50 pages
WEKA: Comprehensive Data Mining Guide
No ratings yet
WEKA: Comprehensive Data Mining Guide
41 pages
Machine Learning With WEKA An Introduction
No ratings yet
Machine Learning With WEKA An Introduction
66 pages
Software Defined Radio with LabVIEW
No ratings yet
Software Defined Radio with LabVIEW
75 pages
Introduction To USRP PDF
No ratings yet
Introduction To USRP PDF
14 pages
The Lab Manual Rev 5 PDF
No ratings yet
The Lab Manual Rev 5 PDF
219 pages
Techniques for Straightforward Analysis
No ratings yet
Techniques for Straightforward Analysis
1 page
DNN/CNN Toolbox Overview
No ratings yet
DNN/CNN Toolbox Overview
52 pages
Wavelet Representation for Signal Decomposition
No ratings yet
Wavelet Representation for Signal Decomposition
20 pages
Optimization in Scilab
No ratings yet
Optimization in Scilab
70 pages
DNN/CNN Toolbox Overview
No ratings yet
DNN/CNN Toolbox Overview
52 pages
Object Detection Techniques Overview
No ratings yet
Object Detection Techniques Overview
70 pages
MySQL High Availability Solutions Guide
No ratings yet
MySQL High Availability Solutions Guide
1 page
International Hope School Bangladesh: 2021-2022 Academic Year Model Test Further Mechanics Time: 75mins
No ratings yet
International Hope School Bangladesh: 2021-2022 Academic Year Model Test Further Mechanics Time: 75mins
12 pages
(ICT) - 스마트 영상을 활용한 건설현장 업무 개선 및 고도화 방안 연구
No ratings yet
(ICT) - 스마트 영상을 활용한 건설현장 업무 개선 및 고도화 방안 연구
215 pages
Revisiting Planning Standards For Recreational Facilities in
100% (1)
Revisiting Planning Standards For Recreational Facilities in
14 pages
New TOEFL Speaking 2023
No ratings yet
New TOEFL Speaking 2023
6 pages
Essential Marketing Metrics Explained
No ratings yet
Essential Marketing Metrics Explained
21 pages
ONVIF Conformance Declaration for PTZ Camera
No ratings yet
ONVIF Conformance Declaration for PTZ Camera
2 pages
Community Action Plan Guide
No ratings yet
Community Action Plan Guide
2 pages
Value-Process Framework in Strategy
No ratings yet
Value-Process Framework in Strategy
22 pages
ICPMA-2025: International Math Conference
No ratings yet
ICPMA-2025: International Math Conference
2 pages
Travel Essay
No ratings yet
Travel Essay
16 pages
Amul Ice Cream Customer Perception Study
No ratings yet
Amul Ice Cream Customer Perception Study
6 pages
Business Computing Applications Overview
No ratings yet
Business Computing Applications Overview
62 pages
Herzberg's Two-Factor Motivation Theory
No ratings yet
Herzberg's Two-Factor Motivation Theory
18 pages
Certificate Regarding Thesis Format
No ratings yet
Certificate Regarding Thesis Format
3 pages
8085 Microprocessor Guide
No ratings yet
8085 Microprocessor Guide
31 pages
Plate Load Test Methodology and Limitations
100% (1)
Plate Load Test Methodology and Limitations
5 pages
Universal Disk Format Specification: Revision 2.60
No ratings yet
Universal Disk Format Specification: Revision 2.60
168 pages
Engineering Mechanics Tutorial
No ratings yet
Engineering Mechanics Tutorial
3 pages
Marksheet - Magadh University, Bodh Gaya
No ratings yet
Marksheet - Magadh University, Bodh Gaya
1 page
Mastering Hibernate - Sample Chapter
No ratings yet
Mastering Hibernate - Sample Chapter
27 pages
CTS Mech. Ref. and Air Conditioning - CTS - NSQF-5 PDF
No ratings yet
CTS Mech. Ref. and Air Conditioning - CTS - NSQF-5 PDF
80 pages
19 The Visual Factory GREIF, Michel
No ratings yet
19 The Visual Factory GREIF, Michel
146 pages
Gulliver Social and Political Satire
86% (7)
Gulliver Social and Political Satire
2 pages
امتحانات متفوقيتن 3 ع - 251107 - 003132
No ratings yet
امتحانات متفوقيتن 3 ع - 251107 - 003132
13 pages
Prediction of Movie Success Using Sentiment Analysis of Tweets
No ratings yet
Prediction of Movie Success Using Sentiment Analysis of Tweets
6 pages
Early Childhood Development Stages & Milestones
No ratings yet
Early Childhood Development Stages & Milestones
13 pages
System Software Module 1
0% (1)
System Software Module 1
67 pages
Question Bank 1 Introduction To Computer: Q.1 Fill in The Blanks
100% (1)
Question Bank 1 Introduction To Computer: Q.1 Fill in The Blanks
32 pages
Modeling of Void Formation During Resin Transfer Molding - ICCM
No ratings yet
Modeling of Void Formation During Resin Transfer Molding - ICCM
8 pages

Weka Data Mining Overview and Techniques

Uploaded by

Weka Data Mining Overview and Techniques

Uploaded by

Introduction to Weka

Xingquan (Hill) Zhu

Slides copied from Jeffrey Junfeng Pan (UST)

UCI Data Repository

Data can be imported from a file in various

@attribute age numeric

@attribute age numeric

exhaustive, genetic algorithm, ranking

information gain, chi-squared,

Classifiers in WEKA are models for predicting

Solution : java -Xmx1000m -jar [Link]

You might also like