0% found this document useful (0 votes)

74 views

1.3 What Kind of Data Can Be Mined?

This document discusses various topics related to data mining including: the types of data that can be mined from databases, data warehouses, and transactional data; the kinds of patterns that can be mined including classifications, associations, clusters, and outliers; major issues in data mining like methodology, efficiency, and diversity of database types; an overview of data preprocessing tasks like cleaning, integration, reduction, transformation, and discretization; methods for mining frequent patterns and associations; classification algorithms like decision trees, naive Bayes, rules, neural networks, and support vector machines; clustering methods such as k-means, hierarchical, and density-based; applications of data mining in domains like finance, retail, science, security, and recommender systems.

Uploaded by

Khushboo Kundnani

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

74 views

1.3 What Kind of Data Can Be Mined?

Uploaded by

Khushboo Kundnani

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 5

1.3 What kind of data can be Mined?

1.3.1 Database Data

1.3.2 Data Warehouses

1.3.3 Transactional Data

1.3.4 Other Kinds of Data

1.4 What Kinds of Patterns can be Mined?

1.4.1 Class/Concept Description:Characterization and Discrimination

1.4.2 Mining Frequent Patterns,Associations and Corrections

1.4.3 Classification and Regression for Predictive Analysis

1.4.4 Cluster Analysis

1.4.5 Outlier Analysis

1.4.6 Are All Patterns Interesting

1.7. Major Issues in Data Mining

1.7.1 Mining Methodology

1.7.2 User Interaction

1.7.3 Efficiency and Scalability

1.7.4 Diversity of Database Types

1.7.5 Data Mining and Society

3.Data Preprocessing

3.1 Data Preprocessing : An Overview

3.1.1 Data Quality:Why Preprocess the Data?

3.1.2 Major Tasks in Data Preprocessing

3.2 Data Cleaning

3.2.1 Missing Values

3.2.2 Noisy Data

3.2.3 Data Cleaning as a process

3.3 Data Intergration

3.3.1 Entity Identification Problem

3.3.2 Redundancy and correlation Analysis

3.3.3 Tuple Duplication

3.3.4 Data Value Conflict Detection and Resolution

3.4 Data Reduction

3.4.1 Overview of Data Reduction Strategies

3.4.2 Wavelet Transforms

3.4.3 Principal Components Analysis

3.4.4 Attribute Subset Selection

3.4.5 Regression and Log-Linear Models: Parametric Data Reduction

3.4.6 Histograms

3.4.7 Clustering

3.4.8 Sampling

3.4.9 Data Cube Aggregation

3.5 Data Transformation and Data Discretization

3.5.1 Data Transformation Strategies Overview

3.5.2 Data Transformation by Normalization

3.5.3 Discretization by Binning

3.5.4 Discretization by Histogram Analysis

3.5.5 Discretization by Cluster,Decision Tree,and correlation Analyses

3.5.6 Concept Hierachy Generation for Nominal Data

6.Mining Frequent Patterns ,Associations, and Correlation:Basic Concepts and Methods

6.1 Basic Concepts

6.1.1 Market Basket Analysis: A Motivating Example

6.1.2 Frequent Item sets, Closed Itemsets, and Association Rules

6.2 Frequent Item set Mining Methods

6.2.1 Apriori Algorithm: Finding Frequent Item sets by confined Candidate Generation
6.3 Which Patterns Are Interesting?-Pattern Evaluation Methods

6.3.1 Strong Rules Are Not Necessarily Interesting

6.3.2 From Association Analysis to Correlation Analysis

7.2 Pattern Mining in Multilevel, Multidimensional Space

7.2.1 Mining Multilevel Associations

7.2.2 Mining Multidimensional Associations

8 Classification :Basic Concepts

8.1 Basic Concepts

8.1.1 What is Classification?

8.1.2 Genreral Approach to Calssification

8.2 Decision Tree Induction

8.2.1 Decision Tree Induction

8.2.2 Attribute Selection Measures

8.3 Bayes Classification Methods

8.3.1 Bayes’ Theorem

8.3.2 Naïve Bayesian Classification

8.4 Rule –Based Classification

8.4.1 Using IF-THEN Rules for Classification

8.4.2 Rule Extraction from a Decision Tree

9.2 Classification by Backpropagation

9.2.1 A Multilayer Feed-Forward Neural Network

9.2.2 Defining A Network Topology

9.2.3 Backpropagation

9.3 Support Vector Machines

9.3.1 The Case When the Data Are Linearly Separable

9.3.2 The Case When the Data Are Linearly Inseparable

9.4 Classification Using Frequent Patterns

9.4.1 Associative Classification

9.5 Lazy Learners(or Learning from neighbors)

9.5.1 k-Nearest –Neighbor Classifier

9.6 Other Classification Methods

9.6.1 Genetic Algorithms

9.6.2 Rough Set Approach

9.6.3 Fuzzy Set Approaches

10.1 Cluster Analysis

10.1.1 What is Cluster Analysis?

10.1.2 Requirements for ClusterAnalysis

10.1.3 Overview Of Basic Clustering Methods

10.2 Partitioning Methods

10.2.1 k-Means:A Centroid-Base Technique

10.3 Hierarchical Methods

10.3.1 Agglomerative versus Divisive Hierarchical Clustering

10.4 Density:Based Methods

10.5.1 STING: STatistical Information Grid

11.1 Probabilistic Model_Based Clustering

11.1.1 Fuzzy Clusters

11.1.2 Probabilistic Model –Based Clusters

11.1.3 Expectation –Maximization Algorithm

11.2 Clustering High Dimensional Data

11.2.1 Clustering High Dimensional Data: Problems, Challenges, and Major Methodologies

11.2.2 Subspace Clustering Methods

11.2.3 Biclustering

11.2.4 Dimensionality Reduction Methods and Spectral Clustering

11.4 Clustering with Constraints

11.4.1 Categorization of Constraints

11.4.2 Methods for Clustering with Constraints

12.1 Outliers and Outlier Analysis

12.1.1 What are Outliers?

12.1.2 Types of Outliers

12.1.3 Challenges of Outlier Detection

13.3 Data Mining Applications

13.3.1 Data Mining for Financial Data Analysis

13.3.2 Data Mining for Retail and Telecommunication Industries

13.3.3 Data Mining in Science and Engineering

13.3.4 Data Mining for Intrusion Detetion and Prevention

13.3.5 Data Mining and Recommender Systems

A Brief Overview On Data Mining Survey PDF
No ratings yet
A Brief Overview On Data Mining Survey PDF
8 pages
Data Analyst Resume: A Complete Guide: Preface
100% (1)
Data Analyst Resume: A Complete Guide: Preface
12 pages
1 IT326 - Ch1 - Introduction
No ratings yet
1 IT326 - Ch1 - Introduction
37 pages
Data Warehousing and Data Mining Dr.P.rizwan Ahmed
0% (1)
Data Warehousing and Data Mining Dr.P.rizwan Ahmed
20 pages
Data Mining & Data Warehousing
No ratings yet
Data Mining & Data Warehousing
84 pages
Archana Data Mining
No ratings yet
Archana Data Mining
24 pages
Fundamentals of Data Mining
No ratings yet
Fundamentals of Data Mining
36 pages
Data Mining Summaries PDF
No ratings yet
Data Mining Summaries PDF
22 pages
Unit-4 DWM
No ratings yet
Unit-4 DWM
73 pages
unit 3 BI & Data science (1)
No ratings yet
unit 3 BI & Data science (1)
19 pages
data mining 1
No ratings yet
data mining 1
39 pages
Data Mining: An Overview From A Database Perspective
No ratings yet
Data Mining: An Overview From A Database Perspective
30 pages
Data Mining
No ratings yet
Data Mining
26 pages
BCA Data Mining
No ratings yet
BCA Data Mining
116 pages
DM-Unit-I Introduction To Association-1
No ratings yet
DM-Unit-I Introduction To Association-1
97 pages
Dwdm Unit-II Notes
No ratings yet
Dwdm Unit-II Notes
29 pages
Datamining 1
No ratings yet
Datamining 1
30 pages
Lec 1 Data Mining Introduction For Exam
No ratings yet
Lec 1 Data Mining Introduction For Exam
48 pages
Data Mining: Concepts and Techniques
No ratings yet
Data Mining: Concepts and Techniques
28 pages
Introduction To Data Mining
No ratings yet
Introduction To Data Mining
17 pages
Lecture 1-Introduction To Data Mining - M
No ratings yet
Lecture 1-Introduction To Data Mining - M
38 pages
Data Mining Concepts
No ratings yet
Data Mining Concepts
35 pages
Data Mining
No ratings yet
Data Mining
13 pages
Introduction To Data Mining-Week1
No ratings yet
Introduction To Data Mining-Week1
43 pages
Data mining_concepts and techniques
No ratings yet
Data mining_concepts and techniques
13 pages
Data Mining & Business Intelligence
No ratings yet
Data Mining & Business Intelligence
322 pages
Combine 056
No ratings yet
Combine 056
57 pages
Data Mining Tutorials
No ratings yet
Data Mining Tutorials
52 pages
Mehrdad Jalali: Jalali@mshdiau - Ac.ir Jalali - Mshdiau.ac - Ir
No ratings yet
Mehrdad Jalali: Jalali@mshdiau - Ac.ir Jalali - Mshdiau.ac - Ir
27 pages
Data Mining Techniques and Applications
No ratings yet
Data Mining Techniques and Applications
16 pages
Unit - 2 Data Minig Notes
No ratings yet
Unit - 2 Data Minig Notes
15 pages
7dm Midterm Reviewer
No ratings yet
7dm Midterm Reviewer
10 pages
Data Mining Unit 1
No ratings yet
Data Mining Unit 1
39 pages
Data Warehousing and Data Mining
No ratings yet
Data Warehousing and Data Mining
84 pages
Data Warehouse Presentation
No ratings yet
Data Warehouse Presentation
28 pages
ICS 2408 Lecture 1 Introduction
No ratings yet
ICS 2408 Lecture 1 Introduction
32 pages
1712060004 (1)
No ratings yet
1712060004 (1)
25 pages
Data Mining
No ratings yet
Data Mining
63 pages
Data Mining 1
No ratings yet
Data Mining 1
56 pages
Chapter 1 Data Mining Lecture Note
No ratings yet
Chapter 1 Data Mining Lecture Note
31 pages
Dunham - Data Mining PDF
No ratings yet
Dunham - Data Mining PDF
156 pages
Dunham - Data Mining PDF
83% (6)
Dunham - Data Mining PDF
156 pages
DWDM-LS1-Fall-24-25
No ratings yet
DWDM-LS1-Fall-24-25
42 pages
Data Mining Nostos
100% (1)
Data Mining Nostos
39 pages
Data Mining
No ratings yet
Data Mining
6 pages
Association Rule Mining - Models and Algorithms (Zhang & Zhang 2002-05-28)
50% (2)
Association Rule Mining - Models and Algorithms (Zhang & Zhang 2002-05-28)
248 pages
Data Mining Implementation
No ratings yet
Data Mining Implementation
9 pages
8 Data Mining Algorithms
No ratings yet
8 Data Mining Algorithms
8 pages
DWDM 01 Introduction
No ratings yet
DWDM 01 Introduction
43 pages
Data Mining AND Warehousing: Abstract
No ratings yet
Data Mining AND Warehousing: Abstract
12 pages
DataWarehouseMining Complete Notes
No ratings yet
DataWarehouseMining Complete Notes
55 pages
Data Mining - Prashant
No ratings yet
Data Mining - Prashant
10 pages
Unit-1 Notes (1)
No ratings yet
Unit-1 Notes (1)
24 pages
DMW Notes UNIT-1 2023-24
No ratings yet
DMW Notes UNIT-1 2023-24
15 pages
Paper - Xvii Data Mining and Warehousing
No ratings yet
Paper - Xvii Data Mining and Warehousing
140 pages
Basic Concepts Data Mining (Lecture 02) - 1
No ratings yet
Basic Concepts Data Mining (Lecture 02) - 1
40 pages
data mining unit I notes
No ratings yet
data mining unit I notes
24 pages
UNIT 1 Introduction of Data Mining
No ratings yet
UNIT 1 Introduction of Data Mining
11 pages
Data Mining and Data Warehousing
No ratings yet
Data Mining and Data Warehousing
13 pages
Fundamentals of Machine Learning: An Introduction to Neural Networks
From Everand
Fundamentals of Machine Learning: An Introduction to Neural Networks
Peter Johnson
No ratings yet
Contemporary Machine Learning Methods: Harnessing Scikit-Learn and TensorFlow
From Everand
Contemporary Machine Learning Methods: Harnessing Scikit-Learn and TensorFlow
Adam Jones
No ratings yet
CT 1 Paper
No ratings yet
CT 1 Paper
3 pages
Pointers: What Is A Pointer?
No ratings yet
Pointers: What Is A Pointer?
20 pages
Schedule For The Data Warehousing and Data Mining
No ratings yet
Schedule For The Data Warehousing and Data Mining
1 page
Hindu Mission Hospital
No ratings yet
Hindu Mission Hospital
1 page
To Write A C Program For Calculating Simple Interest
No ratings yet
To Write A C Program For Calculating Simple Interest
2 pages
Computer Parts: There Are Many Parts That Work Together To Make A Computer Work
No ratings yet
Computer Parts: There Are Many Parts That Work Together To Make A Computer Work
32 pages
Project Report ON "Market Study of Ethical Hacking"
No ratings yet
Project Report ON "Market Study of Ethical Hacking"
44 pages
Unit 2 PDF
100% (1)
Unit 2 PDF
15 pages
Disciplines and Ideas in The Social Sciences (Grade 11) Q 1 - W 1 (AUGUST 24-28, 2020) Lesson 1: Understanding The Domain of Social Sciences
No ratings yet
Disciplines and Ideas in The Social Sciences (Grade 11) Q 1 - W 1 (AUGUST 24-28, 2020) Lesson 1: Understanding The Domain of Social Sciences
9 pages
Effectsof Change Managementonthe Performanceof Firmsin Nigeria
No ratings yet
Effectsof Change Managementonthe Performanceof Firmsin Nigeria
7 pages
Corso GPFS Part 2
No ratings yet
Corso GPFS Part 2
20 pages
Data Warehouse - Final
No ratings yet
Data Warehouse - Final
28 pages
EBSCO FullText 2024 05 06
No ratings yet
EBSCO FullText 2024 05 06
12 pages
Literature Review Public Procurement
100% (1)
Literature Review Public Procurement
7 pages
Gonzalez Allison Structured Log Itec7305 Fa22
No ratings yet
Gonzalez Allison Structured Log Itec7305 Fa22
3 pages
Session2 Short
No ratings yet
Session2 Short
196 pages
(,, ,, ) //create Table : 'Xyz' 'Abc' 'Pun'
No ratings yet
(,, ,, ) //create Table : 'Xyz' 'Abc' 'Pun'
7 pages
SignaturedBasedModelClassifyLungCancerStage-10
No ratings yet
SignaturedBasedModelClassifyLungCancerStage-10
5 pages
The Use of Lexical Cohesion in The Lyrics of Captain Jack Band
No ratings yet
The Use of Lexical Cohesion in The Lyrics of Captain Jack Band
10 pages
Information System For Urban Planning
No ratings yet
Information System For Urban Planning
75 pages
FINAL_PPT_IOMP [Autosaved]
No ratings yet
FINAL_PPT_IOMP [Autosaved]
14 pages
KaplanAndreas-SiriSiriinmyhand
No ratings yet
KaplanAndreas-SiriSiriinmyhand
12 pages
The GDPR and You
100% (1)
The GDPR and You
11 pages
Know More About Each File in ESSBASE
No ratings yet
Know More About Each File in ESSBASE
1 page
WWW Wildethics Org Essays Being and Seeming HTML
No ratings yet
WWW Wildethics Org Essays Being and Seeming HTML
17 pages
Science Quarter 1 WEEK 1.1: Not For Sale
No ratings yet
Science Quarter 1 WEEK 1.1: Not For Sale
5 pages
Thursday, September 08, 2016 12:18 PM
No ratings yet
Thursday, September 08, 2016 12:18 PM
23 pages
Report File Unedited
No ratings yet
Report File Unedited
46 pages
DBMS Language.7
No ratings yet
DBMS Language.7
3 pages
Smart Agricultural Crop Prediction Using Machine Learning
No ratings yet
Smart Agricultural Crop Prediction Using Machine Learning
9 pages
Real-Time Transport Protocol (RTP) : Tung Dao Manh
No ratings yet
Real-Time Transport Protocol (RTP) : Tung Dao Manh
35 pages
Get (Ebook) Building Custom Tasks for SQL Server Integration Services: The Power of .NET for ETL for SQL Server 2019 and Beyond by Andy Leonard ISBN 9781484264812, 1484264819 free all chapters
100% (6)
Get (Ebook) Building Custom Tasks for SQL Server Integration Services: The Power of .NET for ETL for SQL Server 2019 and Beyond by Andy Leonard ISBN 9781484264812, 1484264819 free all chapters
57 pages
Chapter 09 Test Bank - PDF Courswheo Connect
No ratings yet
Chapter 09 Test Bank - PDF Courswheo Connect
33 pages
Women's Perception Towards Ayurvedic Cosmetics.
No ratings yet
Women's Perception Towards Ayurvedic Cosmetics.
58 pages
fusion-strategy-how-real-time-data-and-ai-will-power-the-industrial-future-9781647826253-9781647826260
No ratings yet
fusion-strategy-how-real-time-data-and-ai-will-power-the-industrial-future-9781647826253-9781647826260
204 pages