0% found this document useful (0 votes)

11 views

Data Mining Lecture One - Docx1

Data mining

Uploaded by

choosetobehonest111

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views

Data Mining Lecture One - Docx1

Data mining

Uploaded by

choosetobehonest111

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 12

Data mining Lecture One

Confronted with huge collections of data, we have now created new needs to help us make better
managerial choices. These needs are automatic summarization of data, extraction of the
"essence" of information stored, and the discovery of patterns in raw data. Data mining is a
powerful new technology with great potential to help companies focus on the most important
information in their data warehouses.

It has been defined as: The automated analysis of large or complex data sets in order to discover
significant patterns or trends that would otherwise go unrecognised.

What is Data mining ?

Data mining refers to extracting or mining knowledge from large amountsof data.

Data mining is ready for application because it is supported by three technologies that are now
sufficiently mature:

 Massive data collection

 Powerful multiprocessor computers

 Data mining algorithms

The key to understanding the different facets of data mining is to distinguish between data
mining applications, operations, techniques and algorithms.

Applications

 Database marketing
 customer segmentation
 customer retention
 fraud detection
 credit checking
 web site analysis

Operations

 Classification and prediction

 clustering association analysis
 forecasting
Techniques

 Neural networks
 decision trees
 K-nearest neighbour algorithms
 naive Bayesian cluster analysis

Data Mining, also popularly known as Knowledge Discovery in Databases (KDD), refers to
the nontrivial extraction of implicit, previously unknown and potentially useful information
from data in databases.

While data mining and knowledge discovery in databases (or KDD) are frequently treated as
synonyms

The Knowledge Discovery in Databases process comprises of a few steps leading from raw
data collections to some form of new knowledge.

The iterative process consists of the following steps:

Data cleaning: also known as data cleansing, it is a phase in which noise data and irrelevant
data are removed from the collection.

Data integration: at this stage, multiple data sources, often heterogeneous, may be
combined in a common source.

Data selection: at this step, the data relevant to the analysis is decided on and retrieved from
the data collection.

Data transformation: also known as data consolidation, it is a phase in which the selected
data is transformed into forms appropriate for the mining procedure.

Data mining: it is the crucial step in which clever techniques are applied to extract patterns
potentially useful.

Pattern evaluation: in this step, strictly interesting patterns representing knowledge are
identified based on given measures.

Knowledge representation: is the final phase in which the discovered knowledge is visually
represented to the user. This essential step uses visualization techniques to help users
understand and interpret the data mining results.
KDD Process
Six common classes of Data mining tasks
Anomaly detection (Outlier/change/deviation detection) – The identification of
unusual data records, that might be interesting or data errors that require further
investigation.
Association rule learning (Dependency modelling) – Searches for relationships
between variables. For example a supermarket might gather data on customer
purchasing habits. Using association rule learning, the supermarket can determine
which products are frequently bought together and use this information for marketing
purposes. This is sometimes referred to as market basket analysis.
Clustering – is the task of discovering groups and structures in the data that are in
some way or another "similar", without using known structures in the data.
Classification – is the task of generalizing known structure to apply to new data. For
example, an e-mail program might attempt to classify an e-mail as "legitimate" or as
"spam".
Regression – attempts to find a function which models the data with the least error
Association rule mining is a popular and well researched method for
discovering interesting relations between variables in large databases. It is
intended to identify strong rules discovered in databases using different
measures of interestingness.

A Brief Overview On Data Mining Survey PDF
No ratings yet
A Brief Overview On Data Mining Survey PDF
8 pages
ISS Reshma Wawhal Security Awareness
No ratings yet
ISS Reshma Wawhal Security Awareness
18 pages
Road Accident Analysis
No ratings yet
Road Accident Analysis
17 pages
Vmware Vsphere Troubleshooting Scenarios
100% (2)
Vmware Vsphere Troubleshooting Scenarios
19 pages
Data Mining - Prashant
No ratings yet
Data Mining - Prashant
10 pages
DM Unit1 Intro
No ratings yet
DM Unit1 Intro
12 pages
Data Mining and Data Analysis UNIT-1 Notes For Print
No ratings yet
Data Mining and Data Analysis UNIT-1 Notes For Print
22 pages
DWDM 1
No ratings yet
DWDM 1
17 pages
DM Module 1
No ratings yet
DM Module 1
11 pages
Unit I DM
No ratings yet
Unit I DM
27 pages
p144 Data Mining
100% (3)
p144 Data Mining
11 pages
Data Mining
No ratings yet
Data Mining
25 pages
Data Mining and Warehousing-1
No ratings yet
Data Mining and Warehousing-1
43 pages
DMWH M1
No ratings yet
DMWH M1
25 pages
Datamining & Cluster Coputing
No ratings yet
Datamining & Cluster Coputing
16 pages
Unit II Data Mining
No ratings yet
Unit II Data Mining
8 pages
Data Mining 4545
No ratings yet
Data Mining 4545
20 pages
DWM 4
No ratings yet
DWM 4
23 pages
Data Mining
No ratings yet
Data Mining
17 pages
DM Module1
No ratings yet
DM Module1
15 pages
Module-1 DM
No ratings yet
Module-1 DM
15 pages
Subject Data Warehouse
No ratings yet
Subject Data Warehouse
42 pages
R18CSE4102-UNIT 2 Data Mining Notes
100% (1)
R18CSE4102-UNIT 2 Data Mining Notes
31 pages
5 Data Mining Proccess and Techniques - Week 7
No ratings yet
5 Data Mining Proccess and Techniques - Week 7
61 pages
Chapter 6 Data Mining
No ratings yet
Chapter 6 Data Mining
39 pages
Unit-4 DWM
No ratings yet
Unit-4 DWM
73 pages
Data Mining and Its Applications
No ratings yet
Data Mining and Its Applications
60 pages
MCAD2223 Datamining and Warehousing - Module
No ratings yet
MCAD2223 Datamining and Warehousing - Module
132 pages
Unit 1 Datamining For Business Intelligence
No ratings yet
Unit 1 Datamining For Business Intelligence
101 pages
Data Mining
No ratings yet
Data Mining
20 pages
LECTURE NOTES ON DATA MINING and DATA WA
No ratings yet
LECTURE NOTES ON DATA MINING and DATA WA
84 pages
Mining
No ratings yet
Mining
7 pages
Data Mining Methods Basics - Resp
No ratings yet
Data Mining Methods Basics - Resp
33 pages
Data Mining - Digital Notes (Unit I To V)
No ratings yet
Data Mining - Digital Notes (Unit I To V)
85 pages
Data Structures: Notes For Lecture 12 Introduction To Data Mining by Samaher Hussein Ali
No ratings yet
Data Structures: Notes For Lecture 12 Introduction To Data Mining by Samaher Hussein Ali
4 pages
Dwdm Unit-II Notes
No ratings yet
Dwdm Unit-II Notes
29 pages
Module1 DataMining Ktustudents - in
No ratings yet
Module1 DataMining Ktustudents - in
24 pages
DM NOTES
No ratings yet
DM NOTES
91 pages
Archana Data Mining
No ratings yet
Archana Data Mining
24 pages
Topic 3 - Data Mining
No ratings yet
Topic 3 - Data Mining
37 pages
Data Mining, Data Pattern, Machine Learning (Week 2
No ratings yet
Data Mining, Data Pattern, Machine Learning (Week 2
19 pages
Data Mining
No ratings yet
Data Mining
19 pages
Unit 1 Datamining
No ratings yet
Unit 1 Datamining
16 pages
Notes for DMDWH -Module1
No ratings yet
Notes for DMDWH -Module1
21 pages
DataWarehouseMining Complete Notes
No ratings yet
DataWarehouseMining Complete Notes
55 pages
Data Mining U-1
No ratings yet
Data Mining U-1
10 pages
DATA MINING MODULE 2
No ratings yet
DATA MINING MODULE 2
23 pages
BCA Data Mining
No ratings yet
BCA Data Mining
116 pages
U1_1
No ratings yet
U1_1
13 pages
Data Mining Notes
No ratings yet
Data Mining Notes
9 pages
Data Mining Nostos
100% (1)
Data Mining Nostos
39 pages
Data Mining Unit 1
No ratings yet
Data Mining Unit 1
24 pages
Data Mining-CH5
No ratings yet
Data Mining-CH5
49 pages
2 Data Mining
No ratings yet
2 Data Mining
20 pages
B SC (IT) VI-DSE3-M5
No ratings yet
B SC (IT) VI-DSE3-M5
13 pages
Data Mining Is Defined As The Procedure of Extracting Information From Huge Sets of Data
No ratings yet
Data Mining Is Defined As The Procedure of Extracting Information From Huge Sets of Data
6 pages
Data Mining Tutorials
No ratings yet
Data Mining Tutorials
52 pages
wao
No ratings yet
wao
9 pages
Data Mining
No ratings yet
Data Mining
19 pages
Data Mining: Knowledge Discovery in Databases
No ratings yet
Data Mining: Knowledge Discovery in Databases
21 pages
cc15 2nd
No ratings yet
cc15 2nd
2 pages
Unit 3
No ratings yet
Unit 3
34 pages
Data Mining: Fundamentals and Applications
From Everand
Data Mining: Fundamentals and Applications
Fouad Sabry
No ratings yet
PTC ELearning Curriculum Thingsworx
No ratings yet
PTC ELearning Curriculum Thingsworx
3 pages
Install WildFly On CentOS - Red Hat Enterprise Linux (RHEL) 8 CentLinux
No ratings yet
Install WildFly On CentOS - Red Hat Enterprise Linux (RHEL) 8 CentLinux
6 pages
Suyash Madale Resume
No ratings yet
Suyash Madale Resume
1 page
Lecture 3 E-Marketplaces - 230228 - 002234
No ratings yet
Lecture 3 E-Marketplaces - 230228 - 002234
17 pages
FSD CIE-1 Notes
No ratings yet
FSD CIE-1 Notes
22 pages
Deepika G - Resume-1
No ratings yet
Deepika G - Resume-1
2 pages
Log
No ratings yet
Log
25 pages
Upsell Guide For Partners: Microsoft 365 Business Basic Microsoft 365 Business Premium
No ratings yet
Upsell Guide For Partners: Microsoft 365 Business Basic Microsoft 365 Business Premium
3 pages
Dbms Puzzle
No ratings yet
Dbms Puzzle
1 page
BehnSusan ABCsOfWorkflowSetup PDF
No ratings yet
BehnSusan ABCsOfWorkflowSetup PDF
61 pages
SRS Template[1]
No ratings yet
SRS Template[1]
22 pages
Final Documentation
No ratings yet
Final Documentation
49 pages
Unit - 3: Data Management Issues
No ratings yet
Unit - 3: Data Management Issues
8 pages
Social Media Marketing Proposal
100% (1)
Social Media Marketing Proposal
5 pages
OpenText Documentum Composer CE 23.2 - User Guide English (EDCPC230200-UGD-EN-01)
No ratings yet
OpenText Documentum Composer CE 23.2 - User Guide English (EDCPC230200-UGD-EN-01)
244 pages
Satyanshu resume
No ratings yet
Satyanshu resume
1 page
Database Management System
No ratings yet
Database Management System
5 pages
I.T Era 2
No ratings yet
I.T Era 2
67 pages
OPENPLC[Final]
No ratings yet
OPENPLC[Final]
2 pages
Website: Vce To PDF Converter: Facebook: Twitter:: Hpe2-E71.Vceplus - Premium.Exam.60Q
No ratings yet
Website: Vce To PDF Converter: Facebook: Twitter:: Hpe2-E71.Vceplus - Premium.Exam.60Q
17 pages
13 SQL Statements For 90 - of Your Data Analysis Tasks. by Abhishek Saud Mar, 2023 Medium
No ratings yet
13 SQL Statements For 90 - of Your Data Analysis Tasks. by Abhishek Saud Mar, 2023 Medium
18 pages
Data Warehousing & Data Mining
No ratings yet
Data Warehousing & Data Mining
15 pages
Worksheet 11 AK
No ratings yet
Worksheet 11 AK
4 pages
Android App Development in Android Studio Java+Android Edition For Beginners
100% (1)
Android App Development in Android Studio Java+Android Edition For Beginners
214 pages
Vmware Vcap DCV 2018 Exam Prep Guide
No ratings yet
Vmware Vcap DCV 2018 Exam Prep Guide
6 pages
Cisco Email Security
No ratings yet
Cisco Email Security
9 pages
Embedded and Real Time Systems - Lecture Notes, Study Material and Important Questions, Answers
No ratings yet
Embedded and Real Time Systems - Lecture Notes, Study Material and Important Questions, Answers
6 pages

Data Mining Lecture One - Docx1

Uploaded by

Data Mining Lecture One - Docx1

Uploaded by

Data mining Lecture One

What is Data mining ?

 Massive data collection

 Powerful multiprocessor computers

 Data mining algorithms

 Classification and prediction

The iterative process consists of the following steps:

You might also like