1 Assignment

The document outlines an assignment with multiple questions related to data mining functionalities, including definitions and examples of characterization, discrimination, association, classification, regression, clustering, and outlier analysis. It also discusses the importance of data mining for business success, methods for handling missing values, and techniques for data smoothing and normalization. Additionally, it includes calculations for similarity measures and normalization methods for a given dataset of ages.

Uploaded by

divinexhumane

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views

1 Assignment

Uploaded by

divinexhumane

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Assignment-1

Q1. Define each of the following data mining functionalities: characterization,

discrimination, association and correlation analysis, classification, regression, clustering, and
outlier analysis. Give examples of each data mining functionality, using a real-life database
that you are familiar with.

Q2. Present an example where data mining is crucial to the success of a business. What data
mining functionalities does this business need (e.g., think of the kinds of patterns that could
be mined)? Can such patterns be generated alternatively by data query processing or simple
statistical analysis?

Q3. Briefly outline how to compute the dissimilarity between objects described by the
following:
(a) Nominal attributes
(b) Asymmetric binary attributes
(c) Numeric attributes
(d) Term-frequency vectors

Q4. For the following vectors, x and y, calculate the indicated similarity or dis-
tance measures.
(a) x = (1, 1, 1, 1), y = (2, 2, 2, 2) cosine, correlation, Euclidean
(b) x = (0, 1, 0, 1), y = (1, 0, 1, 0) cosine, correlation, Euclidean, Jaccard
(c) x = (0, −1, 0, 1), y = (1, 0, −1, 0) cosine, correlation, Euclidean

Q5. In real-world data, tuples with missing values for some attributes are a common
occurrence. Describe various methods for handling this problem.

Q6. Given the following data (in increasing order) for the attribute age:
13, 15, 16, 16, 19, 20,
20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70.
(a) Use smoothing by bin means to smooth the above data, using a bin depth of 3. Illustrate
your steps. Comment on the effect of this technique for the given data.
(b) How might you determine outliers in the data?
(c) What other methods are there for data smoothing?

Q7. Using the data for age given in Q6 , answer the following:
(a) Use min-max normalization to transform the value 35 for age onto the range [0.0, 1.0].
(b) Use z-score normalization to transform the value 35 for age, where the standard deviation
of age is 12.94 years.
(c) Use normalization by decimal scaling to transform the value 35 for age.

Q8. What are the value ranges of the following normalization methods?
(a) min-max normalization
(b) z-score normalization
(c) z-score normalization using the mean absolute deviation instead of standard deviation
(d) normalization by decimal scaling

E-Tivity 2.2 Tharcisse 217010849
No ratings yet
E-Tivity 2.2 Tharcisse 217010849
7 pages
Data Mining Worksheet One
No ratings yet
Data Mining Worksheet One
2 pages
21CS63 - Unit1 Practice Questions
No ratings yet
21CS63 - Unit1 Practice Questions
3 pages
Assg 2 Pre-Processing
No ratings yet
Assg 2 Pre-Processing
1 page
III Yr B.Tech. - Computer Science & Engineering/Information Technology Data Mining
No ratings yet
III Yr B.Tech. - Computer Science & Engineering/Information Technology Data Mining
2 pages
DWDM Assignment 1
No ratings yet
DWDM Assignment 1
4 pages
Department of Computer Science and Engineering
No ratings yet
Department of Computer Science and Engineering
3 pages
Data-Mining-Question-bank
No ratings yet
Data-Mining-Question-bank
3 pages
Sample Question DMW
No ratings yet
Sample Question DMW
4 pages
Assignment 2
No ratings yet
Assignment 2
2 pages
The Handwritten Solutions To The First Five Questions, and The Report of Last Question
No ratings yet
The Handwritten Solutions To The First Five Questions, and The Report of Last Question
2 pages
DWDM_Mid-1
No ratings yet
DWDM_Mid-1
3 pages
ML Assignment-1
No ratings yet
ML Assignment-1
7 pages
Unit 1 Assignment
0% (1)
Unit 1 Assignment
6 pages
CS583 Data Prep
No ratings yet
CS583 Data Prep
33 pages
DMBI Questions
No ratings yet
DMBI Questions
8 pages
DM QB
No ratings yet
DM QB
3 pages
DWDM Ii Mid Paper
No ratings yet
DWDM Ii Mid Paper
2 pages
Assignment DMBI 2
No ratings yet
Assignment DMBI 2
2 pages
DWM Solution May 2019
No ratings yet
DWM Solution May 2019
9 pages
QB Students DM
No ratings yet
QB Students DM
12 pages
B.tech CSE (CBA_BDA_CS) Sem-6 DAW-Reg-remi- exam APRIL-JUNE 2023
No ratings yet
B.tech CSE (CBA_BDA_CS) Sem-6 DAW-Reg-remi- exam APRIL-JUNE 2023
47 pages
File To Submitt Till 20
No ratings yet
File To Submitt Till 20
2 pages
lab1-pgm
No ratings yet
lab1-pgm
2 pages
DWDM Unitwise Questions
No ratings yet
DWDM Unitwise Questions
3 pages
640005
No ratings yet
640005
4 pages
CS 8031 Data Mining and Data Warehousing Tutorial
No ratings yet
CS 8031 Data Mining and Data Warehousing Tutorial
9 pages
Data Mining-1
No ratings yet
Data Mining-1
15 pages
CS402 Data Mining and Warehousing Question Bank
No ratings yet
CS402 Data Mining and Warehousing Question Bank
6 pages
ML Important Questions.docx
No ratings yet
ML Important Questions.docx
7 pages
Tutorial Session 11 - Heteroscedasticity
No ratings yet
Tutorial Session 11 - Heteroscedasticity
2 pages
Data Mining Question Bank
No ratings yet
Data Mining Question Bank
4 pages
It-3031 (DMDW) - CS End Nov 2023
No ratings yet
It-3031 (DMDW) - CS End Nov 2023
23 pages
Midterm Review Solution
100% (1)
Midterm Review Solution
7 pages
Data Mining Assignment 2
No ratings yet
Data Mining Assignment 2
2 pages
BUSINESS MOMENTS 1
No ratings yet
BUSINESS MOMENTS 1
9 pages
IS328 Data Mining-Tutorial 1 Solution
No ratings yet
IS328 Data Mining-Tutorial 1 Solution
5 pages
2b.data Visualization
No ratings yet
2b.data Visualization
7 pages
Cia1 Paper
No ratings yet
Cia1 Paper
2 pages
Machine Learning
No ratings yet
Machine Learning
7 pages
Q715 - Data Mining
No ratings yet
Q715 - Data Mining
2 pages
تمارین درس داده کاوی فصل طبقه بندی
No ratings yet
تمارین درس داده کاوی فصل طبقه بندی
7 pages
Data Prep
No ratings yet
Data Prep
33 pages
Big Data Exercieses
No ratings yet
Big Data Exercieses
6 pages
Project2 2022 Fall
No ratings yet
Project2 2022 Fall
7 pages
ML0101EN Clas K Nearest Neighbors CustCat Py v1
100% (1)
ML0101EN Clas K Nearest Neighbors CustCat Py v1
11 pages
Model Cs 8 PDF
No ratings yet
Model Cs 8 PDF
17 pages
FDS-1
No ratings yet
FDS-1
5 pages
Qb Data Mining
No ratings yet
Qb Data Mining
5 pages
DSBDA 4
No ratings yet
DSBDA 4
16 pages
Dcs 7302
No ratings yet
Dcs 7302
17 pages
Major 2020
No ratings yet
Major 2020
2 pages
MODEL EXAM II Answer Key - For Merge
No ratings yet
MODEL EXAM II Answer Key - For Merge
20 pages
Study Question FDS Model
No ratings yet
Study Question FDS Model
2 pages
Dip Ii-Unit
No ratings yet
Dip Ii-Unit
7 pages
Basic Statistics (Module - 3)
No ratings yet
Basic Statistics (Module - 3)
7 pages
Jntuworld: R07 Set No. 2
No ratings yet
Jntuworld: R07 Set No. 2
7 pages
100 Puzzles to Learn Data Warehousing
From Everand
100 Puzzles to Learn Data Warehousing
Cristian Scutaru
No ratings yet
Profit Driven Business Analytics: A Practitioner's Guide to Transforming Big Data into Added Value
From Everand
Profit Driven Business Analytics: A Practitioner's Guide to Transforming Big Data into Added Value
Wouter Verbeke
No ratings yet
IT Specialist: Data Analytics Certification Prep - 500 Exam Questions and Explanations
From Everand
IT Specialist: Data Analytics Certification Prep - 500 Exam Questions and Explanations
Steve Brown
No ratings yet

1 Assignment

Uploaded by

1 Assignment

Uploaded by

Assignment-1

Q1. Define each of the following data mining functionalities: characterization,

You might also like