Dpa M.tech

The document discusses several key concepts in data analysis: 1) The four main data types are text, number, logical, and error. It is important to know which type to use for different functions and how types may change when exporting data. 2) Data parsing converts data between formats, often making unstructured data more comprehensible for tasks like data structuring. 3) Data cleaning fixes or removes incorrect, corrupted, incorrectly formatted, duplicate, or incomplete data to improve dataset quality. Combining multiple sources introduces duplication and mislabeling risks.

Uploaded by

NAKKA PUNEETH

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

30 views3 pages

Dpa M.tech

Uploaded by

NAKKA PUNEETH

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 3

What are the 4 data formats?

The four types of data are text, number, logical and error. You may perform different
functions with each type, so it's important to know which ones to use and when to use them. You
may also consider that some data types may change when exporting data into a spreadsheet.

Data parsing is converting data from one format to another. Widely used for data structuring, it is
generally done to make the existing, often unstructured, unreadable data more comprehensible.

What is data cleaning?

Data cleaning is the process of fixing or removing incorrect, corrupted, incorrectly formatted,
duplicate, or incomplete data within a dataset. When combining multiple data sources, there are
many opportunities for data to be duplicated or mislabeled.
Data Segmentation is the process of taking the data you hold and dividing it up and grouping
similar data together based on the chosen parameters so that you can use it more efficiently

within marketing and operations. Examples of Data Segmentation could be: Gender.

Demographic, psychographic, geographic, and behavioral are the four pillars of market

segmentation, but consider using these four extra types to enhance your marketing efforts.

Data Segmentation is the process of taking the data you hold and dividing it up and grouping

similar data together based on the chosen parameters so that you can use it more efficiently

within marketing and operations. Examples of Data Segmentation could be: Gender. Customers

vs.
Clustering is used to identify groups of similar objects in datasets with two or more variable
quantities. In practice, this data may be collected from marketing, biomedical, or geospatial

databases, among many other places.

Clustering itself can be categorized into two types viz. Hard Clustering and Soft Clustering. In
hard clustering, one data point can belong to one cluster only. But in soft clustering, the output
provided is a probability likelihood of a data point belonging to each of the pre-defined numbers
of clusters.
Grouping unlabeled examples is called clustering. As the examples are unlabeled, clustering
relies on unsupervised machine learning. If the examples are labeled, then clustering becomes
classification.

The visualization techniques include Pie and Donut Charts, Histogram Plot, Scatter Plot,
Kernel Density Estimation for Non-Parametric Data, Box and Whisker Plot for Large Data,
Word Clouds and Network Diagrams for Unstructured Data, and Correlation Matrices.

BASIC VISUALIZATIOS
 Basic graphs in R can be created quite easily. The plot command is the command to note.
 It takes in many parameters from x axis data , y axis data, x axis labels, y axis labels, color and
title. ...
 If you want a boxplot, you can use the word boxplot, and for barplot use the barplot function.

Data Mining Unit-IV
No ratings yet
Data Mining Unit-IV
37 pages
Data Visualization
No ratings yet
Data Visualization
23 pages
Data Mining Techniques and Methods
No ratings yet
Data Mining Techniques and Methods
11 pages
What Is Data Visualization UNIT-V
No ratings yet
What Is Data Visualization UNIT-V
24 pages
Business Analytics Anna University
No ratings yet
Business Analytics Anna University
40 pages
Unit 2 - Data Representation
No ratings yet
Unit 2 - Data Representation
44 pages
Introduction To Data Science Module 1
No ratings yet
Introduction To Data Science Module 1
32 pages
Data Science Lecture 1 Introduction
No ratings yet
Data Science Lecture 1 Introduction
27 pages
Data Mining Using Rapidminer by William Murakami-Brundage Mar. 15, 2012
No ratings yet
Data Mining Using Rapidminer by William Murakami-Brundage Mar. 15, 2012
44 pages
CCW331 Business Analytics Lecture Notes 2
No ratings yet
CCW331 Business Analytics Lecture Notes 2
185 pages
Business Anaytics Unit 1
No ratings yet
Business Anaytics Unit 1
37 pages
Data Science
No ratings yet
Data Science
49 pages
Ilovepdf Merged Pagenumber
No ratings yet
Ilovepdf Merged Pagenumber
199 pages
Lesson Two
No ratings yet
Lesson Two
66 pages
Data Analytics and Interactive Dashboards Using Python
No ratings yet
Data Analytics and Interactive Dashboards Using Python
96 pages
Ds1 - Shahana
No ratings yet
Ds1 - Shahana
36 pages
Chapter Two
No ratings yet
Chapter Two
57 pages
Combinepdf 1
No ratings yet
Combinepdf 1
74 pages
DS Xi Sec4
No ratings yet
DS Xi Sec4
49 pages
Notes - Business Analytics
No ratings yet
Notes - Business Analytics
138 pages
2020 Intro
No ratings yet
2020 Intro
58 pages
Module 4 - Data Streaming - 21.05.2023
No ratings yet
Module 4 - Data Streaming - 21.05.2023
31 pages
Data Visulaziation
No ratings yet
Data Visulaziation
42 pages
Module-1: Introduction To Data Science
No ratings yet
Module-1: Introduction To Data Science
98 pages
Introduction To Data Analytics: Roberta Turra
No ratings yet
Introduction To Data Analytics: Roberta Turra
23 pages
Market Segmentation - A Case Study
No ratings yet
Market Segmentation - A Case Study
12 pages
DS Notes
No ratings yet
DS Notes
49 pages
02 Data Science
No ratings yet
02 Data Science
23 pages
DA Unit 1
No ratings yet
DA Unit 1
43 pages
Data Science
No ratings yet
Data Science
59 pages
ANL201 Study Unit 3 - 2023
No ratings yet
ANL201 Study Unit 3 - 2023
48 pages
Data Science and Ai Education For Young Minds
No ratings yet
Data Science and Ai Education For Young Minds
75 pages
Chapter 2 - Overview For Data Science
No ratings yet
Chapter 2 - Overview For Data Science
31 pages
Chap1-Overview of Data Science
No ratings yet
Chap1-Overview of Data Science
50 pages
UNIT 2-Upto Chapter 2.3
No ratings yet
UNIT 2-Upto Chapter 2.3
23 pages
Antim Prahar Data Analytics For Business Decisions 2025 - Compressed
No ratings yet
Antim Prahar Data Analytics For Business Decisions 2025 - Compressed
44 pages
Business Anaytics Lecture Notes1
No ratings yet
Business Anaytics Lecture Notes1
20 pages
DS Unit-1 PDF
No ratings yet
DS Unit-1 PDF
50 pages
L1 - Introduction To Data Science
No ratings yet
L1 - Introduction To Data Science
33 pages
DVP Unit1
No ratings yet
DVP Unit1
44 pages
Chapter 2
No ratings yet
Chapter 2
53 pages
Lecture Notes: Introduction To Data Science and Big Data
No ratings yet
Lecture Notes: Introduction To Data Science and Big Data
5 pages
Google Certificate Notes
No ratings yet
Google Certificate Notes
36 pages
DA-1,2,3 (1) Merged
No ratings yet
DA-1,2,3 (1) Merged
39 pages
Data Visualization Module1
No ratings yet
Data Visualization Module1
44 pages
BA Unit 1
No ratings yet
BA Unit 1
38 pages
Unit 1 Notes
No ratings yet
Unit 1 Notes
39 pages
Chapter 1-Introduction To Data
No ratings yet
Chapter 1-Introduction To Data
18 pages
What Is Data
No ratings yet
What Is Data
8 pages
Screenshot 2025-04-23 at 8.26.12 AM
No ratings yet
Screenshot 2025-04-23 at 8.26.12 AM
14 pages
Big Data and Data Science
No ratings yet
Big Data and Data Science
6 pages
Fds Print
No ratings yet
Fds Print
7 pages
Data Analytics For Business-3 Marks
No ratings yet
Data Analytics For Business-3 Marks
5 pages
Ds Intro KK
No ratings yet
Ds Intro KK
11 pages
Data Science Four Marks Qa
No ratings yet
Data Science Four Marks Qa
4 pages
Business Analytics Notes
No ratings yet
Business Analytics Notes
6 pages
(IJCST-V10I4P1) :swagata Sarkar, Dhivya Balaje, Vibha V, Harish Pichumani
No ratings yet
(IJCST-V10I4P1) :swagata Sarkar, Dhivya Balaje, Vibha V, Harish Pichumani
4 pages
38.1 - Problem Formulation Movie Reviews - mp4
No ratings yet
38.1 - Problem Formulation Movie Reviews - mp4
5 pages
2.7 - Operators - mp4
No ratings yet
2.7 - Operators - mp4
3 pages
57.7 - USE, DESCRIBE, SHOW TABLES - mp4
No ratings yet
57.7 - USE, DESCRIBE, SHOW TABLES - mp4
4 pages
28.13 - Cases - mp4
No ratings yet
28.13 - Cases - mp4
3 pages
18.2 - Data Matrix Notation - mp4
No ratings yet
18.2 - Data Matrix Notation - mp4
3 pages
28.7 - Polynomial Kernel - mp4
No ratings yet
28.7 - Polynomial Kernel - mp4
3 pages
18.15 - Visualizing Train, Validation and Test Datasets - mp4
No ratings yet
18.15 - Visualizing Train, Validation and Test Datasets - mp4
3 pages
56.11 - PageRank - mp4
No ratings yet
56.11 - PageRank - mp4
3 pages
2.4 - Comments, Indentation and Statements - mp4
No ratings yet
2.4 - Comments, Indentation and Statements - mp4
2 pages
57.10 - ORDER BY - mp4
No ratings yet
57.10 - ORDER BY - mp4
2 pages
2.2 - Why Learn Python - mp4
No ratings yet
2.2 - Why Learn Python - mp4
1 page
Data Science and Analytics: Transforming Raw Data into Actionable Insights: A Comprehensive Guide
From Everand
Data Science and Analytics: Transforming Raw Data into Actionable Insights: A Comprehensive Guide
Marlowe Reyes
No ratings yet
Data Structures & Algorithms Interview Questions You'll Most Likely Be Asked
From Everand
Data Structures & Algorithms Interview Questions You'll Most Likely Be Asked
Vibrant Publishers
1/5 (1)
Data Mining: Fundamentals and Applications
From Everand
Data Mining: Fundamentals and Applications
Fouad Sabry
No ratings yet

Dpa M.tech

Uploaded by

Dpa M.tech

Uploaded by

What are the 4 data formats?

What is data cleaning?

databases, among many other places.

You might also like