0% found this document useful (0 votes)

2 views

BasicAnalysis Using PYTHON

This document provides a guide for performing basic data analysis using Python with libraries such as Pandas, NumPy, Matplotlib, and Seaborn. It covers installation of libraries, data loading, exploration, cleaning, basic analysis, visualization, and saving cleaned data. The guide includes code examples for each step to help users get started with their data analysis tasks.

Uploaded by

shreyassurve161

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views

BasicAnalysis Using PYTHON

Uploaded by

shreyassurve161

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 6

To perform basic analysis using Python, you'll primarily use libraries like

Pandas, NumPy, and Matplotlib or Seaborn for data handling, manipulation,

and visualization.

Here's a simple guide to get you started.

1. Install Required Libraries

If you don't already have the libraries installed, you can install them using
pip:

code

pip install pandas numpy matplotlib seaborn

2. Loading Data

First, import the necessary libraries and load the data. You can load data
from various formats like CSV, Excel, etc.

Example for loading a CSV file:

python

import pandas as pd

Load dataset

df = pd.read_csv('your_data.csv')

3. Explore the Data

You can perform some basic exploration to understand the data.

- Check the first few rows of the dataset:

python

df.head()
```

- Get basic info about data types and missing values:

python

df.info()

- Get summary statistics:

python

df.describe()

4. Data Cleaning

This step often involves handling missing data, duplicates, or fixing data
types.

- Handle missing data by filling or dropping:

python

df.fillna(0, inplace=True) # Fill missing values with 0

df.dropna(inplace=True) # Drop rows with missing values

- Drop duplicates :

python

df.drop_duplicates(inplace=True)

5. Basic Analysis

You can begin with basic descriptive statistics and visualizations.

a. Descriptive Statistics
- Mean, median, mode:

python

mean_value = df['column_name'].mean()

median_value = df['column_name'].median()

mode_value = df['column_name'].mode()[0]

- Value counts (for categorical variables):

python

df['category_column'].value_counts()

b. Group By Analysis

You can group data by a particular column and perform aggregate

operations.

python

grouped_data = df.groupby('category_column')['numerical_column'].sum()

c. Correlation

Check the correlation between numerical features.

python

correlation_matrix = df.corr()

print(correlation_matrix)

6. Basic Data Visualization

Visualization is key to data analysis.

a. Histograms
To visualize the distribution of a column:

python

import matplotlib.pyplot as plt

df['column_name'].hist()

plt.show()b. Scatter Plot

To check the relationship between two variables:

python

df.plot(kind='scatter', x='column1', y='column2')

plt.show()

c. Box Plot

To identify outliers:

python

df.boxplot(column='numerical_column')

plt.show()

d. Correlation Heatmap (using Seaborn)

For a more visual representation of correlation:

python

import seaborn as sns

sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

plt.show()

7. Saving Cleaned Data

After cleaning and analysis, you might want to save the processed data.
python

df.to_csv('cleaned_data.csv', index=False)

Example Workflowpython

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

Load data

df = pd.read_csv('your_data.csv')

Basic exploration

print(df.head())

print(df.info())

print(df.describe())

Handle missing values

df.fillna(0, inplace=True)

Descriptive statistics

print(df['age'].mean()) # Example for 'age' column

print(df['category'].value_counts()) # For categorical data

Visualize data

df['age'].hist()

plt.show()

sns.heatmap(df.corr(), annot=True, cmap='coolwarm')

plt.show()

This workflow should get you started on basic data analysis using Python!
You can further enhance this by using more advanced libraries like SciPy for
statistical analysis or StatsModels for regression and other statistical
models.

Data Analysis With Python - FreeCodeCamp
No ratings yet
Data Analysis With Python - FreeCodeCamp
26 pages
Construction Planning and Management Multiple Choice Questions
75% (12)
Construction Planning and Management Multiple Choice Questions
2 pages
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
100% (3)
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
9 pages
Enterprise Architecture and Integr (ISEM-540-01, 1415-SP)
No ratings yet
Enterprise Architecture and Integr (ISEM-540-01, 1415-SP)
19 pages
Python Quick Notes
No ratings yet
Python Quick Notes
2 pages
Data Exploration Preparation
No ratings yet
Data Exploration Preparation
12 pages
Data Analysis With Python
No ratings yet
Data Analysis With Python
29 pages
Course_ Introduction to Data Science (SD211105)
No ratings yet
Course_ Introduction to Data Science (SD211105)
10 pages
Financial Analytics With Python
100% (1)
Financial Analytics With Python
40 pages
Usage of NumPy for Numerical Data in Detail
No ratings yet
Usage of NumPy for Numerical Data in Detail
52 pages
Unit-2 Bda
No ratings yet
Unit-2 Bda
11 pages
Pandas 1702216043
No ratings yet
Pandas 1702216043
86 pages
Python for Data Analysis
No ratings yet
Python for Data Analysis
84 pages
Pandas Complete + Visualisation Summary of IBM Visualization
No ratings yet
Pandas Complete + Visualisation Summary of IBM Visualization
21 pages
Summary: Introduction To Data Visualization Tools
No ratings yet
Summary: Introduction To Data Visualization Tools
13 pages
Practical_1
No ratings yet
Practical_1
5 pages
Chapter 2. Data Analysis and Processing - Full
No ratings yet
Chapter 2. Data Analysis and Processing - Full
49 pages
unit-3(FODS)
No ratings yet
unit-3(FODS)
34 pages
Python For Statistics
No ratings yet
Python For Statistics
40 pages
Pandas CheatSheet
No ratings yet
Pandas CheatSheet
18 pages
Pandas PDF(2)
No ratings yet
Pandas PDF(2)
25 pages
Python & MySQL for Data Analysis
No ratings yet
Python & MySQL for Data Analysis
45 pages
Data Analysis
No ratings yet
Data Analysis
4 pages
Python Course Outline
No ratings yet
Python Course Outline
24 pages
What is pandas
No ratings yet
What is pandas
9 pages
Comprehensive EDA Python Guide
No ratings yet
Comprehensive EDA Python Guide
13 pages
Python
No ratings yet
Python
3 pages
UNIT 1,2
No ratings yet
UNIT 1,2
17 pages
dav 2 unit
No ratings yet
dav 2 unit
55 pages
Data Analysis With Python
No ratings yet
Data Analysis With Python
26 pages
DATA AGGREGATION USING PYTHON (1)
No ratings yet
DATA AGGREGATION USING PYTHON (1)
33 pages
Python For Data Analysts - Quick Summary
No ratings yet
Python For Data Analysts - Quick Summary
6 pages
Data Analysis With Python: Full Tutorial For Beginners
No ratings yet
Data Analysis With Python: Full Tutorial For Beginners
26 pages
Jupyter Notebook.docx
No ratings yet
Jupyter Notebook.docx
71 pages
final dev record
No ratings yet
final dev record
49 pages
FDS Module 2 Notes
No ratings yet
FDS Module 2 Notes
24 pages
Interactive Data Analysis With Jupyter Cheatsheet 1731972443
No ratings yet
Interactive Data Analysis With Jupyter Cheatsheet 1731972443
10 pages
DAP writeups_merged
No ratings yet
DAP writeups_merged
33 pages
Data Analytics Fundamentals-2
No ratings yet
Data Analytics Fundamentals-2
34 pages
Data Wrangling With Python and Pandas
No ratings yet
Data Wrangling With Python and Pandas
7 pages
Learneverythingai
No ratings yet
Learneverythingai
9 pages
DMV Unit-4-1.pdf
No ratings yet
DMV Unit-4-1.pdf
10 pages
Supermarket Sales Data analysis
No ratings yet
Supermarket Sales Data analysis
6 pages
Python Notes by Prof T
No ratings yet
Python Notes by Prof T
10 pages
2. advanced analytic techniques
No ratings yet
2. advanced analytic techniques
2 pages
Pandas Notes
No ratings yet
Pandas Notes
3 pages
BIDA practical print
No ratings yet
BIDA practical print
56 pages
Pandas Training Plan
No ratings yet
Pandas Training Plan
5 pages
unit 6
No ratings yet
unit 6
3 pages
IDML Lab Programs
No ratings yet
IDML Lab Programs
5 pages
Data Analysis With Python - FreeCodeCamp
No ratings yet
Data Analysis With Python - FreeCodeCamp
28 pages
EDAP LAB
No ratings yet
EDAP LAB
47 pages
Utf-8''libraries Data Management
No ratings yet
Utf-8''libraries Data Management
9 pages
Lavanya Sharma IP File 2024-25-1
No ratings yet
Lavanya Sharma IP File 2024-25-1
37 pages
Data Science Workflow
No ratings yet
Data Science Workflow
7 pages
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
No ratings yet
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
7 pages
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
No ratings yet
3rd Semester DDM AI DAA DEV Print Pages For Spiral Record 25-1-24 - Removed
28 pages
DAC Phase3
No ratings yet
DAC Phase3
6 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
47 pages
Pandas
No ratings yet
Pandas
9 pages
Quick Python Guide
From Everand
Quick Python Guide
Coder1
No ratings yet
Python: Advanced Guide to Programming Code with Python: Python Computer Programming, #4
From Everand
Python: Advanced Guide to Programming Code with Python: Python Computer Programming, #4
Charlie Masterson
No ratings yet
1619012152048
No ratings yet
1619012152048
8 pages
Python Numpy Array Tutorial
No ratings yet
Python Numpy Array Tutorial
53 pages
Electrical Power Quality by J.B. Dixit and Amit Yadav
No ratings yet
Electrical Power Quality by J.B. Dixit and Amit Yadav
183 pages
Ul1678 2012
No ratings yet
Ul1678 2012
62 pages
Accomplishment Report
No ratings yet
Accomplishment Report
31 pages
Solved Paper-2024 (1) Computer Science
No ratings yet
Solved Paper-2024 (1) Computer Science
9 pages
Dell Inspiron 1545 Manual
No ratings yet
Dell Inspiron 1545 Manual
51 pages
Transformers: Primary Plus
No ratings yet
Transformers: Primary Plus
12 pages
James W Cortada The Digital Hand Volume 1 How Computers Changed The Work of American Manufacturing Transportation and Retail Industries PDF
No ratings yet
James W Cortada The Digital Hand Volume 1 How Computers Changed The Work of American Manufacturing Transportation and Retail Industries PDF
513 pages
Difference Between IPv4 and IPv6
No ratings yet
Difference Between IPv4 and IPv6
2 pages
Megger DLRO 10 Manual
No ratings yet
Megger DLRO 10 Manual
124 pages
Briona - DVG Storyboard
No ratings yet
Briona - DVG Storyboard
3 pages
Mixing Console: Service Manual
No ratings yet
Mixing Console: Service Manual
115 pages
508 - Test Report - The Sleuth Kit 3 2 2 - Autopsy 2 24 Test Report - November 2015 - Final PDF
No ratings yet
508 - Test Report - The Sleuth Kit 3 2 2 - Autopsy 2 24 Test Report - November 2015 - Final PDF
46 pages
Experiments-1 Os Csit2
No ratings yet
Experiments-1 Os Csit2
6 pages
Unit II Possible Questions With Answers
No ratings yet
Unit II Possible Questions With Answers
19 pages
Unit 1 Piecewise Fall 15
No ratings yet
Unit 1 Piecewise Fall 15
28 pages
Auction MGT System For Dtu Documentation
No ratings yet
Auction MGT System For Dtu Documentation
69 pages
Bcom Ism
No ratings yet
Bcom Ism
3 pages
2020-ENR-Euler-SN-SAMPLE (Year 7)
No ratings yet
2020-ENR-Euler-SN-SAMPLE (Year 7)
11 pages
Generating Random Numbers
No ratings yet
Generating Random Numbers
23 pages
JV400LX Product Guide V1.0 - Web
No ratings yet
JV400LX Product Guide V1.0 - Web
20 pages
Tanjong - Katong - 2011 A Maths Prelim P2
No ratings yet
Tanjong - Katong - 2011 A Maths Prelim P2
5 pages
Wireless Multimedia Communications Convergence DSP QoS and Security 1st Edition K.R. Rao - The ebook is available for online reading or easy download
100% (3)
Wireless Multimedia Communications Convergence DSP QoS and Security 1st Edition K.R. Rao - The ebook is available for online reading or easy download
44 pages
Question Paper Code:: Reg. No.
No ratings yet
Question Paper Code:: Reg. No.
3 pages
Information Security Management System (ISMS) : © All Rights Reserved. Cybermate Infotek Limited - 2017
No ratings yet
Information Security Management System (ISMS) : © All Rights Reserved. Cybermate Infotek Limited - 2017
54 pages
PW Washers Programming Manual
No ratings yet
PW Washers Programming Manual
48 pages
Impact of Generative AI in The FinTech Ecosystem
No ratings yet
Impact of Generative AI in The FinTech Ecosystem
11 pages