0% found this document useful (0 votes)

234 views9 pages

Statistical Analysis With Scipy?

The document provides a comprehensive overview of statistical analysis techniques using the SciPy library, including importing necessary modules and setting up the environment. It covers various topics such as descriptive statistics, probability distributions, hypothesis testing, correlation and regression, and more advanced methods like Bayesian statistics and multivariate analysis. Each section includes specific functions and methods for performing statistical analyses, making it a valuable resource for data analysis in Python.

Uploaded by

Dhiraj Patil

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

234 views9 pages

Statistical Analysis With Scipy?

Uploaded by

Dhiraj Patil

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 9

# [ Statistical Analysis with SciPy ]

Importing and Setup

● Import SciPy stats module: from scipy import stats

● Import NumPy for array operations: import numpy as np
● Set random seed for reproducibility: np.random.seed(42)

Descriptive Statistics

● Mean: np.mean(data)
● Median: np.median(data)
● Mode: stats.mode(data)
● Variance: np.var(data)
● Standard deviation: np.std(data)
● Range: np.ptp(data)
● Interquartile range: stats.iqr(data)
● Skewness: stats.skew(data)
● Kurtosis: stats.kurtosis(data)
● Coefficient of variation: stats.variation(data)
● Geometric mean: stats.gmean(data)
● Harmonic mean: stats.hmean(data)
● Trimmed mean: stats.trim_mean(data, 0.1)
● Percentile: np.percentile(data, 75)
● Quantile: np.quantile(data, [0.25, 0.5, 0.75])

Probability Distributions

● Normal distribution PDF: stats.norm.pdf(x, loc=0, scale=1)

● Normal distribution CDF: stats.norm.cdf(x, loc=0, scale=1)
● Normal distribution inverse CDF: stats.norm.ppf(q, loc=0, scale=1)
● Generate normal random numbers: stats.norm.rvs(loc=0, scale=1,
size=1000)
● Uniform distribution PDF: stats.uniform.pdf(x, loc=0, scale=1)
● Uniform distribution CDF: stats.uniform.cdf(x, loc=0, scale=1)
● Generate uniform random numbers: stats.uniform.rvs(loc=0, scale=1,
size=1000)
● Exponential distribution PDF: stats.expon.pdf(x, scale=1)
● Exponential distribution CDF: stats.expon.cdf(x, scale=1)

By: Waleed Mousa

● Generate exponential random numbers: stats.expon.rvs(scale=1,
size=1000)
● Poisson distribution PMF: stats.poisson.pmf(k, mu=1)
● Poisson distribution CDF: stats.poisson.cdf(k, mu=1)
● Generate Poisson random numbers: stats.poisson.rvs(mu=1, size=1000)
● Binomial distribution PMF: stats.binom.pmf(k, n, p)
● Binomial distribution CDF: stats.binom.cdf(k, n, p)
● Generate binomial random numbers: stats.binom.rvs(n, p, size=1000)
● Chi-square distribution PDF: stats.chi2.pdf(x, df)
● Chi-square distribution CDF: stats.chi2.cdf(x, df)
● Generate chi-square random numbers: stats.chi2.rvs(df, size=1000)
● Student's t-distribution PDF: stats.t.pdf(x, df)
● Student's t-distribution CDF: stats.t.cdf(x, df)
● Generate Student's t random numbers: stats.t.rvs(df, size=1000)
● F-distribution PDF: stats.f.pdf(x, dfn, dfd)
● F-distribution CDF: stats.f.cdf(x, dfn, dfd)
● Generate F random numbers: stats.f.rvs(dfn, dfd, size=1000)

Hypothesis Testing

● One-sample t-test: stats.ttest_1samp(data, popmean)

● Independent two-sample t-test: stats.ttest_ind(data1, data2)
● Paired t-test: stats.ttest_rel(data1, data2)
● One-way ANOVA: stats.f_oneway(data1, data2, data3)
● Two-way ANOVA: stats.f_oneway(*(group for name, group in
data.groupby(['factor1', 'factor2'])))
● Chi-square goodness of fit test: stats.chisquare(observed, expected)
● Chi-square test of independence:
stats.chi2_contingency(contingency_table)
● Shapiro-Wilk test for normality: stats.shapiro(data)
● Anderson-Darling test for normality: stats.anderson(data)
● Kolmogorov-Smirnov test: stats.kstest(data, 'norm')
● Mann-Whitney U test: stats.mannwhitneyu(data1, data2)
● Wilcoxon signed-rank test: stats.wilcoxon(data1, data2)
● Kruskal-Wallis H-test: stats.kruskal(data1, data2, data3)
● Friedman test: stats.friedmanchisquare(data1, data2, data3)
● Levene's test for equality of variances: stats.levene(data1, data2)
● Bartlett's test for equality of variances: stats.bartlett(data1, data2)
● Fligner-Killeen test for equality of variances: stats.fligner(data1,
data2)

By: Waleed Mousa

Correlation and Regression

● Pearson correlation coefficient: stats.pearsonr(x, y)

● Spearman rank correlation: stats.spearmanr(x, y)
● Kendall's tau: stats.kendalltau(x, y)
● Simple linear regression: stats.linregress(x, y)
● Multiple linear regression: stats.linregress(X, y)
● Polynomial regression: np.polyfit(x, y, deg=2)
● R-squared (coefficient of determination): 1 - (np.sum((y - y_pred)**2)
/ np.sum((y - np.mean(y))**2))
● Adjusted R-squared: 1 - ((1 - r_squared) * (n - 1) / (n - k - 1))
● F-statistic: ((r_squared / (k - 1)) / ((1 - r_squared) / (n - k)))
● Durbin-Watson statistic: stats.durbin_watson(residuals)

Non-parametric Methods

● Kernel density estimation: stats.gaussian_kde(data)

● Bootstrap sample: stats.bootstrap((data,), np.mean, n_resamples=1000)
● Jackknife resampling: stats.jackknife(data, np.mean)
● Permutation test: stats.permutation_test((data1, data2),
stats.ttest_ind)

Multivariate Analysis

● Principal Component Analysis: from sklearn.decomposition import PCA;

PCA().fit_transform(X)
● Canonical correlation analysis: from sklearn.cross_decomposition
import CCA; CCA().fit(X, Y).transform(X, Y)
● MANOVA: from statsmodels.multivariate.manova import MANOVA;
MANOVA.from_formula('y1 + y2 ~ group', data=data).mv_test()
● Hotelling's T-squared test: stats.hotelling_t2(X1, X2)

Time Series Analysis

● Autocorrelation: stats.autocorr(data)
● Partial autocorrelation: from statsmodels.tsa.stattools import pacf;
pacf(data)
● Augmented Dickey-Fuller test: from statsmodels.tsa.stattools import
adfuller; adfuller(data)
● KPSS test: from statsmodels.tsa.stattools import kpss; kpss(data)

By: Waleed Mousa

● Granger causality test: from statsmodels.tsa.stattools import
grangercausalitytests; grangercausalitytests(data, maxlag=5)

Bayesian Statistics

● Bayes factor: stats.bayes_mvs(data)

● Bayesian Information Criterion (BIC): stats.bic(residuals)
● Akaike Information Criterion (AIC): stats.aic(residuals)

Sampling and Experimental Design

● Simple random sample: np.random.choice(population, size=n,

replace=False)
● Stratified sample: from sklearn.model_selection import
StratifiedShuffleSplit; StratifiedShuffleSplit(n_splits=1,
test_size=0.3).split(X, y)
● Cluster sample: from sklearn.cluster import KMeans;
KMeans(n_clusters=k).fit_predict(X)
● Systematic sample: population[::k]
● Latin square design: stats.latin_square(n)

Power Analysis

● Power of t-test: stats.ttest_ind_solve_power(effect_size=0.5,

nobs1=100, alpha=0.05, ratio=1.0, alternative='two-sided')
● Power of ANOVA: stats.f_oneway_solve_power(dfnum=2, dfden=27,
alpha=0.05, effect_size=0.25)
● Sample size calculation for t-test:
stats.ttest_ind_solve_power(effect_size=0.5, power=0.8, alpha=0.05,
ratio=1.0, alternative='two-sided')

Reliability Analysis

● Cronbach's alpha: from statsmodels.stats.inter_rater import

fleiss_kappa; fleiss_kappa(data)
● Intraclass correlation coefficient: stats.ttest_ind(group1, group2)

Effect Size Calculations

By: Waleed Mousa

● Cohen's d: (np.mean(group1) - np.mean(group2)) /
np.sqrt((np.std(group1, ddof=1)**2 + np.std(group2, ddof=1)**2) /
2)
● Eta-squared: ss_effect / (ss_effect + ss_error)
● Odds ratio: (a * d) / (b * c)
● Risk ratio: (a / (a + b)) / (c / (c + d))

Data Transformation

● Z-score normalization: stats.zscore(data)

● Min-max scaling: (data - np.min(data)) / (np.max(data) -
np.min(data))
● Box-Cox transformation: stats.boxcox(data)
● Yeo-Johnson transformation: stats.yeojohnson(data)
● Logarithmic transformation: np.log1p(data)

Outlier Detection

● Z-score method: np.abs(stats.zscore(data)) > 3

● Interquartile range (IQR) method: (data < Q1 - 1.5 * IQR) | (data > Q3
+ 1.5 * IQR)
● Modified Z-score method: 0.6745 * (data - np.median(data)) /
stats.median_abs_deviation(data) > 3.5
● Grubbs' test: stats.grubbs(data)

Confidence Intervals

● Normal distribution CI: stats.norm.interval(alpha=0.95,

loc=np.mean(data), scale=stats.sem(data))
● T-distribution CI: stats.t.interval(alpha=0.95, df=len(data)-1,
loc=np.mean(data), scale=stats.sem(data))
● Binomial proportion CI: stats.binom.interval(n=len(data),
p=np.mean(data), alpha=0.05)
● Poisson CI: stats.poisson.interval(alpha=0.95, mu=np.mean(data))

Survival Analysis

● Kaplan-Meier estimator: from lifelines import KaplanMeierFitter;

KaplanMeierFitter().fit(durations, event_observed)
● Cox proportional hazards model: from lifelines import CoxPHFitter;
CoxPHFitter().fit(df, duration_col='T', event_col='E')

By: Waleed Mousa

● Log-rank test: from lifelines.statistics import logrank_test;
logrank_test(durations_1, durations_2, event_observed_1,
event_observed_2)

Spatial Statistics

● Moran's I: from pysal.explore import esda; esda.Moran(y, w).I

● Geary's C: from pysal.explore import esda; esda.Geary(y, w).C
● Getis-Ord G: from pysal.explore import esda; esda.G(y, w).G

Multivariate Normality Tests

● Mardia's test: from statsmodels.stats.multivariate_normal import

mardia; mardia(data)
● Henze-Zirkler test: from statsmodels.stats.multivariate_normal import
henze_zirkler; henze_zirkler(data)

Robust Statistics

● Median absolute deviation: stats.median_abs_deviation(data)

● Huber's M-estimator: from statsmodels.robust import scale;
scale.huber(data)
● Theil-Sen estimator: from scipy.stats import theilslopes;
theilslopes(y, x)

Factor Analysis

● Exploratory Factor Analysis: from factor_analyzer import

FactorAnalyzer; FactorAnalyzer().fit(data)
● Confirmatory Factor Analysis: from statsmodels.stats.factor import
FactorAnalysis; FactorAnalysis().fit(data)

Cluster Analysis

● K-means clustering: from sklearn.cluster import KMeans;

KMeans(n_clusters=k).fit(X)
● Hierarchical clustering: from scipy.cluster.hierarchy import linkage;
linkage(X, method='ward')
● DBSCAN clustering: from sklearn.cluster import DBSCAN;
DBSCAN().fit(X)

By: Waleed Mousa

Time Series Decomposition

● Seasonal decomposition: from statsmodels.tsa.seasonal import

seasonal_decompose; seasonal_decompose(data, model='additive')

Statistical Process Control

● Control chart (X-bar chart): from statsmodels.stats.stattools import

control_chart; control_chart(data)

Meta-Analysis

● Fixed effects meta-analysis: from statsmodels.stats.meta_analysis

import CombineResults; CombineResults.combine_effects(effects,
variances)
● Random effects meta-analysis: from statsmodels.stats.meta_analysis
import CombineResults; CombineResults.combine_effects(effects,
variances, method='random')

Structural Equation Modeling

● Path analysis: from statsmodels.stats.sem import SEM;

SEM.from_formula('y ~ x1 + x2', data=data).fit()

Item Response Theory

● 1PL (Rasch) model: from psychometrics import irt;

irt.twopl(difficulty, discrimination=1, ability)
● 2PL model: from psychometrics import irt; irt.twopl(difficulty,
discrimination, ability)

Multilevel Modeling

● Random intercept model: from

statsmodels.regression.mixed_linear_model import MixedLM;
MixedLM.from_formula('y ~ x', groups='group', data=data).fit()

Statistical Quality Control

● Capability analysis: from statsmodels.stats.stattools import
cpk_index; cpk_index(data, lower=lsl, upper=usl)
● Process capability index: (usl - lsl) / (6 * np.std(data, ddof=1))
By: Waleed Mousa
Nonlinear Regression

● Curve fitting: from scipy.optimize import curve_fit;

curve_fit(lambda x, a, b: a * np.exp(b * x), x_data, y_data)

Statistical Tests for Circular Data

● Rayleigh test: from scipy.stats import rayleigh; rayleigh.fit(data)

● Watson's U2 test: from astropy.stats import watson_u2;
watson_u2(data)

Extreme Value Analysis

● Generalized extreme value distribution fit: from scipy.stats import

genextreme; genextreme.fit(data)
● Peak over threshold analysis: from scipy.stats import genpareto;
genpareto.fit(data[data > threshold])

Functional Data Analysis

● Functional principal component analysis: from skfda.decomposition

import FPCA; FPCA().fit_transform(data)

Statistical Learning Theory

● Support Vector Machine: from sklearn.svm import SVC; SVC().fit(X, y)

● Cross-validation: from sklearn.model_selection import
cross_val_score; cross_val_score(model, X, y, cv=5)

Copulas

● Gaussian copula: from scipy.stats import multivariate_normal;

multivariate_normal.cdf(data)
● Clayton copula: from copulas.multivariate import
GaussianMultivariate;
GaussianMultivariate().fit(data).probability_density(data)

Stochastic Processes

● Brownian motion simulation: np.cumsum(np.random.normal(0, 1,

size=1000))

By: Waleed Mousa

● Ornstein-Uhlenbeck process: from scipy.integrate import odeint;
odeint(lambda y, t, theta, mu, sigma: theta * (mu - y), y0, t,
args=(theta, mu, sigma))

Causal Inference

● Propensity score matching: from sklearn.linear_model import

LogisticRegression; LogisticRegression().fit(X,
treatment).predict_proba(X)[:, 1]
● Difference-in-differences estimation: np.mean(post_treatment -
pre_treatment) - np.mean(post_control - pre_control)

Spatial Point Pattern Analysis

● Ripley's K function: from astropy.stats import RipleysKEstimator;

RipleysKEstimator(area=area).evaluate(data)

Statistical Network Analysis

● Erdős-Rényi random graph model: from networkx.generators.random_graphs

import erdos_renyi_graph; erdos_renyi_graph(n, p)

By: Waleed Mousa

Statistics Cheatsheet 1703847367
No ratings yet
Statistics Cheatsheet 1703847367
8 pages
Ad3411 - Data Science and Analytics Laboratory
No ratings yet
Ad3411 - Data Science and Analytics Laboratory
26 pages
Hypothesis Testing - Cheatsheet
No ratings yet
Hypothesis Testing - Cheatsheet
10 pages
DVA Lab Manual
No ratings yet
DVA Lab Manual
20 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
Ad3411-Data Science and Analytics Laboratory
No ratings yet
Ad3411-Data Science and Analytics Laboratory
27 pages
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
24 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
ADS LAB Merged
No ratings yet
ADS LAB Merged
86 pages
Datascience Lab
No ratings yet
Datascience Lab
24 pages
STATSCHEATSHeet
No ratings yet
STATSCHEATSHeet
5 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
Regression and Hypothesis Testing Methods
No ratings yet
Regression and Hypothesis Testing Methods
8 pages
Corrected Index of Topics
No ratings yet
Corrected Index of Topics
2 pages
DA Manual - Part B
No ratings yet
DA Manual - Part B
13 pages
Pratical 11 Python DP
No ratings yet
Pratical 11 Python DP
5 pages
AIML
No ratings yet
AIML
14 pages
Python Code - Summary Statistics
No ratings yet
Python Code - Summary Statistics
6 pages
Fha Unit 2
No ratings yet
Fha Unit 2
17 pages
Stats Lab (7-9)
No ratings yet
Stats Lab (7-9)
8 pages
Exp5ids Merged
No ratings yet
Exp5ids Merged
7 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
31 pages
Fdsa Lab Algorithm
No ratings yet
Fdsa Lab Algorithm
21 pages
AD3411
No ratings yet
AD3411
28 pages
ML Updated File
No ratings yet
ML Updated File
36 pages
Machine Learning Lab Word 12-1-2025. Document
No ratings yet
Machine Learning Lab Word 12-1-2025. Document
68 pages
Ad3411 - Student
No ratings yet
Ad3411 - Student
27 pages
Unit 1,2
No ratings yet
Unit 1,2
17 pages
Lab 11,12
No ratings yet
Lab 11,12
7 pages
CPL Practical 1
No ratings yet
CPL Practical 1
14 pages
4 12
No ratings yet
4 12
17 pages
NumPy Stats for Data Analysts
No ratings yet
NumPy Stats for Data Analysts
7 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
ADS EXP Assignments
No ratings yet
ADS EXP Assignments
38 pages
Ad3411 - Dsa Lab Manual
No ratings yet
Ad3411 - Dsa Lab Manual
34 pages
Python Programs
No ratings yet
Python Programs
7 pages
Fha-Pyhton Program Unit 1-4
No ratings yet
Fha-Pyhton Program Unit 1-4
13 pages
Python Code for Central Tendency
No ratings yet
Python Code for Central Tendency
28 pages
ML Programs
No ratings yet
ML Programs
41 pages
Ad3411 Data Science and Analytics Laboratory
100% (7)
Ad3411 Data Science and Analytics Laboratory
24 pages
Ex. No.: 01 Working With Numpy Arrays
No ratings yet
Ex. No.: 01 Working With Numpy Arrays
30 pages
DS Chapter - 2
No ratings yet
DS Chapter - 2
73 pages
Data Analysis and Visualization Guide
No ratings yet
Data Analysis and Visualization Guide
16 pages
Fdsa Lab Manual
No ratings yet
Fdsa Lab Manual
17 pages
Smec ML Lab Manual R22
No ratings yet
Smec ML Lab Manual R22
21 pages
Adsexp 1
No ratings yet
Adsexp 1
6 pages
Dsa Lab
No ratings yet
Dsa Lab
28 pages
Lab Manual (DAV)
No ratings yet
Lab Manual (DAV)
33 pages
FDSA Lab Manual Aim Algorithm
No ratings yet
FDSA Lab Manual Aim Algorithm
32 pages
Biological Data Science Lecture5
No ratings yet
Biological Data Science Lecture5
22 pages
DSBDA Practicals
No ratings yet
DSBDA Practicals
16 pages
AI & Stats Lab Exercises
No ratings yet
AI & Stats Lab Exercises
13 pages
Hands On With Probability and Statistical
No ratings yet
Hands On With Probability and Statistical
9 pages
Python Session 14092024.ipynb - Colab
No ratings yet
Python Session 14092024.ipynb - Colab
6 pages
Statistics Cheat Sheet
No ratings yet
Statistics Cheat Sheet
9 pages
Fda Batch2program
No ratings yet
Fda Batch2program
18 pages
A Mini History of The Printing Press
No ratings yet
A Mini History of The Printing Press
5 pages
Rest Api
No ratings yet
Rest Api
4 pages
DAX Cheat Sheet
No ratings yet
DAX Cheat Sheet
18 pages
Data Engg
No ratings yet
Data Engg
16 pages
SQL Vs Pyspark-1
No ratings yet
SQL Vs Pyspark-1
9 pages
Data Engg 03
No ratings yet
Data Engg 03
11 pages
SQL to Pandas: Key Operations Guide
No ratings yet
SQL to Pandas: Key Operations Guide
38 pages
Sparvix Publishing House Project
100% (1)
Sparvix Publishing House Project
100 pages
Hmis II - Diploma
No ratings yet
Hmis II - Diploma
68 pages
Machine Learning-II
No ratings yet
Machine Learning-II
5 pages
DATA4100 - T1 - 2020 - Assessment 02 Outline
No ratings yet
DATA4100 - T1 - 2020 - Assessment 02 Outline
5 pages
Two-Sample Tests
No ratings yet
Two-Sample Tests
53 pages
Artikel Kadek Dina Saraswati
No ratings yet
Artikel Kadek Dina Saraswati
13 pages
Linear Regression
No ratings yet
Linear Regression
14 pages
OLAP Vs OLTP
No ratings yet
OLAP Vs OLTP
2 pages
Power Bi
No ratings yet
Power Bi
60 pages
Handbook of GroundWater PDF
100% (2)
Handbook of GroundWater PDF
326 pages
Guide 14 Pearson Product Moment
No ratings yet
Guide 14 Pearson Product Moment
2 pages
Kevincarlleyson MEA1 Purposive-Portfolio
No ratings yet
Kevincarlleyson MEA1 Purposive-Portfolio
23 pages
Chap10 Logistic Regression
No ratings yet
Chap10 Logistic Regression
36 pages
Trustworthiness in Qualitative Leisure Research
No ratings yet
Trustworthiness in Qualitative Leisure Research
21 pages
Quality Research Framework Essentials
No ratings yet
Quality Research Framework Essentials
5 pages
IIITBEXCUTIVEDIPLOMAINML
No ratings yet
IIITBEXCUTIVEDIPLOMAINML
21 pages
Lec 14 & 15 CoE
No ratings yet
Lec 14 & 15 CoE
60 pages
Marketing Research Assignment
No ratings yet
Marketing Research Assignment
10 pages
Employee Training Impact in Somalia
No ratings yet
Employee Training Impact in Somalia
91 pages
STEMCapstone Curriculum Guide 2023
No ratings yet
STEMCapstone Curriculum Guide 2023
41 pages
Machine Learning Course Overview
No ratings yet
Machine Learning Course Overview
3 pages
Vinayak CV
No ratings yet
Vinayak CV
2 pages
BBA - Basics To Business - Analytics - UNIT - 1
No ratings yet
BBA - Basics To Business - Analytics - UNIT - 1
11 pages
Case Studies in The Mathematical Statistics Course
No ratings yet
Case Studies in The Mathematical Statistics Course
5 pages
Forecasting Notes
No ratings yet
Forecasting Notes
33 pages
Coefficient of Variation & Z-Scores
No ratings yet
Coefficient of Variation & Z-Scores
5 pages
WMASDS Class Routine Fall 2024 - Effective 23.05.2025
No ratings yet
WMASDS Class Routine Fall 2024 - Effective 23.05.2025
1 page
The Multiple Linear Regression Model: Version: 30-10-2023, 16:07
No ratings yet
The Multiple Linear Regression Model: Version: 30-10-2023, 16:07
17 pages
Architectural Research Methods Guide
No ratings yet
Architectural Research Methods Guide
15 pages
CH02
0% (1)
CH02
6 pages
Excelsior Mining Corp. - Gunnison Copper Project - 01282016 - NI 43-101 Technical Report - PFS
No ratings yet
Excelsior Mining Corp. - Gunnison Copper Project - 01282016 - NI 43-101 Technical Report - PFS
317 pages

Statistical Analysis With Scipy?

Uploaded by

Statistical Analysis With Scipy?

Uploaded by

# [ Statistical Analysis with SciPy ]

Importing and Setup

● Import SciPy stats module: from scipy import stats

● Normal distribution PDF: stats.norm.pdf(x, loc=0, scale=1)

By: Waleed Mousa

● One-sample t-test: stats.ttest_1samp(data, popmean)

By: Waleed Mousa

● Pearson correlation coefficient: stats.pearsonr(x, y)

● Kernel density estimation: stats.gaussian_kde(data)

● Principal Component Analysis: from sklearn.decomposition import PCA;

Time Series Analysis

By: Waleed Mousa

● Bayes factor: stats.bayes_mvs(data)

Sampling and Experimental Design

● Simple random sample: np.random.choice(population, size=n,

● Power of t-test: stats.ttest_ind_solve_power(effect_size=0.5,

● Cronbach's alpha: from statsmodels.stats.inter_rater import

Effect Size Calculations

By: Waleed Mousa

● Z-score normalization: stats.zscore(data)

● Z-score method: np.abs(stats.zscore(data)) > 3

● Normal distribution CI: stats.norm.interval(alpha=0.95,

● Kaplan-Meier estimator: from lifelines import KaplanMeierFitter;

By: Waleed Mousa

● Moran's I: from pysal.explore import esda; esda.Moran(y, w).I

Multivariate Normality Tests

● Mardia's test: from statsmodels.stats.multivariate_normal import

● Median absolute deviation: stats.median_abs_deviation(data)

● Exploratory Factor Analysis: from factor_analyzer import

● K-means clustering: from sklearn.cluster import KMeans;

By: Waleed Mousa

● Seasonal decomposition: from statsmodels.tsa.seasonal import

Statistical Process Control

● Control chart (X-bar chart): from statsmodels.stats.stattools import

● Fixed effects meta-analysis: from statsmodels.stats.meta_analysis

Structural Equation Modeling

● Path analysis: from statsmodels.stats.sem import SEM;

Item Response Theory

● 1PL (Rasch) model: from psychometrics import irt;

● Random intercept model: from

Statistical Quality Control

● Curve fitting: from scipy.optimize import curve_fit;

Statistical Tests for Circular Data

● Rayleigh test: from scipy.stats import rayleigh; rayleigh.fit(data)

Extreme Value Analysis

● Generalized extreme value distribution fit: from scipy.stats import

Functional Data Analysis

● Functional principal component analysis: from skfda.decomposition

Statistical Learning Theory

● Support Vector Machine: from sklearn.svm import SVC; SVC().fit(X, y)

● Gaussian copula: from scipy.stats import multivariate_normal;

● Brownian motion simulation: np.cumsum(np.random.normal(0, 1,

By: Waleed Mousa

● Propensity score matching: from sklearn.linear_model import

Spatial Point Pattern Analysis

● Ripley's K function: from astropy.stats import RipleysKEstimator;

Statistical Network Analysis

● Erdős-Rényi random graph model: from networkx.generators.random_graphs

By: Waleed Mousa

You might also like