TYCS Data Science Questions Bank

The document outlines questions that cover key concepts in data science across three units - including data preparation techniques, machine learning algorithms, and model evaluation metrics. Some of the topics covered are data types, data cleaning, feature engineering, supervised and unsupervised learning, linear and logistic regression, decision trees, ensemble methods, and model performance metrics like precision, recall, and F1 score.

Uploaded by

Gaurav bansode

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

67 views

TYCS Data Science Questions Bank

Uploaded by

Gaurav bansode

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

TY BSc CS - Data Science Question Bank

UNIT 1

1. Applications and domains of data science.

2. Difference between data Science and business intelligence.
3. Difference between data Science and artificial intelligence.
4. Difference between data Science and machine learning.
5. Difference between data warehousing and data mining OR what is data warehousing
and data mining?
6. Difference between Structured and unstructured data.
7. write a Short note on different data Sources.
8. Explain difference between Structured, unstructured and Semi-Structured data.
9. Explain the various strategies to handle missing values.
10. Explain the various strategies to detect outliers and treat them.
11. Explain what is data cleaning and its techniques. (handling missing values , handling
duplicates , handling outliers).
12. Explain various data transformation techniques. (scaling and normalization).
13. Explain various techniques to handle categorical variables/data.
14. What are features? Explain the relevant ways to select features.
15. Explain Joins in SQL.
16. Explain what is data wrangling & Types of Data wrangling Techniques.
17. Explain what is feature Engineering And How to handle it?
18. Explain what is dummification. HOWow to Create dummies in categorical variables.
19. Explain what is standardization, normalization in feature Scaling.
20. Explain the various tools and libraries used in data science.

3 marks questions -
1) What is data?
2) What is data Science ?
3) Explain handling missing values.
4) Explain handling duplicates.
5) Explain handling outliers.
6) Explain min- max scaler.
7) Explain Standardization.
8) Explain One - hot encoder.
9) Explain Label encoding.
10)Explain Structured , unstructured and semi- structured data.
UNIT 2

1. Explain the various data visualization Techniques, with Examples. (histogram, bar
chart, line chart, scatter plot, box plot)
2. Explain what is hypothesis testing and its types.
3. Explain the classification of machine learning. (supervised, unsupervised and
reinforcement)
4. Explain what supervised learning is. (regression and classification)
5. Explain the difference between Classification and regression.
6. Explain what is clustering with an example.
7. Explain Bias variance tradeoff.
8. Explain the difference between overfitting and underfitting. OR Explain what is
underfitting and overfitting.
9. Explain linear regression in detail.
10. Explain logistic regression in detail. (non linear)
11. Explain with an example Confusion matrix, Precision, recall and F1 - Score OR
explain what is precision , F1 score, recall and accuracy.
12. Explain what is cross-validation. (K - Fold, stratified).
13. Explain the working of Decision trees.
14. Explain what a random forest classifier is.
15. Explain SVM algorithm.
16. Explain the architecture of ANN.
17. Explain what ensemble learning is.
18. Explain the difference between bagging and boosting techniques.
19. Explain the working of the K-NN algorithm.
20. explain how gradient descent is used for optimization.

3 marks questions -
1) What is dimensionality reduction?
2) What is bias?
3) What is variance?
4) What is overfitting?
5) What is underfitting?
6) What is Mean , median, mode , and Standard deviation?
7) What is hyperparameter tuning?
8) What is ANOVA?
UNIT 3

1. Explain the matrix to evaluate the performance of classification. (confusion matrix ,

precision , F1 score, recall and accuracy).
2. Explain the working of weighted balanced accuracy.
3. Explain what is F Beta score.
4. What are the principles of effective data visualization?
5. Explain the types of visualization with examples. (bar chart, scatter plot , box plot,
line chart, heat map).
6. What are the visualization tools used for analysis? (matplotlib, seaborn, tableau,
powerBI).
7. Explain what is storytelling in analysis and how to communicate insights through
visualization.
8. Explain some of the data management activities.
9. Short note on ETL.
10. Explain why data governance and data quality are important . OR difference
between data governance and data quality.
11. What is data privacy and how to manage it.
12. Explain the types of data security considerations.

3 marks questions -
1. Explain the following concepts (any 3) -
(confusion matrix, ROC AUC curve, precision, F1 score, recall and accuracy).

Apache Cassandra Administrator Associate - Exam Practice Tests
From Everand
Apache Cassandra Administrator Associate - Exam Practice Tests
Cristian Scutaru
No ratings yet
Network Operations Center
100% (4)
Network Operations Center
3 pages
CC4057NI - Introduction To Information Systems S21 (1st Sit) - CW2 QP
No ratings yet
CC4057NI - Introduction To Information Systems S21 (1st Sit) - CW2 QP
5 pages
How To Start A Research Work in Computer Science PDF
No ratings yet
How To Start A Research Work in Computer Science PDF
4 pages
CS964 Data Warehousing and Data Mining
No ratings yet
CS964 Data Warehousing and Data Mining
1 page
Evaluating Standards Essential Patents in Mobile Cellular
No ratings yet
Evaluating Standards Essential Patents in Mobile Cellular
8 pages
Ethical Hacking question bank
No ratings yet
Ethical Hacking question bank
5 pages
New Cloud Journal Tycs Sem Vi Cs Corner
No ratings yet
New Cloud Journal Tycs Sem Vi Cs Corner
64 pages
TYCS_SEM_VI_CLOUD_WS_FINAL
No ratings yet
TYCS_SEM_VI_CLOUD_WS_FINAL
103 pages
Ch06 Deep Feedforward Networks
No ratings yet
Ch06 Deep Feedforward Networks
90 pages
KCG College of Technology Karapakkam Chennai-600 097
No ratings yet
KCG College of Technology Karapakkam Chennai-600 097
3 pages
CCWS sf
No ratings yet
CCWS sf
82 pages
Network Security and Cryptography Dr.P.rizwan Ahmed
No ratings yet
Network Security and Cryptography Dr.P.rizwan Ahmed
6 pages
UNIT 2 Cyber Crime and Cyber Low
No ratings yet
UNIT 2 Cyber Crime and Cyber Low
19 pages
DATA SCIENCE
No ratings yet
DATA SCIENCE
8 pages
Tycs Sem Vi Informational Retrival Final Notes (WWW - Profajaypashankar.com-1
No ratings yet
Tycs Sem Vi Informational Retrival Final Notes (WWW - Profajaypashankar.com-1
103 pages
Unit - V Implementation, Testing & Maintenance
No ratings yet
Unit - V Implementation, Testing & Maintenance
60 pages
Data Visualization Complete Notes
No ratings yet
Data Visualization Complete Notes
31 pages
DS Practical (BSC CS)
No ratings yet
DS Practical (BSC CS)
49 pages
Unit-3 Part1
No ratings yet
Unit-3 Part1
57 pages
Cse-CSEViii-web 2.0 & Rich Internet Application (06cs832) - Notes
No ratings yet
Cse-CSEViii-web 2.0 & Rich Internet Application (06cs832) - Notes
86 pages
Chapter 10 Asset Management 2014 From Machine To Machine To The Internet of Things
No ratings yet
Chapter 10 Asset Management 2014 From Machine To Machine To The Internet of Things
8 pages
Android SDK Features
No ratings yet
Android SDK Features
20 pages
Offensive Security - 0306204
No ratings yet
Offensive Security - 0306204
22 pages
Cs3353 Foundations of Data Science L T P C 3 0 0 3
No ratings yet
Cs3353 Foundations of Data Science L T P C 3 0 0 3
2 pages
6.0 Introduction To Real-Time Operating Systems (Rtos)
No ratings yet
6.0 Introduction To Real-Time Operating Systems (Rtos)
35 pages
4.7.1 - Data Warehousing Mining & Business Intelligence
No ratings yet
4.7.1 - Data Warehousing Mining & Business Intelligence
3 pages
Syllabus For 4th Sem CSE - BSC-401
No ratings yet
Syllabus For 4th Sem CSE - BSC-401
2 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
426 pages
PHP Assignment
100% (1)
PHP Assignment
10 pages
Use of Supercomputing in Scientific Research, Engineering, and Industries
100% (1)
Use of Supercomputing in Scientific Research, Engineering, and Industries
40 pages
Distributed File System
No ratings yet
Distributed File System
49 pages
[FREE PDF sample] Mobile Phone Security and Forensics A Practical Approach 2nd Edition Iosif I. Androulidakis (Auth.) ebooks
100% (2)
[FREE PDF sample] Mobile Phone Security and Forensics A Practical Approach 2nd Edition Iosif I. Androulidakis (Auth.) ebooks
45 pages
Old Question Papers (R13)
No ratings yet
Old Question Papers (R13)
15 pages
Me Cp4212 Software Engineering Manual
No ratings yet
Me Cp4212 Software Engineering Manual
34 pages
2022 Dec. ITT401-A
No ratings yet
2022 Dec. ITT401-A
2 pages
Unit - I IDS
No ratings yet
Unit - I IDS
33 pages
Data Mining
No ratings yet
Data Mining
2 pages
Daa Assignment
No ratings yet
Daa Assignment
5 pages
Cyber Security and Cyber Laws Practical List
No ratings yet
Cyber Security and Cyber Laws Practical List
2 pages
Software Testing Methodologcompletenotes
No ratings yet
Software Testing Methodologcompletenotes
147 pages
Mrcet R20 Iv 1 QB
No ratings yet
Mrcet R20 Iv 1 QB
79 pages
Object Oriented Programming Through Java R19 - UNIT-1
No ratings yet
Object Oriented Programming Through Java R19 - UNIT-1
46 pages
CSDF Endsem
100% (1)
CSDF Endsem
33 pages
Ethical Hacking Unit 2
No ratings yet
Ethical Hacking Unit 2
23 pages
Data Warehousing & Data Mining
No ratings yet
Data Warehousing & Data Mining
97 pages
Introduction To Databases CT042-3-1-IDB
No ratings yet
Introduction To Databases CT042-3-1-IDB
22 pages
Question Bank_CSE-DS
No ratings yet
Question Bank_CSE-DS
5 pages
Nptel Swayam DWDM Slides
No ratings yet
Nptel Swayam DWDM Slides
406 pages
Exercise - 3 Submission - Group - 12
No ratings yet
Exercise - 3 Submission - Group - 12
14 pages
Database
No ratings yet
Database
5 pages
Se Module 2 PPT
No ratings yet
Se Module 2 PPT
86 pages
MCA MGU 5th Sem Syllabus
No ratings yet
MCA MGU 5th Sem Syllabus
7 pages
Django Ppts
No ratings yet
Django Ppts
243 pages
Department of Computer Applications - Library Catalogue: Book ID Accession No Book Name Author
No ratings yet
Department of Computer Applications - Library Catalogue: Book ID Accession No Book Name Author
112 pages
OOAD Question Bank
100% (2)
OOAD Question Bank
5 pages
PDS Question Bank
No ratings yet
PDS Question Bank
19 pages
Unit I 2 Marks With Ans
No ratings yet
Unit I 2 Marks With Ans
7 pages
OCS353 Data Science Fundamentals QB_(Common to EEE,Mech,Civil)
No ratings yet
OCS353 Data Science Fundamentals QB_(Common to EEE,Mech,Civil)
7 pages
Fdsa Unit 1 Aids Sem 4
No ratings yet
Fdsa Unit 1 Aids Sem 4
26 pages
II CSE_A&B (96)DS-int 1 QP ANS-set1 - Copy
No ratings yet
II CSE_A&B (96)DS-int 1 QP ANS-set1 - Copy
7 pages
12 2marks With Ans
No ratings yet
12 2marks With Ans
21 pages
Assignment 01 Ins
No ratings yet
Assignment 01 Ins
9 pages
WSN QB
No ratings yet
WSN QB
45 pages
WSN Unit 1
No ratings yet
WSN Unit 1
22 pages
PM QB SOlVED
No ratings yet
PM QB SOlVED
101 pages
CF Solved QB
100% (1)
CF Solved QB
51 pages
Ins QB
No ratings yet
Ins QB
58 pages
Lsa Imp QB (E-Next - In)
No ratings yet
Lsa Imp QB (E-Next - In)
3 pages
Lsa QB Ans
No ratings yet
Lsa QB Ans
55 pages
Introduction To Postgis: Ulanbek Turdukulov
No ratings yet
Introduction To Postgis: Ulanbek Turdukulov
111 pages
Chapter 4-Unit 4: Designing Your User Interface With Views
No ratings yet
Chapter 4-Unit 4: Designing Your User Interface With Views
39 pages
Linux Shell or "Terminal"
No ratings yet
Linux Shell or "Terminal"
3 pages
CCTV
No ratings yet
CCTV
6 pages
CMSREPORT Presentation
No ratings yet
CMSREPORT Presentation
27 pages
25th June Class Notes DE 4 PDF
No ratings yet
25th June Class Notes DE 4 PDF
10 pages
SRS - PDS - Audi - P452 - TSGen - Fault Handling Specification
No ratings yet
SRS - PDS - Audi - P452 - TSGen - Fault Handling Specification
4 pages
CS - MOCK TEST PAPER - Term II 2022 - V4
100% (2)
CS - MOCK TEST PAPER - Term II 2022 - V4
45 pages
QUIZ 2 Empowerment Technology
No ratings yet
QUIZ 2 Empowerment Technology
1 page
Technical Communication Omnipcx Enterprise: NB of Pages: 8 Date: 27 July 2007
No ratings yet
Technical Communication Omnipcx Enterprise: NB of Pages: 8 Date: 27 July 2007
8 pages
WEEK1 - Computer Appreciation
No ratings yet
WEEK1 - Computer Appreciation
11 pages
An Empirical Study of
No ratings yet
An Empirical Study of
11 pages
Bachelor Thesis - Anatolii Shokhin PDF
No ratings yet
Bachelor Thesis - Anatolii Shokhin PDF
71 pages
Chapter 5 Normalization
No ratings yet
Chapter 5 Normalization
12 pages
Gujarat Technological University: Fundamentals of Microprocessors
No ratings yet
Gujarat Technological University: Fundamentals of Microprocessors
4 pages
Student Guide CyberTeachers Platinum - EN
No ratings yet
Student Guide CyberTeachers Platinum - EN
12 pages
Path Traversal
No ratings yet
Path Traversal
8 pages
CN MCQ QB
No ratings yet
CN MCQ QB
30 pages
BGP Link State BGP-LS Producer For Is-Is LSDB
No ratings yet
BGP Link State BGP-LS Producer For Is-Is LSDB
25 pages
SX-ULPGN Product Brochure
No ratings yet
SX-ULPGN Product Brochure
2 pages
Thesis - Dinesh Mavaluru
No ratings yet
Thesis - Dinesh Mavaluru
142 pages
Red Team Guide (Review Edition)
No ratings yet
Red Team Guide (Review Edition)
189 pages
Knowledge Assessment Test For Administrative Roles - 01.24
No ratings yet
Knowledge Assessment Test For Administrative Roles - 01.24
3 pages
FPi600 Operator Manual F
No ratings yet
FPi600 Operator Manual F
36 pages
Packet Tracer - Configuring Named Standard Acls: (Instructor Version)
No ratings yet
Packet Tracer - Configuring Named Standard Acls: (Instructor Version)
6 pages
Annexure - Ii (A) Theory Slots
No ratings yet
Annexure - Ii (A) Theory Slots
15 pages
01-04 Basic Configurations Commands
No ratings yet
01-04 Basic Configurations Commands
455 pages
MTech ECE VLSIVLSI D VLSI SDVLSI ME
No ratings yet
MTech ECE VLSIVLSI D VLSI SDVLSI ME
66 pages

TYCS Data Science Questions Bank

Uploaded by

TYCS Data Science Questions Bank

Uploaded by

TY BSc CS - Data Science Question Bank

1. Applications and domains of data science.

1. Explain the matrix to evaluate the performance of classification. (confusion matrix ,

You might also like