BDT Viva Questions

Uploaded by

johnw986687

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

40 views2 pages

BDT Viva Questions

Uploaded by

johnw986687

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

5 V's of Big Data

1. Volume: The sheer amount of data generated.

2. Velocity: The speed at which data is generated and processed.
3. Variety: The diverse types of data, including structured, semi-structured, and
unstructured.
4. Veracity: The quality and accuracy of the data.
5. Value: The potential insights and value that can be derived from the data.
Two Applications of Big Data
1. Healthcare: Analyzing large datasets of patient records to identify trends, predict
diseases, and improve treatment plans.
2. Financial Services: Detecting fraud, assessing risk, and personalizing financial products.
Convergence of Key Trends in Big Data
● IoT: The increasing number of connected devices generating vast amounts of data.
● Cloud Computing: Enabling scalable and cost-effective storage and processing of big
data.
● AI and Machine Learning: Leveraging advanced algorithms to extract insights from
complex datasets.
● Data Science and Analytics: Applying statistical and computational techniques to
uncover patterns and trends.
How Big Data Works in Credit Cards
● Fraud Detection: Analyzing transaction patterns to identify anomalies and potential
fraudulent activity.
● Customer Segmentation: Grouping customers based on their spending habits and
preferences to offer personalized services.
● Risk Assessment: Evaluating creditworthiness and predicting default risk.
Different Types of Data and Examples
● Structured Data: Organized data with a predefined format (e.g., databases,
spreadsheets).
● Semi-Structured Data: Data with some structure but not strictly adhering to a predefined
schema (e.g., XML, JSON).
● Unstructured Data: Data without a predefined structure (e.g., text, images, audio, video).
Firewall Analytics Big Data
Analyzing firewall logs to identify security threats, detect intrusions, and optimize security
policies.
NoSQL
A database model that does not rely on the traditional tabular relational structure. It offers
flexibility and scalability for handling large and diverse datasets.
Aggregate Data Models
Data models that summarize and combine data from multiple sources to provide a higher-level
view.
Shredding
A technique for breaking down large data files into smaller, more manageable chunks.
Schema-less Database
A database that does not require a predefined schema, allowing for flexible data storage and
retrieval.
Master-Slave Replication
A replication technique where a master database updates multiple slave databases.
Peer-to-Peer Replication
A replication technique where multiple databases replicate data with each other.
JSON Files
Text-based files that store data in a hierarchical structure.
MongoDB
A popular NoSQL database that uses a flexible JSON-like document model.
Hadoop Streaming and Pipes
Tools for processing large datasets using custom code written in programming languages like
Java, Python, or C++.
HDFS (Hadoop Distributed File System)
A distributed file system designed to store and process large datasets across multiple nodes.
HDFS Concepts
● NameNode: Manages the file system namespace.
● DataNode: Stores data blocks.
● Block: A fixed-size chunk of data.
● Replication: Storing multiple copies of data blocks for redundancy.
Data Integrity, Compression, and Serialization
Ensuring data accuracy, reducing data size, and converting data into a format suitable for
storage and transmission.
Avro, Map, Reduce Phase
● Avro: A data serialization system for efficient data exchange.
● MapReduce: A programming model for processing large datasets in parallel.
● Map Phase: Processes input data and generates key-value pairs.
● Reduce Phase: Combines key-value pairs with the same key and performs aggregations.
Job Scheduling
The process of managing and executing data processing jobs in a distributed environment.
HBase, Hive, Cassandra Data Model
● HBase: A NoSQL database built on top of HDFS, designed for real-time, random access
to large datasets.
● Hive: A data warehouse infrastructure built on top of Hadoop, enabling SQL-like queries
on large datasets.
● Cassandra: A distributed NoSQL database designed for high availability and scalability.
Additional Topics
● Spark: A fast and general-purpose cluster computing system.
● Kafka: A distributed streaming platform for real-time data processing.
● YARN: A resource management system for Hadoop clusters.
● ZooKeeper: A distributed coordination service for managing large-scale distributed
systems.
● https://github.com/prakashumbc/603_BigData

Big Data & Hadoop Training Material 0 1 PDF
50% (2)
Big Data & Hadoop Training Material 0 1 PDF
168 pages
Data Science
No ratings yet
Data Science
87 pages
Big Data Hadoop Complete Final Spaced
No ratings yet
Big Data Hadoop Complete Final Spaced
15 pages
Hadoop PPT
No ratings yet
Hadoop PPT
25 pages
Updated Unit-2
0% (1)
Updated Unit-2
55 pages
Big Data Complete Notes
No ratings yet
Big Data Complete Notes
9 pages
Big Data Analytics Unit-1
No ratings yet
Big Data Analytics Unit-1
39 pages
Unit 1,2,3,4
No ratings yet
Unit 1,2,3,4
116 pages
The Age OF: Every Minute
No ratings yet
The Age OF: Every Minute
47 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
Unit 1
No ratings yet
Unit 1
89 pages
Hadoop
No ratings yet
Hadoop
61 pages
DBMS Unit-5
No ratings yet
DBMS Unit-5
92 pages
BigData Unit1
No ratings yet
BigData Unit1
74 pages
Hadoop - MapReduce
No ratings yet
Hadoop - MapReduce
51 pages
Unit 1 BDA
No ratings yet
Unit 1 BDA
43 pages
Unit 5
No ratings yet
Unit 5
32 pages
Ashish Presentation Stage1 Modify LR
No ratings yet
Ashish Presentation Stage1 Modify LR
24 pages
Module 1
No ratings yet
Module 1
54 pages
HADOOP
No ratings yet
HADOOP
55 pages
Big Data Complete Notes
No ratings yet
Big Data Complete Notes
33 pages
Bda Unit 1
No ratings yet
Bda Unit 1
32 pages
07 BigData DataAnalysis
No ratings yet
07 BigData DataAnalysis
66 pages
Chapter 14
No ratings yet
Chapter 14
35 pages
Chapter - 2 Hadoop
No ratings yet
Chapter - 2 Hadoop
32 pages
I Am Preparing For A Big Data Analytics University...
No ratings yet
I Am Preparing For A Big Data Analytics University...
15 pages
Big Data Overview
No ratings yet
Big Data Overview
18 pages
IET Udaipur BDA Unit-1
No ratings yet
IET Udaipur BDA Unit-1
10 pages
Lecture 4
No ratings yet
Lecture 4
32 pages
R23 IDS Unit3
No ratings yet
R23 IDS Unit3
36 pages
Hadoop & BigData (UNIT - 2)
No ratings yet
Hadoop & BigData (UNIT - 2)
22 pages
SAP HANA - BWHANA - SQLHANA - Course Content
No ratings yet
SAP HANA - BWHANA - SQLHANA - Course Content
12 pages
BigData Terminology Hadoop MapReduce Yarn Spark File Formats
No ratings yet
BigData Terminology Hadoop MapReduce Yarn Spark File Formats
42 pages
Biggdata
No ratings yet
Biggdata
24 pages
BIG DATA AND ANALYTICS Presentation
No ratings yet
BIG DATA AND ANALYTICS Presentation
31 pages
BIA BigData Overview
No ratings yet
BIA BigData Overview
38 pages
Chapter 2-Data Science
No ratings yet
Chapter 2-Data Science
23 pages
Big Data and Hadoop Overview
100% (1)
Big Data and Hadoop Overview
17 pages
Hadoop Quick Guide
No ratings yet
Hadoop Quick Guide
32 pages
Course Code: CCS334 Course Name: Big Data Analytics Regulation: 2021 Year/Sem: Iii / Vi Faculty Incharge
No ratings yet
Course Code: CCS334 Course Name: Big Data Analytics Regulation: 2021 Year/Sem: Iii / Vi Faculty Incharge
12 pages
Mind Over Markets - 2012 - Dalton - Front Matter
0% (1)
Mind Over Markets - 2012 - Dalton - Front Matter
17 pages
Testing Big Data: Camelia Rad
No ratings yet
Testing Big Data: Camelia Rad
31 pages
Hadoop Spark
No ratings yet
Hadoop Spark
34 pages
Big Data Pyq 21-22
No ratings yet
Big Data Pyq 21-22
9 pages
TIE - 21CS71 SIMP With Key Answers
No ratings yet
TIE - 21CS71 SIMP With Key Answers
19 pages
Experiment No - 1 Bda
No ratings yet
Experiment No - 1 Bda
10 pages
Research Proposal (Physics) - Pitlongay
No ratings yet
Research Proposal (Physics) - Pitlongay
9 pages
Big Data and Hadoop
No ratings yet
Big Data and Hadoop
8 pages
Uc PDF
No ratings yet
Uc PDF
10 pages
Big Data Analysis PDF 2
No ratings yet
Big Data Analysis PDF 2
18 pages
Tools in Data Analytics
No ratings yet
Tools in Data Analytics
17 pages
IOT and Comp - Architecture
No ratings yet
IOT and Comp - Architecture
17 pages
BDA Class3
No ratings yet
BDA Class3
15 pages
Big Data NOTES
No ratings yet
Big Data NOTES
14 pages
Bda Ut1 Que Ans
No ratings yet
Bda Ut1 Que Ans
13 pages
2 Emerging
No ratings yet
2 Emerging
10 pages
Hadoop - Quick Guide Hadoop - Big Data Overview
No ratings yet
Hadoop - Quick Guide Hadoop - Big Data Overview
32 pages
Introduction To Big Dat1
No ratings yet
Introduction To Big Dat1
6 pages
Last Min Preparation - Big Data
No ratings yet
Last Min Preparation - Big Data
5 pages
Analyze and Interpret Production Data
No ratings yet
Analyze and Interpret Production Data
16 pages
HR Yef Internship 2
No ratings yet
HR Yef Internship 2
37 pages
Rahadian Nopriantoko - Data Analytics & Visualisasi Power BI-min
No ratings yet
Rahadian Nopriantoko - Data Analytics & Visualisasi Power BI-min
112 pages
Cache Replacement Algorithm
No ratings yet
Cache Replacement Algorithm
58 pages
CIS017-1 - CIS095-1 - Assignment 1 (Design and Implement A Database) Report Template 2020-2021-16!3!2021
No ratings yet
CIS017-1 - CIS095-1 - Assignment 1 (Design and Implement A Database) Report Template 2020-2021-16!3!2021
7 pages
Winbase H
No ratings yet
Winbase H
41 pages
Ai For IT Coders
No ratings yet
Ai For IT Coders
18 pages
Oracle Data Base
No ratings yet
Oracle Data Base
46 pages
Integrating Explanation and Prediction in Computational Social Science
No ratings yet
Integrating Explanation and Prediction in Computational Social Science
8 pages
BUSINESS INTELLIGENCE NOTES Unit 4
No ratings yet
BUSINESS INTELLIGENCE NOTES Unit 4
10 pages
Master Thesis Template For JSS Science and Technology University
No ratings yet
Master Thesis Template For JSS Science and Technology University
33 pages
Data Science
No ratings yet
Data Science
4 pages
PET Companies
No ratings yet
PET Companies
4 pages
Concept of Nursing As Science
No ratings yet
Concept of Nursing As Science
20 pages
Mastering MariaDB Sample Chapter
No ratings yet
Mastering MariaDB Sample Chapter
33 pages
The Database Management System DBMS
No ratings yet
The Database Management System DBMS
15 pages
Economics Sba 2016
No ratings yet
Economics Sba 2016
3 pages
Synopsis
No ratings yet
Synopsis
19 pages
Accelerated Instruction (TAI) Terhadap Hasil Belajar Siswa Pada Mata
No ratings yet
Accelerated Instruction (TAI) Terhadap Hasil Belajar Siswa Pada Mata
9 pages
John Ghobrial: Year 11 Semester Two Report
No ratings yet
John Ghobrial: Year 11 Semester Two Report
10 pages
ASM Table
No ratings yet
ASM Table
11 pages
Eapa2101 V5.20220401
No ratings yet
Eapa2101 V5.20220401
4 pages
Unit - 3 Operating System
No ratings yet
Unit - 3 Operating System
5 pages
DQL Assignment
No ratings yet
DQL Assignment
2 pages
Exam DP-200: Implementing An Azure Data Solution - Skills Measured
No ratings yet
Exam DP-200: Implementing An Azure Data Solution - Skills Measured
5 pages
Exp4 RAI DSA SLL 24-25
No ratings yet
Exp4 RAI DSA SLL 24-25
4 pages
CSC 1403 Database Concepts First Assignment
No ratings yet
CSC 1403 Database Concepts First Assignment
6 pages
Database And Computer Management: SERIES 1, #3
From Everand
Database And Computer Management: SERIES 1, #3
Elias Mutegi
No ratings yet
Databases: System Concepts, Designs, Management, and Implementation
From Everand
Databases: System Concepts, Designs, Management, and Implementation
Jonathan Rigdon
No ratings yet
The Power of Big Data: Transforming Industries and Shaping the Future
From Everand
The Power of Big Data: Transforming Industries and Shaping the Future
Tom Henricksen
No ratings yet
Practical Data Strategies and Recipes
From Everand
Practical Data Strategies and Recipes
Tom Henricksen
No ratings yet

BDT Viva Questions

Uploaded by

BDT Viva Questions

Uploaded by

5 V's of Big Data

1. Volume: The sheer amount of data generated.

You might also like