Assignment 2

The document outlines an assignment for Big Data at Sunderdeep Engineering College, detailing guidelines for submission, including the requirement to answer 10 specific questions related to HDFS, YARN, NoSQL databases, Spark, Scala, and Hadoop ecosystem frameworks. It emphasizes originality, citation of references, and includes a due date of May 23, 2025. Each question requires in-depth explanations and comparisons of various concepts and technologies in the field of Big Data.

Uploaded by

db880074

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views

Assignment 2

Uploaded by

db880074

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 1

Sunderdeep Engineering College, Ghaziabad

Assignment BIG DATA(BCS-061)

Faculty Name: Ms. Vandana Sharma

Guidelines for Assignment Submission :

 Answer all 10 questions. Include diagrams and tables where necessary.

 Work must be original. Cite any references used.
 Due Date: 23rd May 2025.

1. Explain the design of HDFS. What are the key concepts behind HDFS, such as block
sizes, data replication, and block abstraction? How does HDFS ensure fault tolerance and
scalability?
2. Describe how HDFS stores, reads, and writes files. How does HDFS achieve high
throughput when handling large datasets? Explain the data flow in HDFS from the
client’s perspective.
3. What are the key differences between the Hadoop File System (HDFS) command line
interface and Java interfaces? How can you interact with HDFS using both the command
line and Java?
4. Describe the steps involved in setting up a Hadoop cluster. What are the main
configurations that need to be considered during Hadoop installation? How do you ensure
security in a Hadoop environment?
5. Explain the role of YARN in the Hadoop ecosystem. How does YARN improve the
resource management in Hadoop 2.0? What are the main differences between MRv1 and
MRv2?
6. What are the key characteristics of NoSQL databases? Explain how MongoDB fits into
the NoSQL landscape. How do you create, update, delete, and query documents in
MongoDB?
7. Describe the concept of Resilient Distributed Datasets (RDDs) in Spark. How do Spark
applications, jobs, stages, and tasks work in the context of distributed data processing?
8. Provide an overview of the basic syntax and concepts in Scala. How does Scala support
object-oriented and functional programming? Describe the use of functions, closures, and
inheritance in Scala.
9. Compare and contrast the three Hadoop ecosystem frameworks: Pig, Hive, and HBase.
How do they differ in terms of data processing, querying, and storage? Provide examples
of their use cases.
10. What is Zookeeper and how does it help in monitoring a Hadoop cluster? Explain its role
in coordination and configuration management for distributed applications in a cluster
environment.

imp for exam
No ratings yet
imp for exam
2 pages
BDAA semister question bank
No ratings yet
BDAA semister question bank
2 pages
Important Questions-Bigdata
No ratings yet
Important Questions-Bigdata
4 pages
BgiData QB
100% (1)
BgiData QB
3 pages
Model question paper _Big data_2024-25_kca022
No ratings yet
Model question paper _Big data_2024-25_kca022
3 pages
Important Questions and Answers of Big Data Course
No ratings yet
Important Questions and Answers of Big Data Course
4 pages
Mastering Data Engineering: Advanced Techniques with Apache Hadoop and Hive
From Everand
Mastering Data Engineering: Advanced Techniques with Apache Hadoop and Hive
Peter Jones
No ratings yet
Big Data QB
No ratings yet
Big Data QB
5 pages
DSA Question Bank
No ratings yet
DSA Question Bank
8 pages
Advanced Hadoop Techniques: A Comprehensive Guide to Mastery
From Everand
Advanced Hadoop Techniques: A Comprehensive Guide to Mastery
Adam Jones
No ratings yet
Big_Data_BCS061_Complete_Question_Bank_with_RealWorld (1)
No ratings yet
Big_Data_BCS061_Complete_Question_Bank_with_RealWorld (1)
5 pages
KCS061-BIG-DATA
No ratings yet
KCS061-BIG-DATA
2 pages
Big Data Assigenment 3&4
No ratings yet
Big Data Assigenment 3&4
1 page
BIG DATA ANALTYTICS QB
No ratings yet
BIG DATA ANALTYTICS QB
3 pages
DOC-20241202-WA0037.
No ratings yet
DOC-20241202-WA0037.
3 pages
Big Data Journal
No ratings yet
Big Data Journal
217 pages
UNIT III
No ratings yet
UNIT III
9 pages
BDA Unit-4 Part-1 HDFS,MapReduce
No ratings yet
BDA Unit-4 Part-1 HDFS,MapReduce
76 pages
Question Bank - Big Data Analytics - Final1
100% (1)
Question Bank - Big Data Analytics - Final1
6 pages
Hadoop Ecosystem and Their Components
No ratings yet
Hadoop Ecosystem and Their Components
19 pages
Certified Hadoop and Spark Course Curriculum
No ratings yet
Certified Hadoop and Spark Course Curriculum
9 pages
III-II Big Data Analytics Question Bank
100% (1)
III-II Big Data Analytics Question Bank
3 pages
BIG DATA 2023
No ratings yet
BIG DATA 2023
18 pages
Btech Oe 8 Sem Big Data Koe 097 2023
No ratings yet
Btech Oe 8 Sem Big Data Koe 097 2023
2 pages
DSA Practical Index
No ratings yet
DSA Practical Index
3 pages
BDA Unit 2 Q&A
No ratings yet
BDA Unit 2 Q&A
14 pages
Question Bank BDA-CCS334
No ratings yet
Question Bank BDA-CCS334
6 pages
Important Question Bank BD
No ratings yet
Important Question Bank BD
3 pages
Unit 3 - BD - Hadoop Ecosystem
No ratings yet
Unit 3 - BD - Hadoop Ecosystem
42 pages
big data
No ratings yet
big data
22 pages
CMT 428 Ethical Hacking Essay Assignment
No ratings yet
CMT 428 Ethical Hacking Essay Assignment
2 pages
Hadoop Introduction
No ratings yet
Hadoop Introduction
29 pages
BIG DATA IMPORTANT QUESTIONS
No ratings yet
BIG DATA IMPORTANT QUESTIONS
4 pages
Question Bank Big Data analytics
No ratings yet
Question Bank Big Data analytics
2 pages
imp
No ratings yet
imp
6 pages
bda unit 4-1
No ratings yet
bda unit 4-1
64 pages
Assignment BDHhhh
No ratings yet
Assignment BDHhhh
15 pages
bigdata imp ques
No ratings yet
bigdata imp ques
5 pages
Question Bank For PUT
No ratings yet
Question Bank For PUT
3 pages
Big Data Visualization
No ratings yet
Big Data Visualization
55 pages
Mastering Big Data and Hadoop: From Basics to Expert Proficiency
From Everand
Mastering Big Data and Hadoop: From Basics to Expert Proficiency
William Smith
No ratings yet
Bda Imp No Header Footer (1)
No ratings yet
Bda Imp No Header Footer (1)
25 pages
Big Data Unit 4
No ratings yet
Big Data Unit 4
96 pages
Big Data Syllabus
No ratings yet
Big Data Syllabus
3 pages
Big Data Lab Manual
No ratings yet
Big Data Lab Manual
44 pages
SPARK and Scala Download Syllabus PDF
No ratings yet
SPARK and Scala Download Syllabus PDF
3 pages
Assignment Big Data Analytics
No ratings yet
Assignment Big Data Analytics
3 pages
School of Computer Engineering: Kalinga Institute of Industrial Technology Deemed To Be University Bhubaneswar-751024
No ratings yet
School of Computer Engineering: Kalinga Institute of Industrial Technology Deemed To Be University Bhubaneswar-751024
260 pages
Lecture 2
No ratings yet
Lecture 2
70 pages
1.1.1
No ratings yet
1.1.1
30 pages
big data analytics syallabus
No ratings yet
big data analytics syallabus
3 pages
ASSIGNMENT-3 BDA
No ratings yet
ASSIGNMENT-3 BDA
5 pages
Last year question paper-- Big Data-(BCS 061)
No ratings yet
Last year question paper-- Big Data-(BCS 061)
9 pages
BIG data master
No ratings yet
BIG data master
24 pages
Hadoop and Pig Overview - Hands-On: Outline of Tutorial
No ratings yet
Hadoop and Pig Overview - Hands-On: Outline of Tutorial
52 pages
Act2 - March7 - 6E - BDA - SEC
No ratings yet
Act2 - March7 - 6E - BDA - SEC
8 pages
Unit 3 Bda
No ratings yet
Unit 3 Bda
13 pages
Bda Unit 2
No ratings yet
Bda Unit 2
57 pages
Bda Summer 2022 Solution
No ratings yet
Bda Summer 2022 Solution
30 pages
EECS6893-BigDataAnalytics-Lecture2
No ratings yet
EECS6893-BigDataAnalytics-Lecture2
79 pages

Assignment 2

Uploaded by

Assignment 2

Uploaded by

Sunderdeep Engineering College, Ghaziabad

Assignment BIG DATA(BCS-061)

Faculty Name: Ms. Vandana Sharma

 Answer all 10 questions. Include diagrams and tables where necessary.

You might also like