0% found this document useful (0 votes)

2 views6 pages

Lab_Exam 2021BCS0021

The document outlines the final lab exam for Big Data and Scalable Computing, scheduled for November 7, 2024, with a total of 15 marks. It includes tasks such as performing various join operations using PIG on provided text files, executing joins using multiple keys, counting words in a text file using Spark, and displaying contents of a CSV file in Spark. The exam has a structured time allocation of 30 minutes for writing and 1 hour for execution.

Uploaded by

Vikas Kushwaha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views6 pages

Lab_Exam 2021BCS0021

Uploaded by

Vikas Kushwaha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 6

Final Lab Exam Big Data and Scalable Computing

Group A

Date : 07-11-2024 Marks: 15 (8M Written + 7M Execution)

Time : 12PM – 2PM 30min time for writing, 1hr for execution

Name : Vikas Kushwaha

Roll No : 2021BCS0021

Task 1: Perform Join operation on PIG with given files (3M)

• Self-Join on File 1
• Inner join
• Outer join (Left, Right, Full)

File 1

customers.txt

id, name, age, city, amount

1,Ramesh,32,Ahmedabad,2000.00
2,Khilan,25,Delhi,1500.00

3,kaushik,23,Kota,2000.00

4,Chaitali,25,Mumbai,6500.00

5,Hardik,27,Bhopal,8500.00

6,Komal,22,MP,4500.00

7,Muffy,24,Indore,10000.00

File 2

orders.txt order_id, date,

cust_id, amount 102,2009-10-08

00:00:00,3,3000
100,2009-10-08 00:00:00,3,1500
101,2009-11-20 00:00:00,2,1560
103,2008-05-20 00:00:00,4,2060

SELF_JOIN

INNER JOIN

Outer join (Left, Right, Full)

Task 2: Perform JOIN operation using multiple keys – id, jobid (1M)

employee.txt

id, firstname, lastname, age, post, jobid

1,Rajiv,Reddy,21,programmer,113
2,Siddarth,Battacharya,22,programmer,113

3,Rajesh,Khanna,22,programmer,113

4,Preethi,Agarwal,21,programmer,113

5,Trupthi,Mohanthy,23,programmer,113
6,Archana,Mishra,23,programmer,113
7,Komal,Nayak,24,teamlead,112

employee_contact.txt

id, mobileno, mail, age, city, jobid

1,9848022337,[email protected],Hyderabad,113

2,9848022338,[email protected],Kolkata,113

3,9848022339,[email protected],Delhi,113

004,9848022330,[email protected],Pune,113

005,9848022336,[email protected],Bhuwaneshwar,11
3

006,9848022335,[email protected],Chennai,113

007,9848022334,[email protected],trivendram,112

008,9848022333,[email protected],Chennai,111
Task 3: Read any text file in Spark and display count of each word of the text file in
Spark. (3M)

Task 4: Read any csv file in Spark and show its all contents (1M)

XIIInfo Pract S E 435
0% (1)
XIIInfo Pract S E 435
5 pages
AAYUSH SACHETI IP PROJECT
No ratings yet
AAYUSH SACHETI IP PROJECT
58 pages
BDA LabRecord Week04 07
No ratings yet
BDA LabRecord Week04 07
31 pages
Booklet XII CS 2024-25
No ratings yet
Booklet XII CS 2024-25
124 pages
DB FINAL LAB EXAM Hamza Nazir (2872) - Bscs EVE PDF
No ratings yet
DB FINAL LAB EXAM Hamza Nazir (2872) - Bscs EVE PDF
17 pages
Ip file . Jasleen
No ratings yet
Ip file . Jasleen
44 pages
Neel
No ratings yet
Neel
12 pages
NEEL (1)
No ratings yet
NEEL (1)
12 pages
NEEL (1)_edited
No ratings yet
NEEL (1)_edited
12 pages
Exp 3,4
No ratings yet
Exp 3,4
11 pages
ip
No ratings yet
ip
35 pages
Program List Dbms (1)
No ratings yet
Program List Dbms (1)
8 pages
Practice 1,2
No ratings yet
Practice 1,2
8 pages
unit 4 Spark SQL
No ratings yet
unit 4 Spark SQL
49 pages
FB1
No ratings yet
FB1
6 pages
1st Paper Solution
No ratings yet
1st Paper Solution
5 pages
xii cs practical sets
No ratings yet
xii cs practical sets
5 pages
2023MCS320004 HEMANTH TARRA - Assignment -9
No ratings yet
2023MCS320004 HEMANTH TARRA - Assignment -9
4 pages
NEEL (1) Edited Edited
No ratings yet
NEEL (1) Edited Edited
12 pages
DBS BIT&BSE Lab02
No ratings yet
DBS BIT&BSE Lab02
5 pages
XII IP Practicals A With Answers
No ratings yet
XII IP Practicals A With Answers
5 pages
CS PQMS
No ratings yet
CS PQMS
9 pages
Pre Board XII CS 21 22 1
No ratings yet
Pre Board XII CS 21 22 1
6 pages
Sample Paper 5_AnswerKey
No ratings yet
Sample Paper 5_AnswerKey
10 pages
CCA-175 Docs and Projects
No ratings yet
CCA-175 Docs and Projects
5 pages
Xii Cs Rev 3 Practical Qp
No ratings yet
Xii Cs Rev 3 Practical Qp
12 pages
Big Data With Spark and Hadoop
No ratings yet
Big Data With Spark and Hadoop
9 pages
Lab5 (Uni)
No ratings yet
Lab5 (Uni)
3 pages
DB PracticeLab 02
No ratings yet
DB PracticeLab 02
2 pages
Proposal For Coding Challenge
No ratings yet
Proposal For Coding Challenge
3 pages
IMPORTANT QUESTIONS PRACTICALS
No ratings yet
IMPORTANT QUESTIONS PRACTICALS
2 pages
Practical 2 Q.no. 1 To 4
No ratings yet
Practical 2 Q.no. 1 To 4
7 pages
Practical 2023
No ratings yet
Practical 2023
10 pages
Class 12 IP Practical Record
No ratings yet
Class 12 IP Practical Record
33 pages
Acet
No ratings yet
Acet
8 pages
Class Xii Practical Questions 2024-25
No ratings yet
Class Xii Practical Questions 2024-25
13 pages
Cs QP
No ratings yet
Cs QP
9 pages
Question Paper Computer Science Class 12
No ratings yet
Question Paper Computer Science Class 12
5 pages
Big Data Quality Assurance (Manual) - Interview Questionnaire v1.0 1
No ratings yet
Big Data Quality Assurance (Manual) - Interview Questionnaire v1.0 1
9 pages
CS Practical Exam 2024-25
No ratings yet
CS Practical Exam 2024-25
1 page
Revision Exam I[XII] Ans-1
No ratings yet
Revision Exam I[XII] Ans-1
8 pages
PYTHON AND SQL
No ratings yet
PYTHON AND SQL
24 pages
Practice Questions(1)
No ratings yet
Practice Questions(1)
11 pages
Sai PIG Practicals PDF
No ratings yet
Sai PIG Practicals PDF
6 pages
SSCE_MS(25)
No ratings yet
SSCE_MS(25)
25 pages
Theory of Computation!
No ratings yet
Theory of Computation!
74 pages
XII CS MS PP-3 2024-25
No ratings yet
XII CS MS PP-3 2024-25
6 pages
ABP W9-W10 Big Data Analytics Lab-PIG
No ratings yet
ABP W9-W10 Big Data Analytics Lab-PIG
11 pages
Sample Paper 3_AnswerKey
No ratings yet
Sample Paper 3_AnswerKey
5 pages
XII CS AK Set 1
No ratings yet
XII CS AK Set 1
9 pages
12 CS Term 2 Practical KV SECL NOWROZABAD
No ratings yet
12 CS Term 2 Practical KV SECL NOWROZABAD
3 pages
Make A Draft of Your Project: Writing Code and Diagrams Wherever Necessary Using OOSP Concepts, This Work Will Be
No ratings yet
Make A Draft of Your Project: Writing Code and Diagrams Wherever Necessary Using OOSP Concepts, This Work Will Be
8 pages
cs_xii_ms_pb2_set1
No ratings yet
cs_xii_ms_pb2_set1
8 pages
Term II Practical List CS
No ratings yet
Term II Practical List CS
9 pages
Info Pract Xii Ms PB 1 Set 1
No ratings yet
Info Pract Xii Ms PB 1 Set 1
4 pages
Interview Qs - Batch 34
No ratings yet
Interview Qs - Batch 34
5 pages
MS achs
No ratings yet
MS achs
12 pages
Sample Questions
No ratings yet
Sample Questions
3 pages
ms_csxii_pb1_set3
No ratings yet
ms_csxii_pb1_set3
7 pages
Learn Next.js_ Next.js Server Components Cheatsheet _ Codecademy
No ratings yet
Learn Next.js_ Next.js Server Components Cheatsheet _ Codecademy
6 pages
Algorithms_ Asymptotic Notation Cheatsheet _ Codecademy
No ratings yet
Algorithms_ Asymptotic Notation Cheatsheet _ Codecademy
4 pages
Detection and Classification of Indian Classical Bharathanatyam Mudras Using Enhanced Deep Learning Technique
No ratings yet
Detection and Classification of Indian Classical Bharathanatyam Mudras Using Enhanced Deep Learning Technique
6 pages
Google Cloud Platform for Data Engineering: From Beginner to Data Engineer using Google Cloud Platform
From Everand
Google Cloud Platform for Data Engineering: From Beginner to Data Engineer using Google Cloud Platform
alasdair gilchrist
5/5 (1)
Apache Cassandra Administrator Associate - Exam Practice Tests
From Everand
Apache Cassandra Administrator Associate - Exam Practice Tests
Cristian Scutaru
No ratings yet

Lab_Exam 2021BCS0021

Uploaded by

Lab_Exam 2021BCS0021

Uploaded by

Final Lab Exam Big Data and Scalable Computing

Date : 07-11-2024 Marks: 15 (8M Written + 7M Execution)

Name : Vikas Kushwaha

Task 1: Perform Join operation on PIG with given files (3M)

id, name, age, city, amount

orders.txt order_id, date,

cust_id, amount 102,2009-10-08

Outer join (Left, Right, Full)

id, firstname, lastname, age, post, jobid

id, mobileno, mail, age, city, jobid

You might also like