To Count Using Map and Reduce Program: Wordcount - Java

This document describes a MapReduce program called WordCount that counts the frequency of words in a text document. The program uses a mapper class to tokenize the input text by whitespace and output each word paired with a count of 1. A reducer class sums the counts for each word key. The main method sets up the MapReduce job, specifying the mapper, reducer, input and output types and paths.

Uploaded by

Ramya Devi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views

To Count Using Map and Reduce Program: Wordcount - Java

Uploaded by

Ramya Devi

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOC, PDF, TXT or read online on Scribd

You are on page 1/ 2

1

TO COUNT USING MAP AND REDUCE

Program: WordCount.java
import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCount {

public static class TokenizerMapper

extends Mapper<Object, Text, Text, IntWritable>{

private final static IntWritable one = new IntWritable(1);

private Text word = new Text();

public void map(Object key, Text value, Context context

) throws IOException, InterruptedException {
StringTokenizer itr = new StringTokenizer(value.toString());
while (itr.hasMoreTokens()) {
word.set(itr.nextToken());
context.write(word, one);
}
}
}

public static class IntSumReducer

extends Reducer<Text,IntWritable,Text,IntWritable> {
private IntWritable result = new IntWritable();

public void reduce(Text key, Iterable<IntWritable> values,

Context context
) throws IOException, InterruptedException {
int sum = 0;
for (IntWritable val : values) {
sum += val.get();
}
result.set(sum);
context.write(key, result);
}
}

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();

Job job = Job.getInstance(conf, "word count");
job.setJarByClass(WordCount.class);
job.setMapperClass(TokenizerMapper.class);
job.setCombinerClass(IntSumReducer.class);
job.setReducerClass(IntSumReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
FileInputFormat.addInputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
System.exit(job.waitForCompletion(true) ? 0 : 1);
}
}

Word Count Program
No ratings yet
Word Count Program
2 pages
049
No ratings yet
049
2 pages
1WordCount
No ratings yet
1WordCount
2 pages
Hadoop WordCount
No ratings yet
Hadoop WordCount
2 pages
✅ PART 1- Install Java and Hadoop on Ubuntu
No ratings yet
✅ PART 1- Install Java and Hadoop on Ubuntu
4 pages
579 BDA Week-04
No ratings yet
579 BDA Week-04
1 page
Practical 3bcbs
No ratings yet
Practical 3bcbs
5 pages
Source Code for Wordcount
No ratings yet
Source Code for Wordcount
3 pages
Run Wordcount
No ratings yet
Run Wordcount
3 pages
Wordcount
No ratings yet
Wordcount
3 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
Word Count Program
No ratings yet
Word Count Program
3 pages
11. WordCountApp
No ratings yet
11. WordCountApp
2 pages
ContarPalabras Java
No ratings yet
ContarPalabras Java
2 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
5 pages
Exp 3-Word Count
No ratings yet
Exp 3-Word Count
4 pages
Experiment 6 BDA
No ratings yet
Experiment 6 BDA
4 pages
Codigo Haddop
No ratings yet
Codigo Haddop
3 pages
Experiment-4 BDA LAB
No ratings yet
Experiment-4 BDA LAB
7 pages
ExNo04
No ratings yet
ExNo04
4 pages
Ravikant_Hadoop_file
No ratings yet
Ravikant_Hadoop_file
22 pages
6 - Simple Wordcount
No ratings yet
6 - Simple Wordcount
2 pages
Practical 2c
No ratings yet
Practical 2c
2 pages
Map Reduce Java Program
No ratings yet
Map Reduce Java Program
2 pages
Part B Assignment - No - 1
No ratings yet
Part B Assignment - No - 1
6 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
Big Data Practical 2
No ratings yet
Big Data Practical 2
11 pages
BDC Output 3
No ratings yet
BDC Output 3
4 pages
ADA Lab Manual
No ratings yet
ADA Lab Manual
34 pages
WordCount Program Hadoop Task 2
No ratings yet
WordCount Program Hadoop Task 2
7 pages
Map Reduce Example
No ratings yet
Map Reduce Example
6 pages
02-Wordcount Mapreduce
No ratings yet
02-Wordcount Mapreduce
5 pages
BDA3
No ratings yet
BDA3
7 pages
Classcreation
No ratings yet
Classcreation
2 pages
Map Reduce
No ratings yet
Map Reduce
4 pages
Exp-11
No ratings yet
Exp-11
4 pages
BDA MapReduce Program (1)
No ratings yet
BDA MapReduce Program (1)
8 pages
Exp 4 Word Count
No ratings yet
Exp 4 Word Count
4 pages
wc
No ratings yet
wc
13 pages
Ravinder Big Data 4 PDF
No ratings yet
Ravinder Big Data 4 PDF
15 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
4 pages
CTBD Sol02
No ratings yet
CTBD Sol02
2 pages
Bdt Lab 6 22mis1067
No ratings yet
Bdt Lab 6 22mis1067
13 pages
BDA
No ratings yet
BDA
6 pages
Word Count
No ratings yet
Word Count
3 pages
Running Jar Program
No ratings yet
Running Jar Program
3 pages
3 MapReduce program ex code
No ratings yet
3 MapReduce program ex code
14 pages
Steps to create jar file and execute word count problem in mapper reducer
No ratings yet
Steps to create jar file and execute word count problem in mapper reducer
5 pages
Palak
No ratings yet
Palak
10 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Practical 2-1
No ratings yet
Practical 2-1
4 pages
Apache Spark Fundamentals: Getting Started
No ratings yet
Apache Spark Fundamentals: Getting Started
28 pages
Lab3_BigData-MapReduce
No ratings yet
Lab3_BigData-MapReduce
8 pages
Setting Up Eclipse:: Codelab 1 Introduction To The Hadoop Environment (Version 0.17.0)
No ratings yet
Setting Up Eclipse:: Codelab 1 Introduction To The Hadoop Environment (Version 0.17.0)
9 pages
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
No ratings yet
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
13 pages
DA Lab Program-2
No ratings yet
DA Lab Program-2
6 pages
Dsa Prac 5 19DCS038
No ratings yet
Dsa Prac 5 19DCS038
16 pages
Core Java Programming Book
From Everand
Core Java Programming Book
Manish Soni
No ratings yet
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
3/5 (4)