100% found this document useful (1 vote)

6K views

Pro Apache Hadoop 2nd Edition

This book covers building and administering Hadoop clusters to analyze large volumes of data using MapReduce. It teaches how to break large problems into smaller parallelized chunks and how Hadoop distributes software across nodes. The book contains 17 chapters that cover Hadoop concepts, installation, administration, MapReduce development, testing, monitoring, data warehousing, Pig, HCatalog, log analysis with HBase, data science, cloud deployment, and building YARN applications. Readers will learn how to build resilient Hadoop clusters, optimize tasks, implement proven patterns, and scale out using HDFS Federations to analyze data in short times.

Uploaded by

Dreamtech Press

Available Formats

Download as PDF, TXT or read online on Scribd

100% found this document useful (1 vote)

6K views

Pro Apache Hadoop 2nd Edition

Uploaded by

Dreamtech Press

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

PRO APACHE HADOOP

IInd Edition

ABOUT THE BOOK

This book covers everything you need to build your first Hadoop cluster and begin analyzing and deriving value from your business
and scientific data. Learn to solve big-data problems the MapReduce way, by breaking a big problem into chunks and creating smallscale solutions that can be flung across thousands upon thousands of nodes to analyze large data volumes in a short amount of wallclock time. Learn how to let Hadoop take care of distributing and parallelizing your softwareyou just focus on the code; Hadoop
takes care of the rest.

TABLE OF CONTENTS

`699

1. Motivation for Big Data

2. Hadoop Concepts
3. Getting Started with the Hadoop Framework
4. Hadoop Administration
5. Basics of MapReduce Development
6. Advanced MapReduce Development
7. Hadoop Input Output
8. Testing Hadoop Programs
9. Monitoring Hadoop
10. Data Warehousing using Hadoop
11. Data Processing using Pig
12. HCatalog and Hadoop in the Enterprise
13. Log Analysis using Hadoop
14. Building Real-Time Systems using HBase
15. Data Science With Hadoop
16. Hadoop in the Cloud
17. Building a YARN Application

ISBN: 9788132232438 | Pages: 444 | Authors: Wadkar, Siddalingaiah, Venner

WHAT YOULL LEARN

Build a resilient and scalable Hadoop compute cluster.

Analyze large volumes of data in amazingly short time.

Optimize Hadoop tasks like a seasoned professional.

Implement bulletproof patterns that are proven successful.

Scale out using the new HDFS Federations feature set.

Chunk large problems into highly-parallel, MapReduce modules

Published by:

/dtechpress

DREAMTECH PRESS
19-A, Ansari Road, Daryaganj
New Delhi-110 002, INDIA
Tel: +91-11-2324 3463-73, Fax: +91-11-2324 3078
Email: [email protected]
Website: www.dreamtechpress.com

/dtechpress

Exclusively
Distributed by:

/dreamtechpress

WILEY INDIA PVT. LTD.

4435-36/7, Ansari Road, Daryaganj
New Delhi-110 002, INDIA
Tel: +91-11-4363 0000, Fax: +91-11-2327 5895
Email: [email protected]
Website: www.wileyindia.com
dreamtechpress.wordpress.com

Big Data Black Book
16% (25)
Big Data Black Book
2 pages
IC Validator User Guide: Version K-2015.06, June 2015
100% (1)
IC Validator User Guide: Version K-2015.06, June 2015
15 pages
R in Action, Second Edition
0% (2)
R in Action, Second Edition
2 pages
Mergers & Acquisitions and Corporate Valuation
0% (1)
Mergers & Acquisitions and Corporate Valuation
2 pages
Building The Web of Things
No ratings yet
Building The Web of Things
2 pages
Sap ABAP
No ratings yet
Sap ABAP
1 page
Java 8 Programming Black Book
31% (36)
Java 8 Programming Black Book
2 pages
Mastering Big Data and Hadoop: From Basics to Expert Proficiency
From Everand
Mastering Big Data and Hadoop: From Basics to Expert Proficiency
William Smith
No ratings yet
Hadoop Blueprints
From Everand
Hadoop Blueprints
Anurag Shrivastava
No ratings yet
Hadoop Ecosystem for Big Data
From Everand
Hadoop Ecosystem for Big Data
Dr. Zemelak Goraga
No ratings yet
Professional Hadoop Solutions
From Everand
Professional Hadoop Solutions
Boris Lublinsky
4/5 (2)
Mastering Data Engineering: Advanced Techniques with Apache Hadoop and Hive
From Everand
Mastering Data Engineering: Advanced Techniques with Apache Hadoop and Hive
Peter Jones
No ratings yet
Microsoft Big Data Solutions
From Everand
Microsoft Big Data Solutions
Adam Jorgensen
No ratings yet
Learning Cascading
From Everand
Learning Cascading
Michael Covert
No ratings yet
Hadoop in Action
No ratings yet
Hadoop in Action
1 page
Exploring Hadoop Ecosystem (Volume 1): Batch Processing
From Everand
Exploring Hadoop Ecosystem (Volume 1): Batch Processing
Wei Liu
No ratings yet
Hands-On Machine Learning Recommender Systems with Apache Spark
From Everand
Hands-On Machine Learning Recommender Systems with Apache Spark
Ernesto Lee
No ratings yet
Apache Hive Handbook: Query, Analyze, and Optimize Big Data
From Everand
Apache Hive Handbook: Query, Analyze, and Optimize Big Data
Robert Johnson
No ratings yet
Hadoop Admin Download Syllabus PDF
No ratings yet
Hadoop Admin Download Syllabus PDF
4 pages
PySpark Essentials: A Practical Guide to Distributed Computing
From Everand
PySpark Essentials: A Practical Guide to Distributed Computing
Robert Johnson
No ratings yet
HDInsight Essentials - Second Edition
From Everand
HDInsight Essentials - Second Edition
Rajesh Nadipalli
No ratings yet
Big Data Analytics
From Everand
Big Data Analytics
Venkat Ankam
No ratings yet
Programming MapReduce with Scalding
From Everand
Programming MapReduce with Scalding
Antonios Chalkiopoulos
No ratings yet
Seminar Report On Bigdata and Hadoop
No ratings yet
Seminar Report On Bigdata and Hadoop
4 pages
Cassandra High Availability
From Everand
Cassandra High Availability
Robbie Strickland
4.5/5 (4)
BDA Lab ManuaL[1]
No ratings yet
BDA Lab ManuaL[1]
83 pages
Deep Learning with Hadoop
From Everand
Deep Learning with Hadoop
Dipayan Dev
No ratings yet
Hadoop For Dummies
From Everand
Hadoop For Dummies
Dirk deRoos
3/5 (2)
Big Data Analysis 3170722 Lab Manual
No ratings yet
Big Data Analysis 3170722 Lab Manual
68 pages
bda2
No ratings yet
bda2
25 pages
Get Hadoop Essentials Delve into the Key Concepts of Hadoop and Get a Thorough Understanding of the Hadoop Ecosystem 1st Edition Shiva Achari PDF ebook with Full Chapters Now
100% (1)
Get Hadoop Essentials Delve into the Key Concepts of Hadoop and Get a Thorough Understanding of the Hadoop Ecosystem 1st Edition Shiva Achari PDF ebook with Full Chapters Now
67 pages
Real-Time Big Data Analytics: Emerging Trends
From Everand
Real-Time Big Data Analytics: Emerging Trends
Trilokesh Khatri
No ratings yet
Bigdata Lab
No ratings yet
Bigdata Lab
55 pages
Parallel Python with Dask: Perform distributed computing, concurrent programming and manage large dataset
From Everand
Parallel Python with Dask: Perform distributed computing, concurrent programming and manage large dataset
Tim Peters
No ratings yet
Parallel Python with Dask
From Everand
Parallel Python with Dask
Tim Peters
No ratings yet
Mastering Apache Hudi: Building Real-Time Data Lakes
From Everand
Mastering Apache Hudi: Building Real-Time Data Lakes
Robert Johnson
No ratings yet
Adm Final Word
No ratings yet
Adm Final Word
20 pages
DynamoDB Applied Design Patterns
From Everand
DynamoDB Applied Design Patterns
Uchit Vyas
3/5 (1)
Hadoop Essentials Delve into the Key Concepts of Hadoop and Get a Thorough Understanding of the Hadoop Ecosystem 1st Edition Shiva Achari - Download the ebook now for an unlimited reading experience
100% (2)
Hadoop Essentials Delve into the Key Concepts of Hadoop and Get a Thorough Understanding of the Hadoop Ecosystem 1st Edition Shiva Achari - Download the ebook now for an unlimited reading experience
47 pages
Hadoop Course Content
No ratings yet
Hadoop Course Content
3 pages
Mastering Apache Iceberg: Managing Big Data in a Modern Data Lake
From Everand
Mastering Apache Iceberg: Managing Big Data in a Modern Data Lake
Robert Johnson
No ratings yet
An Introduction To Hadoop Presentation PDF
100% (1)
An Introduction To Hadoop Presentation PDF
91 pages
DBA's Guide to NoSQL
From Everand
DBA's Guide to NoSQL
The Enlightened DBA
5/5 (1)
Big Data and Hadoop Developer
No ratings yet
Big Data and Hadoop Developer
7 pages
OpenStack Sahara Essentials
From Everand
OpenStack Sahara Essentials
Omar Khedher
No ratings yet
Hadoop Beginner's Guide
From Everand
Hadoop Beginner's Guide
Garry Turkington
4/5 (7)
Cloudera Lab Preparation
No ratings yet
Cloudera Lab Preparation
3 pages
11 Lecture
No ratings yet
11 Lecture
22 pages
Basic Drupal: How to create, administer and maintain a Drupal Site
From Everand
Basic Drupal: How to create, administer and maintain a Drupal Site
Timi Ogunjobi
No ratings yet
Mastering Pandas in Python: Course Book
From Everand
Mastering Pandas in Python: Course Book
Pedro Martins
No ratings yet
MLOps with Red Hat OpenShift: A cloud-native approach to machine learning operations
From Everand
MLOps with Red Hat OpenShift: A cloud-native approach to machine learning operations
Ross Brigoli
No ratings yet
Technical Seminar Report Apache Hadoop: 1AP06CS042
No ratings yet
Technical Seminar Report Apache Hadoop: 1AP06CS042
13 pages
CMT 428 Ethical Hacking Essay Assignment
No ratings yet
CMT 428 Ethical Hacking Essay Assignment
2 pages
Mastering Hadoop
From Everand
Mastering Hadoop
Sandeep Karanth
No ratings yet
Big Data Lab Manual and Syllabus
No ratings yet
Big Data Lab Manual and Syllabus
71 pages
Hadoop Apache
No ratings yet
Hadoop Apache
13 pages
Hadoop Essentials
From Everand
Hadoop Essentials
Shiva Achari
5/5 (2)
ADM Hadoop
No ratings yet
ADM Hadoop
25 pages
Cloudera Developer Training For Apache Hadoop
No ratings yet
Cloudera Developer Training For Apache Hadoop
3 pages
Learning Hadoop 2
From Everand
Learning Hadoop 2
Garry Turkington
4/5 (1)
DS&BDA
No ratings yet
DS&BDA
118 pages
Getting Started with RethinkDB: Absorb the knowledge required to utilize, manage, and deploy
From Everand
Getting Started with RethinkDB: Absorb the knowledge required to utilize, manage, and deploy
Gianluca Tiepolo
No ratings yet
Apache Hadoop
No ratings yet
Apache Hadoop
27 pages
Cloudera Developer Training For Apache Hadoop v2
No ratings yet
Cloudera Developer Training For Apache Hadoop v2
3 pages
Apache Hadoop: A Guide For Cluster Configuration & Testing
No ratings yet
Apache Hadoop: A Guide For Cluster Configuration & Testing
6 pages
Big Data Journal
No ratings yet
Big Data Journal
50 pages
Hadoop Development Download Syllabus PDF
No ratings yet
Hadoop Development Download Syllabus PDF
5 pages
J2EE 1.7 Projects Black Book
0% (3)
J2EE 1.7 Projects Black Book
2 pages
Introducing Data Science
50% (6)
Introducing Data Science
2 pages
Object Oriented Programming Using Java
0% (1)
Object Oriented Programming Using Java
2 pages
Getting Mean With Mongo, Express, Angular, and Node
No ratings yet
Getting Mean With Mongo, Express, Angular, and Node
2 pages
Research Analytics
25% (4)
Research Analytics
2 pages
Wireless Technology (Includes Practicals)
0% (1)
Wireless Technology (Includes Practicals)
2 pages
System Programming
25% (4)
System Programming
2 pages
Cloud Computing
No ratings yet
Cloud Computing
2 pages
Software Project Management (Includes Practicals)
No ratings yet
Software Project Management (Includes Practicals)
2 pages
Practical Business Analytics Using SAS A Hands-On Guide
No ratings yet
Practical Business Analytics Using SAS A Hands-On Guide
1 page
Pro Angular JS (Apress)
No ratings yet
Pro Angular JS (Apress)
1 page
Ruby Programming
No ratings yet
Ruby Programming
2 pages
Learning With Python
No ratings yet
Learning With Python
2 pages
Financial Derivatives
No ratings yet
Financial Derivatives
2 pages
Groovy in Action, Second Edition
No ratings yet
Groovy in Action, Second Edition
2 pages
Learning Bentley STAAD Pro V8i For Structural Analysis
42% (12)
Learning Bentley STAAD Pro V8i For Structural Analysis
2 pages
PRO/Engineer PTC Creo Parametric 3.0
33% (9)
PRO/Engineer PTC Creo Parametric 3.0
2 pages
Spring in Action Fourth Edition
0% (4)
Spring in Action Fourth Edition
2 pages
Big Data
0% (1)
Big Data
2 pages
Storm Applied
No ratings yet
Storm Applied
2 pages
Object Oriented Programming With C++
No ratings yet
Object Oriented Programming With C++
2 pages
Operating System
No ratings yet
Operating System
2 pages
Node - Js in Practice
No ratings yet
Node - Js in Practice
2 pages
Rom Theme Park To Resort: Customer Information Management at Port Aventura
No ratings yet
Rom Theme Park To Resort: Customer Information Management at Port Aventura
9 pages
Readme en
No ratings yet
Readme en
6 pages
Session 14
No ratings yet
Session 14
95 pages
USB-ITPAK User's Manual (English)
No ratings yet
USB-ITPAK User's Manual (English)
272 pages
Congestion Control Techniques
100% (1)
Congestion Control Techniques
22 pages
Eric Herrmann Resume
No ratings yet
Eric Herrmann Resume
1 page
Vue Js Upload
No ratings yet
Vue Js Upload
48 pages
GDST1 0TechnicalImplementationGuidancefinal
No ratings yet
GDST1 0TechnicalImplementationGuidancefinal
30 pages
Case Analysis: The Paradoxical Twins: Acme and Omega Electronics
No ratings yet
Case Analysis: The Paradoxical Twins: Acme and Omega Electronics
2 pages
Mid Semester Model Answer
No ratings yet
Mid Semester Model Answer
6 pages
View Notices and Demand Orders
No ratings yet
View Notices and Demand Orders
41 pages
The Unified Process in Software Development
No ratings yet
The Unified Process in Software Development
4 pages
Nweke Vitus Okechukwu Year4 IT
No ratings yet
Nweke Vitus Okechukwu Year4 IT
26 pages
The Ultimate Guide To IBM Certified Solution Architect - Spectrum Storage V2
No ratings yet
The Ultimate Guide To IBM Certified Solution Architect - Spectrum Storage V2
3 pages
Ktu Soex Ii 4033 2017
No ratings yet
Ktu Soex Ii 4033 2017
12 pages
Project Multiple Listing Service (MLS) - Real Estate Industry
No ratings yet
Project Multiple Listing Service (MLS) - Real Estate Industry
2 pages
SAP IDOC Information
No ratings yet
SAP IDOC Information
23 pages
Multiple-Level Arrays and Tables: Objectives
No ratings yet
Multiple-Level Arrays and Tables: Objectives
39 pages
HowTo 85 Integrating Aruba Networks
No ratings yet
HowTo 85 Integrating Aruba Networks
25 pages
F MC-16F MB90220 Series: 16-Bit Proprietary Microcontroller
No ratings yet
F MC-16F MB90220 Series: 16-Bit Proprietary Microcontroller
105 pages
Ta1360Afg: Ycbcr/Ypbpr Signal and Sync Processor For Digital TV, Progressive Scan TV and Double Scan TV
No ratings yet
Ta1360Afg: Ycbcr/Ypbpr Signal and Sync Processor For Digital TV, Progressive Scan TV and Double Scan TV
110 pages
ISO27001 Compliance With Netwrix
No ratings yet
ISO27001 Compliance With Netwrix
27 pages
Exam AI-900: Microsoft Azure AI Fundamentals - Skills Measured
No ratings yet
Exam AI-900: Microsoft Azure AI Fundamentals - Skills Measured
6 pages
Kyte HR
No ratings yet
Kyte HR
10 pages
API Management: An Architect's Guide to Developing and Managing APIs for Your Organization 2nd Edition Brajesh De - Download the ebook now for full and detailed access
100% (1)
API Management: An Architect's Guide to Developing and Managing APIs for Your Organization 2nd Edition Brajesh De - Download the ebook now for full and detailed access
67 pages
Settingsprovider
No ratings yet
Settingsprovider
2 pages
CS472 Principles of Information Security - Image.marked
No ratings yet
CS472 Principles of Information Security - Image.marked
2 pages
M.Tech Syllabu 2007 2008
No ratings yet
M.Tech Syllabu 2007 2008
8 pages
R12 OM Test Script Oracle EBS ERP
No ratings yet
R12 OM Test Script Oracle EBS ERP
19 pages

Pro Apache Hadoop 2nd Edition

Uploaded by

Pro Apache Hadoop 2nd Edition

Uploaded by

PRO APACHE HADOOP

ABOUT THE BOOK

1. Motivation for Big Data

ISBN: 9788132232438 | Pages: 444 | Authors: Wadkar, Siddalingaiah, Venner

WHAT YOULL LEARN

Build a resilient and scalable Hadoop compute cluster.

Analyze large volumes of data in amazingly short time.

Optimize Hadoop tasks like a seasoned professional.

Implement bulletproof patterns that are proven successful.

Scale out using the new HDFS Federations feature set.

Chunk large problems into highly-parallel, MapReduce modules

WILEY INDIA PVT. LTD.

You might also like