SemanticScuttle - klotz.me » Tags: java+hadoop

Tags: java* + hadoop*

0 bookmark(s) - Sort by: Date ↓ / Title /

Debugging MapReduce Programs With MRUnit | Apache Hadoop for the Enterprise | Cloudera

2012-06-05 Tags: api, debugging, hadoop, java, javadoc by klotz
GenericOptionsParser (Hadoop 0.20.1 API)

Put jars in your code, instead of using libjars. Your jar file gets pushed to every node. Keep your mapreduce code small; don't send large libraries because you run large VMs on nodes.

2012-06-05 Tags: api, hadoop, java, javadoc by klotz
Reporter (Hadoop 0.20.1 API)

Hook for logging and status. OK to use log4j or stdout/stderr and then read from jobtracker for each process.

2012-06-05 Tags: api, hadoop, java, javadoc by klotz
OutputCollector (Hadoop 0.20.1 API)

What mappers and reducers write to

2012-06-05 Tags: api, hadoop, java, javadoc by klotz
Mapper (Hadoop 0.20.1 API)

MapReduceBase, Mapper, Reducer.

2012-06-05 Tags: api, hadoop, java, javadoc by klotz
JobClient (Hadoop 0.20.1 API)

JobClient and JobConf are the Job Management interfaces. JobClient specifiesy main and args. JobConf sets memory, number of mappers, reducers, etc.

2012-06-05 Tags: api, hadoop, java, javadoc by klotz
TextInputFormat (Hadoop 0.20.1 API)

Use this for line-based input

2012-06-05 Tags: api, hadoop, java, javadoc by klotz
SequenceFile (Apache Hadoop Main 2.0.0-alpha API)

Sequence files allow for multiple files in one 64MB block

2012-06-05 Tags: api, hadoop, java, javadoc by klotz
BloomMapFile (Apache Hadoop Main 2.0.0-alpha API)

2012-06-05 Tags: api, bloom filter, hadoop, java, javadoc by klotz
Overview (Apache Hadoop Main 2.0.0-alpha API)

mapred is old but functional. mapreduce is future version.

2012-06-05 Tags: api, hadoop, java, javadoc by klotz

Top of the page

First / Previous / Next / Last / Page 2 of 0

About - Propulsed by SemanticScuttle

SemanticScuttle - klotz.me

Tags: java* + hadoop*

Linked Tags

Related Tags