Indholdsfortegnelse:

Hvad er de vigtigste konfigurationsparametre, som brugeren skal angive for at køre MapReduce-job?
Hvad er de vigtigste konfigurationsparametre, som brugeren skal angive for at køre MapReduce-job?

Video: Hvad er de vigtigste konfigurationsparametre, som brugeren skal angive for at køre MapReduce-job?

Video: Hvad er de vigtigste konfigurationsparametre, som brugeren skal angive for at køre MapReduce-job?
Video: Run a MapReduce job 2024, Kan
Anonim

De vigtigste konfigurationsparametre, som brugere skal angive i "MapReduce"-ramme, er:

  • Jobs inputplaceringer i det distribuerede filsystem.
  • Jobs outputplacering i det distribuerede filsystem.
  • Input format af data.
  • Outputformat af data.
  • Klasse indeholdende kortfunktionen.
  • Klasse, der indeholder reducere-funktionen.

Heri, hvad er de vigtigste konfigurationsparametre i et MapReduce-program?

De vigtigste konfigurationsparametre i "MapReduce" rammen er:

  • Indtast placering af job i det distribuerede filsystem.
  • Outputplacering af job i det distribuerede filsystem.
  • Indtastningsformatet for data.
  • Outputformatet af data.
  • Klassen som indeholder kortfunktionen.
  • Klassen, der indeholder reduceringsfunktionen.

Man kan også spørge, hvad er parametrene for kortlæggere og reducerere? De fire parametre for kortlæggere er:

  • Langskrivbar (input)
  • tekst (input)
  • tekst (mellemudgang)
  • IntWritable (mellemudgang)

Spørgsmålet er også, hvad er hovedkomponenterne i MapReduce-jobbet?

  • Hoveddriverklasse, som giver jobkonfigurationsparametre.
  • Mapper-klasse som skal udvide org. apache. hadoop. kortreducere. Mapper klasse og give implementering for kort () metode.
  • Reducer-klasse, som skal udvide org. apache. hadoop. kortreducere. Reducer klasse.

Hvad er partitioner, og hvordan hjælper det i MapReduce jobprocessen?

Skillevæg i KortReducer job execution styrer partitioneringen af nøglerne til de mellemliggende kortudgange. Med Hjælp af hash-funktion, nøgle (eller en delmængde af nøglen) udleder skillevæg . Registreringer som har samme nøgleværdi går ind i det samme skillevæg (inden for hver kortlægger).

Anbefalede: