Hvad er DistCp i Hadoop?
Hvad er DistCp i Hadoop?

Video: Hvad er DistCp i Hadoop?

Video: Hvad er DistCp i Hadoop?
Video: Hadoop Day to Day Operations - Distcp - Data back ups and migration 2024, November
Anonim

DistCp (distribueret kopi) er et værktøj, der bruges til stor inter/intra-cluster kopiering. Det bruger KortReducer til at udføre dets distribution, fejlhåndtering og retablering og rapportering. Den udvider en liste over filer og mapper til input til kortopgaver, som hver vil kopiere en partition af filerne angivet i kildelisten.

På samme måde kan man spørge, om Distcp overskriver?

Jeg bør også uddybe nogle og forklare det discp - overskrive vilje overskrive filen, uanset om størrelsen matcher eller ej. Dette vil opdatere alle filer i hdfs-nn2, der ikke matcher i størrelse fra hdfs-nn1, samt slette eventuelle uvedkommende filer.

På samme måde, hvad er Hadoop FS-kommando? Filsystemet ( FS ) skal omfatter forskellige skal-lignende kommandoer der direkte interagerer med Hadoop Distribueret filsystem ( HDFS ) samt andre filsystemer, der Hadoop understøtter, såsom Local FS , HFTP FS , S3 FS , og andre.

Hvordan overfører jeg data fra en HDFs til en anden HDFs på denne måde?

Hadoop fs cp – nemmest måde at kopiere data fra en kildemappe til en anden . Brug hadoop fs -cp [kilde] [destination]. Hadoop fs copyFromLocal – Skal kopiere data fra det lokale filsystem til HDFS ? Brug hadoop fs -copyFromLocal [kilde] [destination].

Hvordan kopierer jeg en klynge fra en klynge til en anden?

Kopiering af filer mellem klynger . Du kan kopiere filer eller mapper mellem forskellige klynger ved at bruge kommandoen hadoop distcp. Du skal inkludere legitimationsoplysninger fil i din kopi anmode så kilden klynge kan validere, at du er godkendt til kilden klynge og målet klynge.

Anbefalede: