Hvad er AWS MapReduce?
Hvad er AWS MapReduce?

Video: Hvad er AWS MapReduce?

Video: Hvad er AWS MapReduce?
Video: Кеннет Кукьер: Большие данные — лучшие данные 2024, November
Anonim

Amazon elastik KortReducer (EMR) er en Amazon Web Services ( AWS ) værktøj til behandling og analyse af big data. Amazon EMR behandler big data på tværs af en Hadoop-klynge af virtuelle servere på Amazon Elastic Compute Cloud (EC2) og Amazon Simple Storage Service (S3).

Hvordan fungerer AWS EMR på denne måde?

Tjenesten starter et kundespecificeret antal Amazon EC2-instanser, der består af en master og flere andre noder. Amazon EMR kører Hadoop-software på disse forekomster. Masterknudepunktet opdeler inputdata i blokke og distribuerer behandlingen af blokkene til de andre knudepunkter.

Udover ovenstående, hvad er forskellen mellem ec2 og EMR? I modsætning til EMR , EC2 kategoriserer ikke slaveknuder i kerne- og opgavenoder. Dette øger risikoen for at miste HDFS-data i tilfælde af at en node fjernes/taber sig. EC2 bruger Apache-biblioteker (s3a) til at få adgang til data på s3. På den anden side, EMR bruger AWS proprietær kode for at få hurtigere adgang til s3.

Er AWS EMR desuden fuldt styret?

Amazon Elastic MapReduce ( EMR ) er en fuldt styret Hadoop og Spark platform fra Amazon Webtjeneste ( AWS ). Med EMR , AWS kunder kan hurtigt oprette multi-node Hadoop-klynger for at behandle big data-arbejdsbelastninger.

Bruger AWS Hadoop?

Amazon Webtjenester bruger open source Apache Hadoop distribueret computerteknologi for at gøre det nemmere at få adgang til store mængder computerkraft til at køre datatunge opgaver. Hadoop , open source-versionen af Googles MapReduce, bliver allerede brugt af virksomheder som Yahoo og Facebook.

Anbefalede: