Hvorfor er Hadoop billigere?
Hvorfor er Hadoop billigere?

Video: Hvorfor er Hadoop billigere?

Video: Hvorfor er Hadoop billigere?
Video: Кеннет Кукьер: Большие данные — лучшие данные 2024, April
Anonim

Hadoop er relativt billig

Omkostningerne pr. terabyte at implementere en Hadoop klynge er billigere end prisen pr. terabyte for at oprette et båndbackup-system. Indrømmet, en Hadoop systemet koster mere at betjene, fordi de diskdrev, der indeholder dataene, alle er online og strømforsynede, i modsætning til båndstationer.

Er Hadoop omkostningseffektiv på denne måde?

Hadoop tilbyder en skalerbar, koste - effektiv og yderst tilgængelig løsning til lagring og behandling af store data. Brugen af et ikke-proprietært fysisk lag reducerer i høj grad afhængigheden af teknologi. Det tilbyder også elastisk dimensioneringsevne, når det implementeres på virtuelle maskiner eller endda på IAAS-skyen.

Derudover, hvorfor er spark bedre end Hadoop? Apache Gnist – Gnist er et lynhurtigt cluster computing-værktøj. Apache Gnist kører applikationer op til 100x hurtigere i hukommelsen og 10x hurtigere på disken end Hadoop . På grund af reduktion af antallet af læse-/skrivecyklusser til disk og lagring af mellemliggende data i hukommelsen Gnist gør det muligt.

Hvor meget koster Hadoop i betragtning af dette?

For en virksomhedsklasse Hadoop klynge, anbefales en mellemklasse Intel-server. Disse typisk koste $4.000 til $6.000 pr. node med diskkapaciteter mellem 3TB og 6TB afhængigt af ønsket ydeevne. Dette betyder node koste er cirka $1.000 til $2.000 pr. TB. HDFS har ingen fysiske begrænsninger på filstørrelser.

Hvorfor er Hadoop hurtigere?

Grunden til, at Spark er hurtigere end Hadoop er, at Spark behandler alt i hukommelsen. Den kan også bruge disken til data, der ikke alle passer ind i hukommelsen.

Anbefalede: