Hvad er en datasø i Hadoop?
Hvad er en datasø i Hadoop?

Video: Hvad er en datasø i Hadoop?

Video: Hvad er en datasø i Hadoop?
Video: What is Data Lake | Understand the Data Lake Architecture | Data Lake using Apache Spark 2024, Kan
Anonim

EN Hadoop data sø er en data ledelsesplatform bestående af en eller flere Hadoop klynger. Det bruges primært til at behandle og opbevare ikke-relationelle data , såsom logfiler, internet clickstream-registreringer, sensor data , JSON-objekter, billeder og opslag på sociale medier.

I denne forbindelse, hvad er forskellen mellem et datavarehus og en datasø?

Datasøer og data varehuse er begge meget brugt til opbevaring af store data , men de er ikke udskiftelige udtryk. EN data sø er en stor pulje af rå data , hvis formål endnu ikke er defineret. EN data varehus er et lager for strukturerede, filtrerede data som allerede er blevet behandlet til et bestemt formål.

Derudover, hvad er en datasø-arkitektur? EN Data Lake er et lagerlager, der kan gemme store mængder af struktureret, semi-struktureret og ustruktureret data . I modsætning til et hierarkisk Dataware-hus, hvor data er gemt i filer og mappe, Data sø har en lejlighed arkitektur.

Hvad menes der med datasø i forhold til dette?

EN data sø er et lager, der rummer en stor mængde rå data i dets oprindelige format, indtil det er nødvendigt. Mens en hierarkisk data lagerbutikker data i filer eller mapper, en data sø bruger en flad arkitektur til at opbevare data . Begrebet data sø er ofte forbundet med Hadoop-orienteret objektlagring.

Er Elasticsearch en datasø?

EN data sø er simpelthen et sted at parkere din data indtil du har brug for det, og det kunne omfatte HDFS (mest almindeligt), objektlagring, NAS-bokse eller noget andet. Grundlæggende Elasticsearch er et værktøj til indeksering data , ikke til opbevaring af data sig selv.

Anbefalede: