Er spark SQL en database?
Er spark SQL en database?

Video: Er spark SQL en database?

Video: Er spark SQL en database?
Video: Spark SQL Beyond Official Documentation 2024, April
Anonim

Spark SQL giver dig mulighed for at bruge datarammer i Python, Java og Scala; læse og skrive data i en række strukturerede formater; og forespørge Big Data med SQL . Det giver en DataFrame abstraktion i Python, Java og Scala for at forenkle arbejdet med strukturerede datasæt. DataFrames ligner tabeller i en relationel database.

I betragtning af dette, er spark en database?

Gnist bruges ofte med distribuerede datalagre såsom MapR XD, Hadoops HDFS og Amazons S3, med populære NoSQL databaser såsom MapR Database , Apache HBase, Apache Cassandra og MongoDB, og med distribuerede beskedbutikker som MapR Event Store og Apache Kafka.

hvilken database bruger spark? MongoDB

Hvad er derfor spark SQL?

Spark SQL er en Gnist modul til struktureret databehandling. Det giver en programmeringsabstraktion kaldet DataFrames og kan også fungere som en distribueret SQL forespørgselsmotor. Det gør det muligt for umodificerede Hadoop Hive-forespørgsler at køre op til 100 gange hurtigere på eksisterende implementeringer og data.

Er spark SQL ANSI kompatibel?

Fra Gnist 2.0, Gnist er ANSI SQL :2003 kompatibel , hvilket betyder Spark SQL bakker op SQL operationer, der ikke er tilgængelige på andre dialekter.

Anbefalede: