Er show en handling i gnist?
Er show en handling i gnist?
Anonim

2 svar. at vise er virkelig en handling , men den er smart nok til at vide, hvornår den ikke skal køre alt. Hvis du havde en orderBy, ville det også tage meget lang tid, men i dette tilfælde er alle dine operationer kortoperationer, så der er ingen grund til at beregne hele slutbordet.

Bare så, er tælle en handling i gnist?

tælle () til tælle antallet af rækker. Da det starter DAG-udførelsen og returnerer dataene til driveren, er det en handling for RDD. Case 2: Hvis du ringer tælle på Dataframe starter den DAG-udførelsen og returnerer dataene til driveren, dens an handling til Dataframe.

På samme måde, hvad er handling og transformation i gnist? Gnist RDD operationer. To typer Apache Gnist RDD-operationer er- Transformationer og Handlinger . EN Transformation er en funktion, der producerer ny RDD fra de eksisterende RDD'er, men når vi vil arbejde med det faktiske datasæt, på det tidspunkt Handling udføres.

Tilsvarende, hvad er en handling i gnist?

Handlinger er RDD's drift, vender denne værdi tilbage til spar-driverprogrammerne, som starter et job, der skal udføres på en klynge. Transformationens output er et input af Handlinger . reducer, collect, takeSample, take, first, saveAsTextfile, saveAsSequenceFile, countByKey, foreach er almindelige handlinger i Apache gnist.

Hvad gør collect () i gnist?

indsamle (func) indsamle returnerer elementerne i datasættet som et array tilbage til driverprogrammet. indsamle bruges ofte i tidligere angivne eksempler som f.eks Gnist Transformationseksempler for at vise værdierne af afkastet. REPL, for eksempel, vil udskrive værdierne for arrayet tilbage til konsollen.

Anbefalede: