Hvilken type clustering kunne håndtere big data?
Hvilken type clustering kunne håndtere big data?

Video: Hvilken type clustering kunne håndtere big data?

Video: Hvilken type clustering kunne håndtere big data?
Video: 30 глупых вопросов Data Engineer [Карьера в IT] 2024, November
Anonim

Hierarkisk klyngedannelse kan ikke håndtere big data godt men K Betyder klyngedannelse kan. Dette skyldes, at tidskompleksiteten af K Means er lineær, dvs. O(n), mens den for hierarkisk klyngedannelse er kvadratisk, dvs. O(n2).

Hvad er clustering i big data med hensyn til dette?

Klynger er en maskinlæringsteknik, der involverer gruppering af data point. Givet et sæt af data point, kan vi bruge en klyngedannelse algoritme til at klassificere hver data pege ind i en bestemt gruppe.

På samme måde, hvad er klyngedannelse og dens typer? Klynger metoder bruges til at identificere grupper af lignende objekter i et multivariat datasæt indsamlet fra områder som marketing, biomedicinsk og geo-spatial. De er forskellige typer af klyngedannelse metoder, herunder: Partitioneringsmetoder. Hierarkisk klyngedannelse . Modelbaseret klyngedannelse.

Også at vide, hvilken slags klyngealgoritme er bedre til meget store datasæt?

K-midler som er en af de mest brugte klyngedannelse metoder og K-midler baseret på MapReduce betragtes som en avanceret løsning til meget store datasætklynger . Eksekveringstiden er dog stadig en hindring på grund af det stigende antal iterationer, når der er en stigning på datasæt størrelse og antal af klynger.

Hvad bruges clustering til?

Klynger er en metode til uovervåget læring og er en almindelig teknik til statistisk dataanalyse brugt i mange felter. I Data Science kan vi bruge klyngedannelse analyse for at få værdifuld indsigt fra vores data ved at se, hvilke grupper datapunkterne falder ind under, når vi anvender en klyngedannelse algoritme.

Anbefalede: