Hvordan beregnes K-middelværdier?
Hvordan beregnes K-middelværdier?

Video: Hvordan beregnes K-middelværdier?

Video: Hvordan beregnes K-middelværdier?
Video: K-Mean Clustering 2024, December
Anonim

K - Midler Klynger

Vælg k punkter tilfældigt som klyngecentre. Tildel objekter til deres nærmeste klyngecenter i henhold til den euklidiske afstandsfunktion. Beregn tyngdepunktet eller betyde af alle objekter i hver klynge. Gentag trin 2, 3 og 4, indtil de samme point er tildelt hver klynge i på hinanden følgende runder.

Heraf, hvad betyder K i K?

K - midler clustering er en af de enkleste og populære uovervågede maskinlæringsalgoritmer. Med andre ord K - midler algoritmen identificerer k antal tyngdepunkter, og allokerer derefter hvert datapunkt til den nærmeste klynge, mens tyngdepunkterne holdes så små som muligt.

Betyder også en måde at finde K-værdien for K klynge på? Som udgangspunkt er der ikke sådan noget metode som præcist kan bestemme værdi af k . Der er forskellige teknikker, som følges for at få det nøjagtige værdi af k . Det betyde afstanden mellem datapunktet og klynge er en meget vigtig faktor som kan bestemme værdi af k og dette metode er almindeligt at sammenligne.

Simpelthen, hvordan betyder K, at algoritmen fungerer?

Det k - betyder klyngealgoritme forsøger at opdele et givet anonymt datasæt (et sæt, der ikke indeholder information om klasseidentitet) i et fast nummer ( k ) af klynger. I første omgang k antallet af såkaldte centroider er valgt. Hvert tyngdepunkt indstilles derefter til aritmetikken betyde af den klynge, den definerer.

Hvorfor betyder K?

Det K - midler klyngealgoritme bruges til at finde grupper, der ikke er eksplicit mærket i dataene. Dette kan bruges til at bekræfte forretningsantagelser om, hvilke typer grupper der findes, eller til at identificere ukendte grupper i komplekse datasæt.

Anbefalede: