Hvad er nærhed i data mining?
Hvad er nærhed i data mining?

Video: Hvad er nærhed i data mining?

Video: Hvad er nærhed i data mining?
Video: Proximity Measures - 1 | Introduction, Easy Explanation | Data Mining 2024, November
Anonim

Nærhed foranstaltninger refererer til målene for lighed og ulighed. Lighed og Ulighed er vigtige, fordi de bruges af en række data mining teknikker, såsom klyngedannelse, klassificering af nærmeste nabo og detektion af anomalier.

I forhold til dette, hvad er en nærhedsmåling?

Nærhedsforanstaltninger karakterisere den lighed eller ulighed, der eksisterer mellem de objekter, genstande, stimuli eller personer, der ligger til grund for en empirisk undersøgelse.

Udover ovenstående, hvordan finder du nærheden af en matrix? Afstandsmatrix

  1. Nærheden mellem objekter kan måles som afstandsmatrix.
  2. For eksempel beregnes afstanden mellem objekt A = (1, 1) og B = (1,5, 1,5) som.
  3. Et andet eksempel på afstand mellem objekt D = (3, 4) og F = (3, 3,5) beregnes som.

Bare så, hvad er lighed og ulighed i data mining?

Lighed og ulighed er de næste data mining begreber vi vil diskutere. Lighed er et numerisk mål for, hvor ens to data objekter er, og ulighed er et numerisk mål for, hvor forskellige to data objekter er.

Hvad er ulighedsmatrix?

Det Ulighedsmatrix er en matrix der udtrykker ligheden par til par mellem to sæt. Den er firkantet og symmetrisk. De diagonale elementer er defineret som nul, hvilket betyder, at nul er målet for ulighed mellem et element og sig selv.

Anbefalede: