Indholdsfortegnelse:

Hvad er en multivariat outlier?
Hvad er en multivariat outlier?

Video: Hvad er en multivariat outlier?

Video: Hvad er en multivariat outlier?
Video: Identifying Multivariate Outliers with Mahalanobis Distance in SPSS 2024, November
Anonim

EN multivariat udligger er en kombination af usædvanlige scores på mindst to variable. Begge typer afvigere kan påvirke resultatet af statistiske analyser. Outliers eksisterer af fire grunde. Forkert dataindtastning kan få data til at indeholde ekstreme tilfælde.

På samme måde bliver det spurgt, hvordan identificerer man bivariate outliers?

En måde at tjekke hvis disse er sådanne" bivariate outliers " er at undersøge resterne af sagerne i analysen. For at gøre dette får vi bivariat regressionsformlen, anvende den tilbage på hvert tilfælde for at opnå y', og derefter beregne residualet som y-y'. Faktisk vil SPSS gøre dette for os inden for en regressionskørsel.

Man kan også spørge, hvad er forskellen mellem multivariat og univariat? Univariat og multivariat repræsentere to tilgange til statistisk analyse. Univariat involverer analyse af en enkelt variabel mens multivariat analyse undersøger to eller flere variable. Mest multivariat analyse involverer en afhængig variabel og flere uafhængige variable.

Når man tager dette i betragtning, hvad er de forskellige typer af udlignere?

De tre forskellige typer af outliers

  • Type 1: Global Outliers (også kaldet "Punktanomalier"):
  • Global anomali:
  • Type 2: Kontekstuelle (betingede) outliers:
  • Kontekstuel anomali: Værdier er ikke uden for det normale globale interval, men er unormale sammenlignet med sæsonmønsteret.
  • Type 3: Kollektive outliers:

Hvordan identificerer du multivariate outliers?

Multivariate outliers kan identificeres med brugen af Mahalanobis distance, som er afstanden af et datapunkt fra det beregnede tyngdepunkt i de andre tilfælde, hvor tyngdepunktet beregnes som skæringspunktet mellem middelværdien af de variable, der vurderes.

Anbefalede: